Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / WinForms, .Net Framework [игнор отключен] [закрыт для гостей] / Получить HTML с сайта / 9 сообщений из 9, страница 1 из 1
27.02.2014, 17:15
    #38574491
lans
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить HTML с сайта
Можно ли как то получить HTML с сайта который отрисовывается js-ом. вот тут например
при прокрутки вниз подгружается контент iframe. Как бы его заполучить. Сам фрейм по ссылке тоже не открывается и при попытки загрузить его через WebClient возвращает пустую строку
...
Рейтинг: 0 / 0
27.02.2014, 20:07
    #38574683
VladM2
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить HTML с сайта
разве что грузить в webBrowser. я других вариантов не нашел. правда особо и не искал т.к. нужно было всеголишь 3 странички сграбить.
минусы webBrowser: долго, муторно, винформс, нужно ловить webBrowser1_DocumentCompleted, иногда скрипты еще и ошибками кидаютцо...
...
Рейтинг: 0 / 0
27.02.2014, 20:24
    #38574702
lans
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить HTML с сайта
VladM2,
в webBrowser1_DocumentCompleted вот такой контент ловится только. нет возможности как то отловить полную загрузку страницы?
<html><head></head><body></body></html>
...
Рейтинг: 0 / 0
27.02.2014, 20:42
    #38574711
lans
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить HTML с сайта
Я имею доступ только к исходному HTML а как бы получить тот который JS отрисовывает и подгружает frame
...
Рейтинг: 0 / 0
27.02.2014, 20:48
    #38574717
VladM2
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить HTML с сайта
там есть ProgressChanged ( ... ProgressChangedEventArgs e ... )
и сравнивать e.CurrentProgress e.MaximumProgress

как то так, по памяти пишу. помню что муторно было. одно дело пару страниц а другое каталог товаров ...

ps кстати доставал через DocumentStream (были траблы с webBrowser1 Document Encoding)
вспомнил что был абсолютно дикий невалидный хтмл , здорово выручила библиотека sgml тогда, она мне его в красивый xml, ну а там xpath в руки ...
...
Рейтинг: 0 / 0
27.02.2014, 20:51
    #38574720
VladM2
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить HTML с сайта
насчет фреймов не помню. разве нельзя "достать"?
сорри библиотека http://archive.msdn.microsoft.com/SgmlReader
...
Рейтинг: 0 / 0
01.03.2014, 01:34
    #38575857
lans
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить HTML с сайта
Спасибо. А может кто знает почему у меня в webBrowser1.DocumentText во первых не все теги попали да и ещё пол страницы нет как будто HTML откусан
гружу эту ссылку

http://www.interpark.com/product/ProductDetailImage.do?_method=detailNIP&sc.resizeYn=N&sc.prdNo=1019673620&sc.resizeYn=N&mid1=top&mid2=img_zoom&mid3=001
...
Рейтинг: 0 / 0
01.03.2014, 01:39
    #38575861
lans
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить HTML с сайта
Оказывается когда второй раз заходит в _DocumentCompleted то HTML полный.
...
Рейтинг: 0 / 0
01.03.2014, 18:53
    #38576104
VladM2
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить HTML с сайта
DocumentCompleted может и 10 раз выстрелить, я писал про ProgressChanged ...
...
Рейтинг: 0 / 0
Форумы / WinForms, .Net Framework [игнор отключен] [закрыт для гостей] / Получить HTML с сайта / 9 сообщений из 9, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]