powered by simpleCommunicator - 2.0.56     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / WinForms, .Net Framework [игнор отключен] [закрыт для гостей] / Получить HTML с сайта
9 сообщений из 9, страница 1 из 1
Получить HTML с сайта
    #38574491
Фотография lans
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Можно ли как то получить HTML с сайта который отрисовывается js-ом. вот тут например
при прокрутки вниз подгружается контент iframe. Как бы его заполучить. Сам фрейм по ссылке тоже не открывается и при попытки загрузить его через WebClient возвращает пустую строку
...
Рейтинг: 0 / 0
Получить HTML с сайта
    #38574683
VladM2
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
разве что грузить в webBrowser. я других вариантов не нашел. правда особо и не искал т.к. нужно было всеголишь 3 странички сграбить.
минусы webBrowser: долго, муторно, винформс, нужно ловить webBrowser1_DocumentCompleted, иногда скрипты еще и ошибками кидаютцо...
...
Рейтинг: 0 / 0
Получить HTML с сайта
    #38574702
Фотография lans
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
VladM2,
в webBrowser1_DocumentCompleted вот такой контент ловится только. нет возможности как то отловить полную загрузку страницы?
<html><head></head><body></body></html>
...
Рейтинг: 0 / 0
Получить HTML с сайта
    #38574711
Фотография lans
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Я имею доступ только к исходному HTML а как бы получить тот который JS отрисовывает и подгружает frame
...
Рейтинг: 0 / 0
Получить HTML с сайта
    #38574717
VladM2
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
там есть ProgressChanged ( ... ProgressChangedEventArgs e ... )
и сравнивать e.CurrentProgress e.MaximumProgress

как то так, по памяти пишу. помню что муторно было. одно дело пару страниц а другое каталог товаров ...

ps кстати доставал через DocumentStream (были траблы с webBrowser1 Document Encoding)
вспомнил что был абсолютно дикий невалидный хтмл , здорово выручила библиотека sgml тогда, она мне его в красивый xml, ну а там xpath в руки ...
...
Рейтинг: 0 / 0
Получить HTML с сайта
    #38574720
VladM2
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
насчет фреймов не помню. разве нельзя "достать"?
сорри библиотека http://archive.msdn.microsoft.com/SgmlReader
...
Рейтинг: 0 / 0
Получить HTML с сайта
    #38575857
Фотография lans
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Спасибо. А может кто знает почему у меня в webBrowser1.DocumentText во первых не все теги попали да и ещё пол страницы нет как будто HTML откусан
гружу эту ссылку

http://www.interpark.com/product/ProductDetailImage.do?_method=detailNIP&sc.resizeYn=N&sc.prdNo=1019673620&sc.resizeYn=N&mid1=top&mid2=img_zoom&mid3=001
...
Рейтинг: 0 / 0
Получить HTML с сайта
    #38575861
Фотография lans
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Оказывается когда второй раз заходит в _DocumentCompleted то HTML полный.
...
Рейтинг: 0 / 0
Получить HTML с сайта
    #38576104
VladM2
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
DocumentCompleted может и 10 раз выстрелить, я писал про ProgressChanged ...
...
Рейтинг: 0 / 0
9 сообщений из 9, страница 1 из 1
Форумы / WinForms, .Net Framework [игнор отключен] [закрыт для гостей] / Получить HTML с сайта
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]