|
Получить HTML с сайта
|
|||
---|---|---|---|
#18+
Можно ли как то получить HTML с сайта который отрисовывается js-ом. вот тут например при прокрутки вниз подгружается контент iframe. Как бы его заполучить. Сам фрейм по ссылке тоже не открывается и при попытки загрузить его через WebClient возвращает пустую строку ... |
|||
:
Нравится:
Не нравится:
|
|||
27.02.2014, 17:15 |
|
Получить HTML с сайта
|
|||
---|---|---|---|
#18+
разве что грузить в webBrowser. я других вариантов не нашел. правда особо и не искал т.к. нужно было всеголишь 3 странички сграбить. минусы webBrowser: долго, муторно, винформс, нужно ловить webBrowser1_DocumentCompleted, иногда скрипты еще и ошибками кидаютцо... ... |
|||
:
Нравится:
Не нравится:
|
|||
27.02.2014, 20:07 |
|
Получить HTML с сайта
|
|||
---|---|---|---|
#18+
VladM2, в webBrowser1_DocumentCompleted вот такой контент ловится только. нет возможности как то отловить полную загрузку страницы? <html><head></head><body></body></html> ... |
|||
:
Нравится:
Не нравится:
|
|||
27.02.2014, 20:24 |
|
Получить HTML с сайта
|
|||
---|---|---|---|
#18+
Я имею доступ только к исходному HTML а как бы получить тот который JS отрисовывает и подгружает frame ... |
|||
:
Нравится:
Не нравится:
|
|||
27.02.2014, 20:42 |
|
Получить HTML с сайта
|
|||
---|---|---|---|
#18+
там есть ProgressChanged ( ... ProgressChangedEventArgs e ... ) и сравнивать e.CurrentProgress e.MaximumProgress как то так, по памяти пишу. помню что муторно было. одно дело пару страниц а другое каталог товаров ... ps кстати доставал через DocumentStream (были траблы с webBrowser1 Document Encoding) вспомнил что был абсолютно дикий невалидный хтмл , здорово выручила библиотека sgml тогда, она мне его в красивый xml, ну а там xpath в руки ... ... |
|||
:
Нравится:
Не нравится:
|
|||
27.02.2014, 20:48 |
|
Получить HTML с сайта
|
|||
---|---|---|---|
#18+
насчет фреймов не помню. разве нельзя "достать"? сорри библиотека http://archive.msdn.microsoft.com/SgmlReader ... |
|||
:
Нравится:
Не нравится:
|
|||
27.02.2014, 20:51 |
|
Получить HTML с сайта
|
|||
---|---|---|---|
#18+
Спасибо. А может кто знает почему у меня в webBrowser1.DocumentText во первых не все теги попали да и ещё пол страницы нет как будто HTML откусан гружу эту ссылку http://www.interpark.com/product/ProductDetailImage.do?_method=detailNIP&sc.resizeYn=N&sc.prdNo=1019673620&sc.resizeYn=N&mid1=top&mid2=img_zoom&mid3=001 ... |
|||
:
Нравится:
Не нравится:
|
|||
01.03.2014, 01:34 |
|
Получить HTML с сайта
|
|||
---|---|---|---|
#18+
Оказывается когда второй раз заходит в _DocumentCompleted то HTML полный. ... |
|||
:
Нравится:
Не нравится:
|
|||
01.03.2014, 01:39 |
|
|
start [/forum/topic.php?fid=20&msg=38574683&tid=1403181]: |
0ms |
get settings: |
8ms |
get forum list: |
12ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
48ms |
get topic data: |
10ms |
get forum data: |
3ms |
get page messages: |
45ms |
get tp. blocked users: |
1ms |
others: | 12ms |
total: | 145ms |
0 / 0 |