|
|
|
Получить HTML с сайта
|
|||
|---|---|---|---|
|
#18+
Можно ли как то получить HTML с сайта который отрисовывается js-ом. вот тут например при прокрутки вниз подгружается контент iframe. Как бы его заполучить. Сам фрейм по ссылке тоже не открывается и при попытки загрузить его через WebClient возвращает пустую строку ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.02.2014, 17:15:46 |
|
||
|
Получить HTML с сайта
|
|||
|---|---|---|---|
|
#18+
разве что грузить в webBrowser. я других вариантов не нашел. правда особо и не искал т.к. нужно было всеголишь 3 странички сграбить. минусы webBrowser: долго, муторно, винформс, нужно ловить webBrowser1_DocumentCompleted, иногда скрипты еще и ошибками кидаютцо... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.02.2014, 20:07:05 |
|
||
|
Получить HTML с сайта
|
|||
|---|---|---|---|
|
#18+
VladM2, в webBrowser1_DocumentCompleted вот такой контент ловится только. нет возможности как то отловить полную загрузку страницы? <html><head></head><body></body></html> ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.02.2014, 20:24:57 |
|
||
|
Получить HTML с сайта
|
|||
|---|---|---|---|
|
#18+
Я имею доступ только к исходному HTML а как бы получить тот который JS отрисовывает и подгружает frame ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.02.2014, 20:42:30 |
|
||
|
Получить HTML с сайта
|
|||
|---|---|---|---|
|
#18+
там есть ProgressChanged ( ... ProgressChangedEventArgs e ... ) и сравнивать e.CurrentProgress e.MaximumProgress как то так, по памяти пишу. помню что муторно было. одно дело пару страниц а другое каталог товаров ... ps кстати доставал через DocumentStream (были траблы с webBrowser1 Document Encoding) вспомнил что был абсолютно дикий невалидный хтмл , здорово выручила библиотека sgml тогда, она мне его в красивый xml, ну а там xpath в руки ... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.02.2014, 20:48:39 |
|
||
|
Получить HTML с сайта
|
|||
|---|---|---|---|
|
#18+
насчет фреймов не помню. разве нельзя "достать"? сорри библиотека http://archive.msdn.microsoft.com/SgmlReader ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.02.2014, 20:51:56 |
|
||
|
Получить HTML с сайта
|
|||
|---|---|---|---|
|
#18+
Спасибо. А может кто знает почему у меня в webBrowser1.DocumentText во первых не все теги попали да и ещё пол страницы нет как будто HTML откусан гружу эту ссылку http://www.interpark.com/product/ProductDetailImage.do?_method=detailNIP&sc.resizeYn=N&sc.prdNo=1019673620&sc.resizeYn=N&mid1=top&mid2=img_zoom&mid3=001 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.03.2014, 01:34:29 |
|
||
|
Получить HTML с сайта
|
|||
|---|---|---|---|
|
#18+
Оказывается когда второй раз заходит в _DocumentCompleted то HTML полный. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.03.2014, 01:39:38 |
|
||
|
|

start [/forum/topic.php?fid=20&fpage=126&tid=1403181]: |
0ms |
get settings: |
10ms |
get forum list: |
19ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
62ms |
get topic data: |
13ms |
get forum data: |
3ms |
get page messages: |
62ms |
get tp. blocked users: |
2ms |
| others: | 279ms |
| total: | 458ms |

| 0 / 0 |
