|
|
|
научите сохранять html-текст страничек
|
|||
|---|---|---|---|
|
#18+
необходимо выдрать текст с html(те больше ничего не надо, ни картинок, ни звуков, лишь html) первый простой вариант через URLDownloadToFile очень прост и хорош, но он не все странички берёт, те некоторые, которые отображаются в браузере, он не грузит с ошибкой "incorrect sintax" второй вариант через IWebBrowser и IHTMLDocument - получаю документ, из него беру body и outerHTML(мне этого достаточно). но вот проблема - этот вариант работает нестабильно, валится через раз. Не могу понять в чём дело. Ещё Проблема этого метода - что на страничке выполняются скрипты и грузится всё, что настроено в IE, что не есть хорошо...:( может есть ещё варианты ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.02.2006, 08:52 |
|
||
|
научите сохранять html-текст страничек
|
|||
|---|---|---|---|
|
#18+
забыл добавить про IWebBrowser после вызова Navigate стоит код Код: plaintext 1. 2. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.02.2006, 09:11 |
|
||
|
|

start [/forum/topic.php?fid=57&gotonew=1&tid=2032007]: |
0ms |
get settings: |
9ms |
get forum list: |
12ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
166ms |
get topic data: |
10ms |
get first new msg: |
5ms |
get forum data: |
2ms |
get page messages: |
49ms |
get tp. blocked users: |
1ms |
| others: | 239ms |
| total: | 497ms |

| 0 / 0 |
