powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / C++ [игнор отключен] [закрыт для гостей] / научите сохранять html-текст страничек
3 сообщений из 3, страница 1 из 1
научите сохранять html-текст страничек
    #33520811
Smirnov Anton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
необходимо выдрать текст с html(те больше ничего не надо, ни картинок, ни звуков, лишь html)

первый простой вариант через URLDownloadToFile очень прост и хорош, но он не все странички берёт, те некоторые, которые отображаются в браузере, он не грузит с ошибкой "incorrect sintax"

второй вариант через IWebBrowser и IHTMLDocument - получаю документ, из него беру body и outerHTML(мне этого достаточно). но вот проблема - этот вариант работает нестабильно, валится через раз. Не могу понять в чём дело. Ещё Проблема этого метода - что на страничке выполняются скрипты и грузится всё, что настроено в IE, что не есть хорошо...:(

может есть ещё варианты
...
Рейтинг: 0 / 0
научите сохранять html-текст страничек
    #33520834
Smirnov Anton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
забыл добавить про IWebBrowser
после вызова Navigate
стоит код
Код: plaintext
1.
2.
		VARIANT_BOOL v = VARIANT_TRUE ;
		while(v == VARIANT_TRUE)
			spBrowser->get_Busy(&v);
это идентично тому, что после того, как get_Busy вернуло true - было отработано событие OnDocumentComplite?
...
Рейтинг: 0 / 0
научите сохранять html-текст страничек
    #33522936
White Owl
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Подсоединиться напрямую к серверу и дать команду "GET /dir1/file.html HTTP1.1" намного проще...
...
Рейтинг: 0 / 0
3 сообщений из 3, страница 1 из 1
Форумы / C++ [игнор отключен] [закрыт для гостей] / научите сохранять html-текст страничек
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]