Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Delphi [игнор отключен] [закрыт для гостей] / Парсинг сайтов на дельфи / 12 сообщений из 12, страница 1 из 1
24.12.2019, 17:02
    #39907577
RichardIV
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Парсинг сайтов на дельфи
Была у меня программа, которая парсила определенный сайт. Она сохраняла на локальный диск код страницы и парсила с него таблицу в текстовый файл. Работало через IHTMLDocument2 и IHTMLElementCollection.
Таблица определялась по тегам.
Так вот, с недавних пор сайт не сохраняется, при попытке доступа появляется окно - сайт не поддерживает ваш браузер. Потому что IHTMLDocument2 открывает сайт через IE.
Как побороть проблему?
Может есть другой способ сохранить ?
...
Рейтинг: 0 / 0
24.12.2019, 17:13
    #39907580
Dimitry Sibiryakov
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Парсинг сайтов на дельфи
RichardIVМожет есть другой способ сохранить ?

Есть. Indy, CURL, любая другая библиотека, способная работать c HTTP.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
24.12.2019, 17:37
    #39907605
Квейд
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Парсинг сайтов на дельфи
RichardIV
Была у меня программа, которая парсила определенный сайт. Она сохраняла на локальный диск код страницы и парсила с него таблицу в текстовый файл. Работало через IHTMLDocument2 и IHTMLElementCollection.
Таблица определялась по тегам.
Так вот, с недавних пор сайт не сохраняется, при попытке доступа появляется окно - сайт не поддерживает ваш браузер. Потому что IHTMLDocument2 открывает сайт через IE.
Как побороть проблему?
Может есть другой способ сохранить ?


Changing the UA (User Agent) of a TWebBrowser component спасет ОРД?
...
Рейтинг: 0 / 0
24.12.2019, 18:45
    #39907633
Zelius
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Парсинг сайтов на дельфи
RichardIV,

Еще можно почитать про FEATURE_BROWSER_EMULATION, а вдруг...
...
Рейтинг: 0 / 0
24.12.2019, 18:51
    #39907635
ziv-2014
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Парсинг сайтов на дельфи
RichardIV,
А еще Chromium и MiniBlink
...
Рейтинг: 0 / 0
24.12.2019, 21:26
    #39907661
defecator
Модератор форума
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Парсинг сайтов на дельфи
ziv-2014
RichardIV,
А еще Chromium и MiniBlink

это уже тяжёлая артиллерия
...
Рейтинг: 0 / 0
25.12.2019, 06:03
    #39907705
crutchmaster
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Парсинг сайтов на дельфи
RichardIV,

Делать реверс. Сайтостроители последнее время стараются активно защищаться от таких умников.
...
Рейтинг: 0 / 0
25.12.2019, 09:45
    #39907737
Василий 2
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Парсинг сайтов на дельфи
defecator
ziv-2014
RichardIV,
А еще Chromium и MiniBlink

это уже тяжёлая артиллерия

Нет, тяжелая артиллерия это полноценный браузер через WebDriver ))
...
Рейтинг: 0 / 0
25.12.2019, 16:48
    #39907962
RichardIV
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Парсинг сайтов на дельфи
В общем нашел, от чего сайт не хочет парсится - там в коде есть блок на проверку версии браузера.
Скажите, а есть способ (чтобы без перебора каждой строки в файле) удалить из html файла все ссылки и скрипты?
...
Рейтинг: 0 / 0
25.12.2019, 17:38
    #39907991
Dimitry Sibiryakov
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Парсинг сайтов на дельфи
RichardIVа есть способ (чтобы без перебора каждой строки в файле)

Удалить кусок содержимого файла не читая содержимое файла? Нет, обломись.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
26.12.2019, 06:39
    #39908260
crutchmaster
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Парсинг сайтов на дельфи
RichardIV
В общем нашел, от чего сайт не хочет парсится - там в коде есть блок на проверку версии браузера.

Дат не факт, что он у тебя дальше заработает на встроенном в дельфи ишаке. Может без осла как-то можно распарсить по-старинке? Что за сайт хоть?
...
Рейтинг: 0 / 0
26.12.2019, 16:44
    #39908553
RichardIV
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Парсинг сайтов на дельфи
crutchmaster
Что за сайт хоть?

Туту.ру
...
Рейтинг: 0 / 0
Форумы / Delphi [игнор отключен] [закрыт для гостей] / Парсинг сайтов на дельфи / 12 сообщений из 12, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]