|
|
|
Сохранение страниц в web.archive.org
|
|||
|---|---|---|---|
|
#18+
Программа по списку сохраняет страницы сайта cian.ru на ресурсе web.archive.org путем выполнения GET запроса: http://web.archive.org/save/ссылка_на_сохраняемую_страницу После n-ой страницы cian.ru предлагает ввести рекапчу. Капчу можно разгадать через сервис антикапчи. На cian.ru ответ на капчу нужно отправить POST запросом: https://www.cian.ru/captcha/?redirect_url=https://www.cian.ru/ g-recaptcha-response=[расшифровка капчи]&redirect_url=https://www.cian.ru/ Вопрос в том как отправить расшифровку капчи на cian.ru через web.archive.org, чтобы программа могла дальше продолжить сохранение страниц? Спасибо! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.11.2017, 09:26:17 |
|
||
|
Сохранение страниц в web.archive.org
|
|||
|---|---|---|---|
|
#18+
Немного дополню вопрос: "Руками" это сделать не получается, т.е. при появлении капчи cian возвращает HTTP 302... и web.archive.org переходит с требуемой страницы на страницу с капчей вот такого вида https://www.cian.ru/captcha/?redirect_url=https://www.cian.ru/ но руками вести эту капчу когда она открывается через web.archive.org не получается т.к. она в этом случае отображается не корректно, вот так: http://web.archive.org/save/https://www.cian.ru/captcha/?redirect_url=https://www.cian.ru/ поймать момент и отгадать капчу не проблема. Вопрос в том как отправить разгаданную капчу в cian.ru через web.archive.org? Проблема в том что web.archive.org работает с сохраняемыми сайтами через GET запросы а капча отправляется на cian.ru POST запросом. Т.е. возможно есть способ искуственно передать POST запрос в GET запросе т.е. так чтобы cian.ru "поверил" что web.archive.org разгадал капчу как-то так ... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.11.2017, 12:46:02 |
|
||
|
Сохранение страниц в web.archive.org
|
|||
|---|---|---|---|
|
#18+
NovaC, а при чем здесь Delphi? Через TWebbrowser что-ли работаете? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.11.2017, 13:45:19 |
|
||
|
Сохранение страниц в web.archive.org
|
|||
|---|---|---|---|
|
#18+
Может уменьшить скорость с которой сохраняете страницы? Если web.arhive.org не умеет слать POST запросы, то скорее всего никак. Лучше обратитесь в web.arhive.org, возможно они подскажут как через их сервис можно сохранять такие сайты или как слать POST запросы. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.11.2017, 16:11:01 |
|
||
|
|

start [/forum/topic.php?fid=58&msg=39555067&tid=2041565]: |
0ms |
get settings: |
6ms |
get forum list: |
13ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
183ms |
get topic data: |
12ms |
get forum data: |
3ms |
get page messages: |
52ms |
get tp. blocked users: |
2ms |
| others: | 207ms |
| total: | 484ms |

| 0 / 0 |
