|
немножко про роботов для сбора информации из интернета на webbrowser
|
|||
---|---|---|---|
#18+
наработки из приложения которое стартует по расписанию заходит на страницы интернет банка скачивает выписку, парсит ее и записывает сведения в базу а также скачивает копии платежных документов в пдф. общая схема 1. выделен отдельный старенький ноут на котором по расписанию две задачи одна перезагрузка раз в сутки вторая -запуск приложения ежечасно в рабочие часы. 2. приложение будучи запущенным с определенным ключом запускает по очереди формы с функционалом работы с тем или иным банком. При этом происходит не взлом ресурса а эмулируется работа пользователя, в том числе выполняются скрипты и формируются динамически создаваемые страницы. 3. на форме размещен контрол webbrowser и кнопка запуска / отладки процесса вручную 4. в ходе работы программый код управляет навигацией в компоненте веббраузер втч проходит аутентификацию т.е. вводит логин и пароль, делает выбор опций, переходит по ссылкам, совершает эмуляцию нажатий на элементы разметки страницы, закачивает файлы втч пдф с защищенных страниц. из windows-шедулера запускается vbs скрипт следующего содержания Код: vbnet 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17.
как отловить аргумент запуска приложения в функции автозагрузки Код: vbnet 1.
затем открываем форму и запускаем публичный метод btn_login_Click Код: vbnet 1. 2.
некоторые методы работы с вебраузером вход на страницу аутертификации Код: vbnet 1. 2. 3. 4.
при этом сайлент предотвращает появление некоторых ненужных диалогов в случае ошибок скриптов на странице функция ожидания готовности загрузки страницы может выглядеть так Код: vbnet 1. 2. 3. 4. 5.
ввести логин в определенное поле Код: vbnet 1.
найти кнопку выполнить обработку событий фокус и клик Код: vbnet 1. 2. 3.
ввод данных вебформы Код: vbnet 1.
отправка данных вебформы Код: vbnet 1.
сохранение содержимого страницы в файл для парсинга Код: vbnet 1. 2. 3. 4. 5. 6. 7.
загрузка файла по полученной в ходе парсинга ссылке, при этом функция использует текущие кукисы веббраузер контрола, т.е. позволяет скачивать со страниц на которые выполнен защищенный вход, но не вызывает диалога куда сохранять файл. Код: vbnet 1.
вызов Код: vbnet 1.
могут пригодиться инструменты изучения структуры страницы firefox -> веб разработка -> инструменты разработчика функция "исследовать элемент" в выпадающем меню ... |
|||
:
Нравится:
Не нравится:
|
|||
15.01.2019, 16:50 |
|
|
start [/forum/topic.php?fid=45&fpage=37&tid=1610903]: |
0ms |
get settings: |
11ms |
get forum list: |
15ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
36ms |
get topic data: |
11ms |
get forum data: |
2ms |
get page messages: |
46ms |
get tp. blocked users: |
2ms |
others: | 323ms |
total: | 454ms |
0 / 0 |