|
|
|
(PHP, Perl) сканер сайта
|
|||
|---|---|---|---|
|
#18+
Требуется организовать загрузку данных с сайта одного банка на свою локальную страничку (или в базу данных). Ситуация такая. Банк каждый день на своем сайте выставляет некоторые котировки. Схема навигации по сайту банка примерно такая: Страница1(адрес статический либо легко формируемый по дате)->Страница2(адрес динамический). На этой странице1, есть ссыслка на страницу2, по этой ссылке посетитель сайта переходит и оказывается на странице2, адрес которой примерно такого вида: www.bank.ru/private/...29839, то есть его невозможно сфорировать, зная дату, так как там, судя по всему, зависимость очень хитрая. Возможно, что банк каждый день формирует разное кол-во страниц, каждой в адресе прибавляя по 1. Требуется написать процедуру на каком-нибудь языке, которая будет ежедневно заходить на страницу1 банка, переходить по ссылке (есть ключевое слово в html коде страницы1, которое никогда не меняется) на страницу2 и оттуда из таблицы вычленять котировки и заносить в локальную базу данных. Я новичок в интернет-программировании. Если кто поможет, буду очень благодарен! Скажите хотя бы, с помощью чего можно сделать такой анализатор/сканер, который может разбирать html код? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.05.2006, 05:48:31 |
|
||
|
(PHP, Perl) сканер сайта
|
|||
|---|---|---|---|
|
#18+
Ну... с такой постоновкой задачи можно только отправить мануалы изучать http://php.rinet.ru/manual/ru/reference.pcre.pattern.syntax.php http://php.rinet.ru/manual/ru/function.preg-match.php ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.05.2006, 08:27:47 |
|
||
|
(PHP, Perl) сканер сайта
|
|||
|---|---|---|---|
|
#18+
Если на Perle: Загрузка страниц: use LWP::UserAgent; use HTTP::Request::Common; ... Анализировать, сортировать и вычленять нужную инфо через regexp. Добавлять в БД полученные данные через DBI, DBD. Открой свой internet-ресторан! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.05.2006, 12:00:17 |
|
||
|
|

start [/forum/topic.php?fid=23&fpage=423&tid=1476227]: |
0ms |
get settings: |
6ms |
get forum list: |
9ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
37ms |
get topic data: |
7ms |
get forum data: |
2ms |
get page messages: |
37ms |
get tp. blocked users: |
2ms |
| others: | 183ms |
| total: | 287ms |

| 0 / 0 |
