|
|
|
(Perl) Серфинг по инету
|
|||
|---|---|---|---|
|
#18+
Приветствую всех, У меня есть вопрос. Скажите как можно в перле, если можно, "гулять" по различным веб ресурсам, и глядеть содержимое каталогов данных ресурсов. Например нада зайти на узел 82.66.245.45 и найти в каталоге cool все html файлы которые содержат фразу "Зашибись". ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.05.2005, 21:20 |
|
||
|
(Perl) Серфинг по инету
|
|||
|---|---|---|---|
|
#18+
VihtoldПриветствую всех, У меня есть вопрос. Скажите как можно в перле, если можно, "гулять" по различным веб ресурсам, и глядеть содержимое каталогов данных ресурсов. Например нада зайти на узел 82.66.245.45 и найти в каталоге cool все html файлы которые содержат фразу "Зашибись". perldoc LWP perldoc HTML::Parser Это чтоб скачать и разобрать документ. С вопросом поиска несколько сложнее - либо все тупо рекурсивно качаеш LWP и потом разбираеш для поиска соответствующих фраз. Или воспользоваться каким либо поисковиком для поиска нужных фраз на нужном сайте и потом полученный результат опятьже распарсить HTML::Parser'om и забрать нужное LWP... ...Я бы таки наверное функцию поиска доверил гуглю, например так , и сразу минус - не всегда актуальная информация, зато трафику уйму сэкономиш... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.05.2005, 23:09 |
|
||
|
(Perl) Серфинг по инету
|
|||
|---|---|---|---|
|
#18+
Оки, спасибо за ваш ответ. А если подойти к даной проблеме с другой стороны, например мне требуется найти в сети и нформацию, подобным способом как это делает гуголь. Так вот я начинаю искать, Этап 1 генерируем IP адреса в диапазоне 20.15.85.10-100.215.48.45 (с этим я заню как справитсья) Этап 2 предствим что адресс 84.56.259.40 сушествует, я "лезу" на него и "вычленяю" все html-фаилйы, находяшиеся в даном узле (Как это сделать на Perl ???) Этап 3 в моемей коллекции фаилов мне нада найти, скажем, оглавления, для этого я буду использовать regex(этот этап проблем вроде бы тоже не представляет) Заранее вас благодарю за ваши ответы. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.05.2005, 01:41 |
|
||
|
(Perl) Серфинг по инету
|
|||
|---|---|---|---|
|
#18+
авторЭтап 2 предствим что адресс 84.56.259.40 сушествует, я "лезу" на него и "вычленяю" все html-фаилйы, находяшиеся в даном узле (Как это сделать на Perl ???) примерно так Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. как сделат рекурсию подумай сам :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.05.2005, 12:08 |
|
||
|
(Perl) Серфинг по инету
|
|||
|---|---|---|---|
|
#18+
Спасибо вам большое за отевет, Скажите а почему субрутина cb вызывается с помошью указателя на нее? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.05.2005, 15:05 |
|
||
|
(Perl) Серфинг по инету
|
|||
|---|---|---|---|
|
#18+
она не вызывается а передаётся. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.05.2005, 16:28 |
|
||
|
(Perl) Серфинг по инету
|
|||
|---|---|---|---|
|
#18+
Блин точно.... :) а что делает функция grep в даном случае? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.05.2005, 16:40 |
|
||
|
|

start [/forum/topic.php?fid=23&msg=33051054&tid=1478333]: |
0ms |
get settings: |
6ms |
get forum list: |
13ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
300ms |
get topic data: |
8ms |
get forum data: |
2ms |
get page messages: |
38ms |
get tp. blocked users: |
1ms |
| others: | 199ms |
| total: | 571ms |

| 0 / 0 |
