|
Вопрос к php/perl-программистам
|
|||
---|---|---|---|
#18+
Сабж значит следующий. Есть проект на Delphi, суть его такова что при помощи Indy Clients components из инета загружаются странички, анализируются и передаются в СУБД InteBase. Так вот, 1-ая проблема с которой мы столкнулись это хостинг приложения(т.к. приложение жрёт трафик немилосердно...) Хостинг с поддержкой InterBase(FireBird неважно) найти оказалось очень сложно. исходя из вышеизложенного я подумываю переписывать проект на php/perl, но пока незнаю их возможностей. Есть ли в нём что-нибудь подобное Indy components как в Delphi ? То есть мне нужно загружать странички с определённых сайтов и анализировать их. Заранее спасибо ... |
|||
:
Нравится:
Не нравится:
|
|||
22.06.2004, 10:26 |
|
Вопрос к php/perl-программистам
|
|||
---|---|---|---|
#18+
авториз инета загружаются странички, анализируются и передаются в СУБД InteBase Что вы имеете в виду под анализом html-страницы? Скачивать из инета и записывать данные в СУБД по-моему примерно одинаково просто на perl и php. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.06.2004, 10:34 |
|
Вопрос к php/perl-программистам
|
|||
---|---|---|---|
#18+
LeXa NalBat авториз инета загружаются странички, анализируются и передаются в СУБД InteBase Что вы имеете в виду под анализом html-страницы? Скачивать из инета и записывать данные в СУБД по-моему примерно одинаково просто на perl и php. Под анализом странички я имею ввиду следующее: Допустим мне надо получить кое-какие данные с http://www.yandex.ru/yandsearch?rpt=rad&text=%F1%E0%E1%E6 В delphi я посылаю запрос и получаю эту страничку. Далее я синтаксически разбираю её код и ищу примерно следующую конструкцию <div class="title"> ""<A onClick="r(this,'web')" href="http://foster.com.ru/18.01.2004/1/comments" target=_blank> Дневник Фостера - жЫвой легенды хакаснета</A> </div>"" Далее записываю ссылку в СУБД ... |
|||
:
Нравится:
Не нравится:
|
|||
22.06.2004, 10:49 |
|
Вопрос к php/perl-программистам
|
|||
---|---|---|---|
#18+
Можно. PHP предоставляет большие возможности по удаленному коннекту через SOCKET и работа со строками, так называемые "регулярные выражения" - разбирают строки практически любой сложности. Насчет коннекта к твоей базе я не знаю - в PHP есть библиотеки для работы со многими базами. Насчет твоей тебе придется уточнить, думаю, что есть, посмотри на http://www.php.net или http://www.phpclub.ru или на сайте разработчика твоей базы данных. Если что не надешь, опять же, СОКЕТ никто не отменял. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.06.2004, 11:19 |
|
Вопрос к php/perl-программистам
|
|||
---|---|---|---|
#18+
Для рабора html-страницы в перле можно воспользоваться модулем HTML::Parser. Скачивание документа из инета - LWP. Подключение к бд - DBI. All modules at CPAN авторДалее я синтаксически разбираю её код и ищу примерно следующую конструкцию Это вы делаете с помощью функций предоставляемых Indy Clients? ... |
|||
:
Нравится:
Не нравится:
|
|||
22.06.2004, 11:19 |
|
Вопрос к php/perl-программистам
|
|||
---|---|---|---|
#18+
LeXa NalBatДля рабора html-страницы в перле можно воспользоваться модулем HTML::Parser. Скачивание документа из инета - LWP. Подключение к бд - DBI. All modules at CPAN авторДалее я синтаксически разбираю её код и ищу примерно следующую конструкцию Это вы делаете с помощью функций предоставляемых Indy Clients? Нет конечно, с помощью функций написанных в Delphi. Ещё вопрос: Есть странички написанные на java(на них таблички), то есть когда просматриваешь код этот самый код отображается неполностью, позволяет ли PHP/perl получает содержимое страницы полностью, со всеми табличками ? Заранее sorry за чайниковость :) ... |
|||
:
Нравится:
Не нравится:
|
|||
22.06.2004, 12:03 |
|
Вопрос к php/perl-программистам
|
|||
---|---|---|---|
#18+
Bes82 LeXa NalBat авторДалее я синтаксически разбираю её код и ищу примерно следующую конструкциюЭто вы делаете с помощью функций предоставляемых Indy Clients?Нет конечно, с помощью функций написанных в Delphi. Понятно. В перле можно разбирать html-страницу самостоятельно, например с помощью регулярных выражений. Или воспользоваться модулем HTML::Parser. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.06.2004, 14:17 |
|
Вопрос к php/perl-программистам
|
|||
---|---|---|---|
#18+
Вариант с PHP: fopen/fsockopen/CURL + String functions/PCRE/Tokenizer ... |
|||
:
Нравится:
Не нравится:
|
|||
22.06.2004, 15:31 |
|
Вопрос к php/perl-программистам
|
|||
---|---|---|---|
#18+
Спасибо ! Вот тока я чо то не могу опредеиться с выбором средства реализации, т.к. я кинул такой же сабж и в форум по java. Не подскажите на чём этоn проект быстрее реализовать ? ... |
|||
:
Нравится:
Не нравится:
|
|||
22.06.2004, 16:33 |
|
Вопрос к php/perl-программистам
|
|||
---|---|---|---|
#18+
+1 за перл (если судить по тому описанию что дал автор). Обработка текстов - это его конек и регекспы в нем очень быстро работают (даже плохо написанные). + если надо, можно организовать многопоточное соединение (в пхп тоже это можно делать через pcntl_fork, но я пока скептически отношусь к такому использованию пхп) ... |
|||
:
Нравится:
Не нравится:
|
|||
22.06.2004, 18:10 |
|
|
start [/forum/topic.php?fid=23&fpage=508&tid=1479649]: |
0ms |
get settings: |
8ms |
get forum list: |
12ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
47ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
49ms |
get tp. blocked users: |
2ms |
others: | 11ms |
total: | 149ms |
0 / 0 |