|
|
|
На чём проще написать бота для сайта
|
|||
|---|---|---|---|
|
#18+
хочу написать бота, для собственного пользования. Планируется, что бот будет искать в определённом разделе сайта объявления, подходящие по критерию и выдавать на выходе набор ссылок (или лучше текст объявления). Как с тех. точки зрения лучше сделать? как плагин к FF или развернуть php -сервер? знаю с++,Python,java. заранее благодарю за ответы. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.09.2011, 10:31 |
|
||
|
На чём проще написать бота для сайта
|
|||
|---|---|---|---|
|
#18+
Десктопное приложение на яве или сях. На яве, имхо, проще. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.09.2011, 10:46 |
|
||
|
На чём проще написать бота для сайта
|
|||
|---|---|---|---|
|
#18+
ScetcherКак с тех. точки зрения лучше сделать? как плагин к FF или развернуть php -сервер? знаю с++,Python,java. На том языке который вы лучше знаете. На котором точно знаете как получить страницу и ее распарсить. Лично я сделал бы на php (хотя основной C++). PS php-сервер - че за зверь такой? :) Вообще то php - всего лишь язык программирования, без всякой серверной части или функционала ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.09.2011, 11:21 |
|
||
|
На чём проще написать бота для сайта
|
|||
|---|---|---|---|
|
#18+
Хотя если в качестве задачи некий сервис/демон пишущий ссылки, объявления в базу. (т.е. работающий неограниченное количество времени) -возможно выбрал бы С++ ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.09.2011, 11:24 |
|
||
|
На чём проще написать бота для сайта
|
|||
|---|---|---|---|
|
#18+
Scetcher, а как это приложение будет работать? Смотреть страницу, которую ты видишь в браузере? или постоянно самостоятельно ходить по сайту, без твоего участия? В первом случае - обычный юзерскрипт для greasemonkey, во втором - можно вин-сервис на сишарпе забабахать. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.09.2011, 13:30 |
|
||
|
На чём проще написать бота для сайта
|
|||
|---|---|---|---|
|
#18+
Яростный Меч, Самостоятельно ходить по сайту, после чего по требованию открывать ссылки на найденные объявления в браузере(или сбрасывать их в файл , бд и т.п.). C# не люблю :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.09.2011, 14:21 |
|
||
|
На чём проще написать бота для сайта
|
|||
|---|---|---|---|
|
#18+
Я писал и на делфи. Сейчас хочу тоже нечто подобное сделать. И буду реализовывать на Python с использованием специально для прасинга Beautiful Soup. Вообще к чему душа ближе ляжет и где решений больше на том и пишите. Но вот в питоне уже готовое есть, поэтому.... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.09.2011, 14:28 |
|
||
|
На чём проще написать бота для сайта
|
|||
|---|---|---|---|
|
#18+
NMNНо вот в питоне уже готовое есть, поэтому....а что там готовое-то? в том же шарпе: пара строк на загрузку страницы, регекс для парсинга, вот и всего делофф. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.09.2011, 14:32 |
|
||
|
На чём проще написать бота для сайта
|
|||
|---|---|---|---|
|
#18+
Яростный Меча что там готовое-то? в том же шарпе: пара строк на загрузку страницы, регекс для парсинга, вот и всего делофф. На bash Код: plaintext 1. 2. Только вот стоит ли ТС изучать bash и команды linux если он владеет другим инструментом? ;) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.09.2011, 15:07 |
|
||
|
На чём проще написать бота для сайта
|
|||
|---|---|---|---|
|
#18+
Яростный Меч, прошу ознакомится http://wiki.python.su/Beautiful_Soup и сказать что из этого можно сразу в шарпе повторить(хотя все равно автору шарп не подуше), но мне было бы интересно для сравнения услышать ответ. Я могу наперед сказать, что регулярка только отфильтрует, но не даст она "кликнуть" на найденом. Так что количество приседаний в питоне будет меньше. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.09.2011, 15:20 |
|
||
|
На чём проще написать бота для сайта
|
|||
|---|---|---|---|
|
#18+
Scetcherхочу написать бота, для собственного пользования. Планируется, что бот будет искать в определённом разделе сайта объявления, подходящие по критерию и выдавать на выходе набор ссылок (или лучше текст объявления). Как с тех. точки зрения лучше сделать? как плагин к FF или развернуть php -сервер? знаю с++,Python,java. заранее благодарю за ответы. Легче всего имхо использовать связку Python + pyCurl + BeautifulSoup. У меня с ней головной боли не было. Может urllib ещё удобен. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.09.2011, 15:22 |
|
||
|
На чём проще написать бота для сайта
|
|||
|---|---|---|---|
|
#18+
В догонку. Шарп думаю битую DOM на странице не разеберет. Прогеры вполне могут защищатся такими методами, во вторых закаченная страница не всегда, то что мы видим в браузере (JS никто не отменял!), куки и фиг знает что еще могут навернуть. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.09.2011, 15:29 |
|
||
|
На чём проще написать бота для сайта
|
|||
|---|---|---|---|
|
#18+
Благодарю, господа. буду пробовать на пайтоне ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.09.2011, 17:49 |
|
||
|
На чём проще написать бота для сайта
|
|||
|---|---|---|---|
|
#18+
авторimport urllib2 from BeautifulSoup import BeautifulSoup page = urllib2.urlopen(" http://www.icc-ccs.org/prc/piracyreport.php") soup = BeautifulSoup(page) for incident in soup('td', width="90%"): where, linebreak, what = incident.contents[:3] print where.strip() print what.strip() ну вот кто все эти люди, которые пытаются интенсифицировать труд программиста, оставляя его все с теми же унылыми императивным методами? SQL, значит, все освоили, а дальше по этой же дорожке шагнуть нельзя ? или не освоили SQL? TC, XPath изучай. В нем сила. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.09.2011, 17:10 |
|
||
|
На чём проще написать бота для сайта
|
|||
|---|---|---|---|
|
#18+
NMNВ догонку. Шарп думаю битую DOM на странице не разеберет. Прогеры вполне могут защищатся такими методами, во вторых закаченная страница не всегда, то что мы видим в браузере (JS никто не отменял!), куки и фиг знает что еще могут навернуть. Думаю что эта проблема не лежит в плоскости Шарпа. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.09.2011, 19:21 |
|
||
|
|

start [/forum/topic.php?fid=16&fpage=80&tid=1342738]: |
0ms |
get settings: |
9ms |
get forum list: |
15ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
48ms |
get topic data: |
12ms |
get forum data: |
2ms |
get page messages: |
51ms |
get tp. blocked users: |
1ms |
| others: | 245ms |
| total: | 389ms |

| 0 / 0 |
