|
Интернет-паук
|
|||
---|---|---|---|
#18+
Здравствуйте! Искал на форуме но похожего что-то не нашёл... Проблема такая: поставил перед собой задачу поиска информации (хотя бы текста) в своём блоге из других источников информации. Как Вы думаете с чего следует начать и что необходимо знать при реализовании такой штуки? Заранее спасибо. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.02.2011, 23:47 |
|
Интернет-паук
|
|||
---|---|---|---|
#18+
Поподробней задачу распишите. В зависимости от сложности задачи и решения будут совсем разные. ... |
|||
:
Нравится:
Не нравится:
|
|||
23.02.2011, 00:03 |
|
Интернет-паук
|
|||
---|---|---|---|
#18+
Окей Задача даже скорей стоит не для блога а для портала. Портал связан с туризмом, где посетители могут оставлять сообщения, отзывы, рекомендации и так далее.. На начальном этапе этот портал никому не будет нужен и неинтересен (нет контента) (((( Вот и возникла задача сбора подобной информации с других сайтов, что бы иметь определённую базу знаний об предметной области... Вопрос заключается в том как автоматизировать процесс поиска информации по различным сайтам... Если знаете подходящую литературу или статью порекомендуйте)) ... |
|||
:
Нравится:
Не нравится:
|
|||
23.02.2011, 15:32 |
|
Интернет-паук
|
|||
---|---|---|---|
#18+
DenonisПортал связан с туризмом, где посетители могут оставлять сообщения, отзывы, рекомендации и так далее.. На начальном этапе этот портал никому не будет нужен и неинтересен (нет контента) (((( Вот и возникла задача сбора подобной информации с других сайтов, что бы иметь определённую базу знаний об предметной области... Вопрос заключается в том как автоматизировать процесс поиска информации по различным сайтам... имхается: 1. копать надо в сторону роботов и того, как поисковики проводят индексацию сайтов (по технологии) 2. это (п.1.) не поможет, пока сам не начнешь разбираться не только в предметной области, но и в том, как этот вопрос решается в Интернет 3. вопрос решается посредством использования RSS-сервисов туристических сайтов с добавлением к ним либо оператора, который будет фильтровать инфу, либо своего фильтра + непосредственные контакты/договоренности с сответствующими "хозяинами ресурсов" 4. пиши в личку, если не ошибаюсь, то у меня есть контакт, с которым можно пообщаться как минимум по поводу обмена инфой ... |
|||
:
Нравится:
Не нравится:
|
|||
23.02.2011, 17:42 |
|
Интернет-паук
|
|||
---|---|---|---|
#18+
Я бы на вашем месте сделал RSS-агрератор. Если хочется большего - берите nutch. ... |
|||
:
Нравится:
Не нравится:
|
|||
24.02.2011, 14:12 |
|
|
start [/forum/topic.php?fid=33&msg=37132447&tid=1548097]: |
0ms |
get settings: |
10ms |
get forum list: |
13ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
64ms |
get topic data: |
7ms |
get forum data: |
2ms |
get page messages: |
36ms |
get tp. blocked users: |
1ms |
others: | 12ms |
total: | 151ms |
0 / 0 |