|
|
|
Интернет-паук
|
|||
|---|---|---|---|
|
#18+
Здравствуйте! Искал на форуме но похожего что-то не нашёл... Проблема такая: поставил перед собой задачу поиска информации (хотя бы текста) в своём блоге из других источников информации. Как Вы думаете с чего следует начать и что необходимо знать при реализовании такой штуки? Заранее спасибо. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.02.2011, 23:47 |
|
||
|
Интернет-паук
|
|||
|---|---|---|---|
|
#18+
Поподробней задачу распишите. В зависимости от сложности задачи и решения будут совсем разные. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.02.2011, 00:03 |
|
||
|
Интернет-паук
|
|||
|---|---|---|---|
|
#18+
Окей Задача даже скорей стоит не для блога а для портала. Портал связан с туризмом, где посетители могут оставлять сообщения, отзывы, рекомендации и так далее.. На начальном этапе этот портал никому не будет нужен и неинтересен (нет контента) (((( Вот и возникла задача сбора подобной информации с других сайтов, что бы иметь определённую базу знаний об предметной области... Вопрос заключается в том как автоматизировать процесс поиска информации по различным сайтам... Если знаете подходящую литературу или статью порекомендуйте)) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.02.2011, 15:32 |
|
||
|
Интернет-паук
|
|||
|---|---|---|---|
|
#18+
DenonisПортал связан с туризмом, где посетители могут оставлять сообщения, отзывы, рекомендации и так далее.. На начальном этапе этот портал никому не будет нужен и неинтересен (нет контента) (((( Вот и возникла задача сбора подобной информации с других сайтов, что бы иметь определённую базу знаний об предметной области... Вопрос заключается в том как автоматизировать процесс поиска информации по различным сайтам... имхается: 1. копать надо в сторону роботов и того, как поисковики проводят индексацию сайтов (по технологии) 2. это (п.1.) не поможет, пока сам не начнешь разбираться не только в предметной области, но и в том, как этот вопрос решается в Интернет 3. вопрос решается посредством использования RSS-сервисов туристических сайтов с добавлением к ним либо оператора, который будет фильтровать инфу, либо своего фильтра + непосредственные контакты/договоренности с сответствующими "хозяинами ресурсов" 4. пиши в личку, если не ошибаюсь, то у меня есть контакт, с которым можно пообщаться как минимум по поводу обмена инфой ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.02.2011, 17:42 |
|
||
|
Интернет-паук
|
|||
|---|---|---|---|
|
#18+
Я бы на вашем месте сделал RSS-агрератор. Если хочется большего - берите nutch. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.02.2011, 14:12 |
|
||
|
|

start [/forum/topic.php?fid=33&msg=37131491&tid=1548097]: |
0ms |
get settings: |
9ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
153ms |
get topic data: |
12ms |
get forum data: |
3ms |
get page messages: |
50ms |
get tp. blocked users: |
2ms |
| others: | 12ms |
| total: | 263ms |

| 0 / 0 |

Извините, этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
... ля, ля, ля ...