Гость
Форумы / Разработка информационных систем [игнор отключен] [закрыт для гостей] / Интернет-паук / 6 сообщений из 6, страница 1 из 1
22.02.2011, 23:47
    #37131491
Denonis
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Интернет-паук
Здравствуйте!

Искал на форуме но похожего что-то не нашёл...

Проблема такая: поставил перед собой задачу поиска информации (хотя бы текста) в своём блоге из других источников информации.

Как Вы думаете с чего следует начать и что необходимо знать при реализовании такой штуки?

Заранее спасибо.
...
Рейтинг: 0 / 0
23.02.2011, 00:03
    #37131512
Leonidv
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Интернет-паук
Поподробней задачу распишите. В зависимости от сложности задачи и решения будут совсем разные.
...
Рейтинг: 0 / 0
23.02.2011, 15:32
    #37132262
Denonis
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Интернет-паук
Окей

Задача даже скорей стоит не для блога а для портала.

Портал связан с туризмом, где посетители могут оставлять сообщения, отзывы, рекомендации и так далее..
На начальном этапе этот портал никому не будет нужен и неинтересен (нет контента) ((((
Вот и возникла задача сбора подобной информации с других сайтов, что бы иметь определённую базу знаний об предметной области...
Вопрос заключается в том как автоматизировать процесс поиска информации по различным сайтам...

Если знаете подходящую литературу или статью порекомендуйте))
...
Рейтинг: 0 / 0
23.02.2011, 17:42
    #37132447
Chop
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Интернет-паук
DenonisПортал связан с туризмом, где посетители могут оставлять сообщения, отзывы, рекомендации и так далее..
На начальном этапе этот портал никому не будет нужен и неинтересен (нет контента) ((((
Вот и возникла задача сбора подобной информации с других сайтов, что бы иметь определённую базу знаний об предметной области...
Вопрос заключается в том как автоматизировать процесс поиска информации по различным сайтам...
имхается:
1. копать надо в сторону роботов и того, как поисковики проводят индексацию сайтов (по технологии)
2. это (п.1.) не поможет, пока сам не начнешь разбираться не только в предметной области, но и в том, как этот вопрос решается в Интернет
3. вопрос решается посредством использования RSS-сервисов туристических сайтов с добавлением к ним либо оператора, который будет фильтровать инфу, либо своего фильтра
+ непосредственные контакты/договоренности с сответствующими "хозяинами ресурсов"
4. пиши в личку, если не ошибаюсь, то у меня есть контакт, с которым можно пообщаться как минимум по поводу обмена инфой
...
Рейтинг: 0 / 0
24.02.2011, 14:12
    #37133696
Leonidv
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Интернет-паук
Я бы на вашем месте сделал RSS-агрератор.

Если хочется большего - берите nutch.
...
Рейтинг: 0 / 0
24.02.2011, 21:04
    #37134607
Denonis
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Интернет-паук
Leonidv, Chop, спасибо вам за Ваши дельные советы обязательно приму их во внимание.
...
Рейтинг: 0 / 0
Форумы / Разработка информационных систем [игнор отключен] [закрыт для гостей] / Интернет-паук / 6 сообщений из 6, страница 1 из 1
Целевая тема:
Создать новую тему:
Автор:
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]