powered by simpleCommunicator - 2.0.51     © 2025 Programmizd 02
Форумы / Разработка информационных систем [игнор отключен] [закрыт для гостей] / Интернет-паук
6 сообщений из 6, страница 1 из 1
Интернет-паук
    #37131491
Denonis
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Здравствуйте!

Искал на форуме но похожего что-то не нашёл...

Проблема такая: поставил перед собой задачу поиска информации (хотя бы текста) в своём блоге из других источников информации.

Как Вы думаете с чего следует начать и что необходимо знать при реализовании такой штуки?

Заранее спасибо.
...
Рейтинг: 0 / 0
Интернет-паук
    #37131512
Leonidv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Поподробней задачу распишите. В зависимости от сложности задачи и решения будут совсем разные.
...
Рейтинг: 0 / 0
Интернет-паук
    #37132262
Denonis
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Окей

Задача даже скорей стоит не для блога а для портала.

Портал связан с туризмом, где посетители могут оставлять сообщения, отзывы, рекомендации и так далее..
На начальном этапе этот портал никому не будет нужен и неинтересен (нет контента) ((((
Вот и возникла задача сбора подобной информации с других сайтов, что бы иметь определённую базу знаний об предметной области...
Вопрос заключается в том как автоматизировать процесс поиска информации по различным сайтам...

Если знаете подходящую литературу или статью порекомендуйте))
...
Рейтинг: 0 / 0
Интернет-паук
    #37132447
Фотография Chop
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
DenonisПортал связан с туризмом, где посетители могут оставлять сообщения, отзывы, рекомендации и так далее..
На начальном этапе этот портал никому не будет нужен и неинтересен (нет контента) ((((
Вот и возникла задача сбора подобной информации с других сайтов, что бы иметь определённую базу знаний об предметной области...
Вопрос заключается в том как автоматизировать процесс поиска информации по различным сайтам...
имхается:
1. копать надо в сторону роботов и того, как поисковики проводят индексацию сайтов (по технологии)
2. это (п.1.) не поможет, пока сам не начнешь разбираться не только в предметной области, но и в том, как этот вопрос решается в Интернет
3. вопрос решается посредством использования RSS-сервисов туристических сайтов с добавлением к ним либо оператора, который будет фильтровать инфу, либо своего фильтра
+ непосредственные контакты/договоренности с сответствующими "хозяинами ресурсов"
4. пиши в личку, если не ошибаюсь, то у меня есть контакт, с которым можно пообщаться как минимум по поводу обмена инфой
...
Рейтинг: 0 / 0
Интернет-паук
    #37133696
Leonidv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Я бы на вашем месте сделал RSS-агрератор.

Если хочется большего - берите nutch.
...
Рейтинг: 0 / 0
Интернет-паук
    #37134607
Denonis
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Leonidv, Chop, спасибо вам за Ваши дельные советы обязательно приму их во внимание.
...
Рейтинг: 0 / 0
6 сообщений из 6, страница 1 из 1
Форумы / Разработка информационных систем [игнор отключен] [закрыт для гостей] / Интернет-паук
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]