Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Создание поисковых роботов / 6 сообщений из 6, страница 1 из 1
30.11.2004, 18:15
    #32806476
Ленчик
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Создание поисковых роботов
:) Вот такая тема интересная. Кто может поделиться информацией (любой, ибо знания чуть выше нуля). Буду благодарна всем.
...
Рейтинг: 0 / 0
30.11.2004, 19:13
    #32806535
Lepsik
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Создание поисковых роботов
а чего тут думать садишся и пишешь.
...
Рейтинг: 0 / 0
30.11.2004, 19:38
    #32806562
Man555
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Создание поисковых роботов
Мой уровень в этом вопросе примерно такой же, но идея примерно такая.. сканирование адресов на предмет открытого 80го порта, проверка на HTTP сервис, ну и дальше скачивание файликов от туда и их индексация. Про индексацию краем глаза видел много научных работ ;-)
...
Рейтинг: 0 / 0
01.12.2004, 11:40
    #32807232
Jimmy
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Создание поисковых роботов
Почитай статью, как устроен Google.
The Anatomy of a Large-Scale Hypertextual Web Search Engine

PS По ссылкам из статьи пройдись
...
Рейтинг: 0 / 0
02.12.2004, 11:32
    #32809118
Green2
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Создание поисковых роботов
Идея такая, на каждой уважающей себя поисковой машине имеются форма для ввода сайтов.
Если у тебя нет списка сайтов, с которых начинается опрос, придётся создать его вручную.
Поисковая машина начинает качать сайты по списку, заглядывая в разделы ссылок на другие сайты.
Таким образом по сети ссылок создаётся образ интернета.

Математические модели отвечают за то, что-бы минимизировать трафик, не выкачивая несколько раз один сайт и создание структур данных, наиболее приспособленных для поиска.

На сайтах часто добавляют специальны файлы для роботов, обычно robots.txt, в котором определяют правила поведения робота. Например можно запретить индексировать страницу.

--

Posted via ActualForum NNTP Server 1.1
...
Рейтинг: 0 / 0
02.12.2004, 11:37
    #32809132
Green Kakadu
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Создание поисковых роботов
Есть неплохая книжка на тему:
Spidering Hacks 100 Industrial-Strength Tips & Tools

правда там основная ориентация на Perl

тут, если пороешься можешь что-то отыскать:

http://forum.searchengines.ru/forumdisplay.php?forumid=26
...
Рейтинг: 0 / 0
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Создание поисковых роботов / 6 сообщений из 6, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]