|
|
|
Принцип программ индексации сайтов поисковыми системами
|
|||
|---|---|---|---|
|
#18+
Всем привет, Подскажите мне пожалуйста по какому принципу поисковые системы индексируют сайты в интернете. Насколько я знаю есть специальные программы которые каким-то образом пропарсивают сайты (или только тег META) и составляют базу данных с которой в свою очередь и работают поисковые системы. Таким образом меня интересует следующий вопрос,- как с точки зрения программиста-системщика (C/C++) реализованы системы индексации сайтов, не используются ли там какие-то особые технологии поиска сайтов или специальные протоколы (если да то дайте мне пожалуйста ссылку на соответствующий RFC). Заранее спасибо. PS: Отдельное огромное спасибо за ссылки и примеры псевдо-кода ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.06.2004, 21:02 |
|
||
|
Принцип программ индексации сайтов поисковыми системами
|
|||
|---|---|---|---|
|
#18+
Существуют специальные программы индексации, никаких особых протоколов для индексации не исользуется, разве что в корневой каталог ложится специальный файл robots.txt в котором прописываются правила просмотра файла. Где-то я видел ссылку на структуру базы данных для обработки такой информации, не помню где. Это уже более лингвистические методы. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.06.2004, 00:03 |
|
||
|
|

start [/forum/topic.php?fid=16&msg=32578877&tid=1348355]: |
0ms |
get settings: |
11ms |
get forum list: |
16ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
156ms |
get topic data: |
13ms |
get forum data: |
3ms |
get page messages: |
58ms |
get tp. blocked users: |
1ms |
| others: | 266ms |
| total: | 530ms |

| 0 / 0 |
