
Новые сообщения [новые:0]
Дайджест
Горячие темы
Избранное [новые:0]
Форумы
Пользователи
Статистика
Статистика нагрузки
Мод. лог
Поиск
|
|
06.04.2009, 16:46
|
|||
|---|---|---|---|
|
|||
несколько простых вопросов по теории поиска |
|||
|
#18+
1) чем отличается информационный поиск от поиска данных и от текстового поиска? Если я правильно понял, то информационный поиск является наиболее общим понятием и объединяет другие два. Поиск данных представляет собой поиск в структурированной информации, а текстовый поиск - в тексте? 2) можно ли говорить, что инвертированные файлы являются стандартом в технологии поиска? В каких известных поисковых системах используются инвертированные файлы? (А как же методы сигнатур и суффиксные деревья - они не используются?) 3) каковы недостатки инвертированных файлов по сравнению с прямым поиском (интересует хотя бы краткое перечисление или ссылка на стратью) спасибо ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
06.04.2009, 16:52
|
|||
|---|---|---|---|
несколько простых вопросов по теории поиска |
|||
|
#18+
Из всех термИнов понял только "файл". "Инвертированный файл" уже не осилил. Но вот гуглом пользоваться мОгем. Например ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
06.04.2009, 16:59
|
|||
|---|---|---|---|
|
|||
несколько простых вопросов по теории поиска |
|||
|
#18+
Senya_L, т.е. лучше использовать "инвертированный индекс"? Это ведь одно и то же, что инвертированный файл ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
06.04.2009, 18:36
|
|||
|---|---|---|---|
несколько простых вопросов по теории поиска |
|||
|
#18+
QDmitrySenya_L, т.е. лучше использовать "инвертированный индекс"? Это ведь одно и то же, что инвертированный файлВот, в том же гугле найдено авторНедостатками данной системы являются большие затраты времени на составление вспомогательной структуры данных и ее обновление. Причем эти затраты возрастают с увеличение объема базы данных. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
06.04.2009, 18:55
|
|||
|---|---|---|---|
|
|||
несколько простых вопросов по теории поиска |
|||
|
#18+
Bely, да, спасибо. Я уже нашел несколько недостатков по сравнению с прямым поиском: необходимость индексирования (т.е. нельзя сразу поиск сделать) необходимость переиндексирования (в случае, если банк данных обновился) необходимость хранить индекс (особенно трудно, если он большой и не помещается на одном носителе) потеря информации при индексировании (связано с нормализацией) . вроде все? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
06.04.2009, 19:21
|
|||
|---|---|---|---|
|
|||
несколько простых вопросов по теории поиска |
|||
|
#18+
[quot QDmitry]потеря информации при индексировании (связано с нормализацией) [quot] Это как, пардон? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
06.04.2009, 19:26
|
|||
|---|---|---|---|
|
|||
несколько простых вопросов по теории поиска |
|||
|
#18+
Кот Матроскин, при индексировании для уменьшения места вместо всех словоформ используются лексемы. Также используются различные сокращения. Следовательно, это накладывает ограничения для нечеткого и приближенного поиска. Разве не так? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
06.04.2009, 19:48
|
|||
|---|---|---|---|
|
|||
несколько простых вопросов по теории поиска |
|||
|
#18+
QDmitryКот Матроскин, при индексировании для уменьшения места вместо всех словоформ используются лексемы. Также используются различные сокращения Обязательно используются? Индексов без этого не бывает? Если нет - это вряд ли можно относить к недостаткам самой технологии индексирования. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|

start [/forum/topic.php?fid=32&mobile=1&tid=1543328]: |
0ms |
get settings: |
7ms |
get forum list: |
15ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
169ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
47ms |
get tp. blocked users: |
1ms |
| others: | 200ms |
| total: | 457ms |

| 0 / 0 |
