|
Поиск по документу (не БД и не txt)
|
|||
---|---|---|---|
#18+
Привет. Итак - есть довольно объемная база неких документов. Название документа и имя файла хранится в БД. Сами же файлы хранятся на сервере в zip. архивах. Вопрос - можно ли как-нибудь осуществить поиск по содержимому документа. Или поиск по названию документа, хранящемуся в БД - это предел мечтаний? Что вы посоветуете? ... |
|||
:
Нравится:
Не нравится:
|
|||
16.03.2004, 13:15 |
|
Поиск по документу (не БД и не txt)
|
|||
---|---|---|---|
#18+
Нужно один раз провести муторное индексирование документа - а затем уже проводить поиск по этой мусорной куче. Затем при добавлении нового документа индексировать и его. Правда, такой способ очень сильно жрет пространство базы данных. SHOGAL ... |
|||
:
Нравится:
Не нравится:
|
|||
16.03.2004, 13:48 |
|
Поиск по документу (не БД и не txt)
|
|||
---|---|---|---|
#18+
Вариантов несколько, на мой взгляд: 1. Раззиповать, залить в СУБД, построить полнотекстовый индекс по содержимому документа. Если документы заливать как есть, то соотвественно от списка файлов на диске можно безболезненно отказаться. 2. Действительно, как говорит товарищ, воспользоваться не относящимся к БД индексатором. Коих много. Ну, например, есть движок тут: http://jakarta.apache.org/lucene/docs/index.html Наверняка есть нечто более просто ставящееся ... |
|||
:
Нравится:
Не нравится:
|
|||
18.03.2004, 00:13 |
|
|
start [/forum/topic.php?fid=23&gotonew=1&tid=1479949]: |
0ms |
get settings: |
11ms |
get forum list: |
15ms |
check forum access: |
5ms |
check topic access: |
5ms |
track hit: |
41ms |
get topic data: |
10ms |
get first new msg: |
7ms |
get forum data: |
3ms |
get page messages: |
50ms |
get tp. blocked users: |
2ms |
others: | 250ms |
total: | 399ms |
0 / 0 |