powered by simpleCommunicator - 2.0.51     © 2025 Programmizd 02
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / Поиск по документу (не БД и не txt)
3 сообщений из 3, страница 1 из 1
Поиск по документу (не БД и не txt)
    #32443421
Фотография babaEGA
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Привет.
Итак - есть довольно объемная база неких документов. Название документа и имя файла хранится в БД. Сами же файлы хранятся на сервере в zip. архивах.

Вопрос - можно ли как-нибудь осуществить поиск по содержимому документа.
Или поиск по названию документа, хранящемуся в БД - это предел мечтаний?
Что вы посоветуете?
...
Рейтинг: 0 / 0
Поиск по документу (не БД и не txt)
    #32443531
Шогал
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Нужно один раз провести муторное индексирование документа - а затем уже проводить поиск по этой мусорной куче. Затем при добавлении нового документа индексировать и его.

Правда, такой способ очень сильно жрет пространство базы данных.

SHOGAL
...
Рейтинг: 0 / 0
Поиск по документу (не БД и не txt)
    #32446327
Фотография Антон К.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вариантов несколько, на мой взгляд:
1. Раззиповать, залить в СУБД, построить полнотекстовый индекс по содержимому документа. Если документы заливать как есть, то соотвественно от списка файлов на диске можно безболезненно отказаться.
2. Действительно, как говорит товарищ, воспользоваться не относящимся к БД индексатором. Коих много. Ну, например, есть движок тут:
http://jakarta.apache.org/lucene/docs/index.html

Наверняка есть нечто более просто ставящееся
...
Рейтинг: 0 / 0
3 сообщений из 3, страница 1 из 1
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / Поиск по документу (не БД и не txt)
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]