|
CORE-734 // Full text indexing / search
|
|||
---|---|---|---|
#18+
Добрый день! Собственно про http://tracker.firebirdsql.org/browse/CORE-734 Есть ли в отдаленных планах реализацию хотя бы быстрый примитивный метод, без лексики/морфологию? В одном проэкте выбираем DBMS, делаем таблицу сравнений для клиента, это пока минус Файра. Если инстанс один/два можно было в связки с каким нибуд эластик или сфинкс, но инстансов много, 250+. Есть несколько текст блобов по которым нужен поиск. Спрошу, может готовы немного профинансировать. И еще как хотелку, утилита типа как в постгри, типа pg_upgrade, или может как свитч в gbak, одним махом апдэйтить базу. ... |
|||
:
Нравится:
Не нравится:
|
|||
02.02.2021, 10:31 |
|
CORE-734 // Full text indexing / search
|
|||
---|---|---|---|
#18+
Dorin Marcoci, можно прикрутить внешний полнотекстовый поиск. Собственно сборку сфинкса под Firebird Влад периодически выкладывает. Но можно и любой другой прикрутить. Если надо более тесную интеграцию можно написать внешние UDR ... |
|||
:
Нравится:
Не нравится:
|
|||
02.02.2021, 10:40 |
|
CORE-734 // Full text indexing / search
|
|||
---|---|---|---|
#18+
Симонов Денис, Так я написал что инстансов много, маленькие оффисы, деплой и апдэйты автоматические. А ставить и поддержать еще Сфинкс будет сложновато. Данные не очень много. Когда например какой то сервис на один/пару серверов то да, через сфинкс лучше. Буду предлагать вариант через доп таблицу и UDR.. ... |
|||
:
Нравится:
Не нравится:
|
|||
02.02.2021, 11:11 |
|
CORE-734 // Full text indexing / search
|
|||
---|---|---|---|
#18+
Dorin Marcoci, не обязательно сфинкс. Можно любой другой полнотекстовый поиск прикрутить. UDR тут нужен разве что для того чтобы внутри SQL проще использовать было. Можно сделать набор внешних ХП и функций по аналогии с Red Database ... |
|||
:
Нравится:
Не нравится:
|
|||
02.02.2021, 11:28 |
|
CORE-734 // Full text indexing / search
|
|||
---|---|---|---|
#18+
Я думал UDR для разбиения слов и потом вставку в доп таблицу, где потом "starting". Хотя разбивку уже можно и PLSQLом, добавили достаточно встроенных функций. А что, думаешь эластик будет проще деплоить и держать синхронизацию с базой? ;) Если бы был хотябы какое-то встроенное простое разбиение на слов/токенизацию и индекс по этим словам было бы очень классно. Видел в РедDB есть связка с Lucene, но таскать за собой всю джаву, и еще одно зависимость как внешний модуль даже не знаю... ... |
|||
:
Нравится:
Не нравится:
|
|||
02.02.2021, 12:43 |
|
CORE-734 // Full text indexing / search
|
|||
---|---|---|---|
#18+
Dorin Marcoci, не обязательно именно Lucene использовать. Я говорю взять за основу идею. Прикрутить можно к чему угодно. Обновлять/синхронизировать можно либо кроном, что дорого (перечитывать огромные таблицы в поисках изменений). Либо повесить на эти таблицы триггеры, которые отправляют сообщение в очередь с "просьбой" переидексировать поля записи. ... |
|||
:
Нравится:
Не нравится:
|
|||
02.02.2021, 13:07 |
|
CORE-734 // Full text indexing / search
|
|||
---|---|---|---|
#18+
А в четвёрке на это можно плагин репликации запрячь. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
02.02.2021, 13:28 |
|
CORE-734 // Full text indexing / search
|
|||
---|---|---|---|
#18+
Dorin MarcociЯ думал UDR для разбиения слов и потом вставку в доп таблицу, где потом "starting". это не совсем полнотекстовый поиск. Но кое что можно сделать в этом направлении. 1. Разбиение текста на слова 2. Каталог слов 3. Таблица индексов (таблица, слово, блоб с идентификаторами записей) 4. Процедура которая по фразе выдаёт список идентификаторов и коэффициент совпадения (совпавшее/общее кол-во слов во фразе) будет что-то типа Код: sql 1. 2. 3. 4. 5.
... |
|||
:
Нравится:
Не нравится:
|
|||
02.02.2021, 13:29 |
|
|
start [/forum/topic.php?fid=40&fpage=9&tid=1560142]: |
0ms |
get settings: |
10ms |
get forum list: |
15ms |
check forum access: |
5ms |
check topic access: |
5ms |
track hit: |
51ms |
get topic data: |
13ms |
get forum data: |
3ms |
get page messages: |
48ms |
get tp. blocked users: |
4ms |
others: | 13ms |
total: | 167ms |
0 / 0 |