powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Полнотекстовый поиск по краткому наименованию
7 сообщений из 7, страница 1 из 1
Полнотекстовый поиск по краткому наименованию
    #39166374
big-trot
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Есть такая фраза - "самолет У-2".
Если выполнить запрос

SELECT * FROM ts_debug('russian','самолет У-2');

то видим
alias description token dictionaries dictionary lexemesword Word all letters самолет {russian_stem} russian_stem {самолет}blank Space symbols {} word Word all letters У {russian_stem} russian_stem {} int Signed integer -2 {simple} simple {-2}

Словосочетание У-2 воспринимается как стоп-слово (У) и целое со знаком.
Вопрос. Как сделать так чтобы "У-2" воспринималась как неделимая лексема. Спасибо.
...
Рейтинг: 0 / 0
Полнотекстовый поиск по краткому наименованию
    #39166735
Фотография Misha Tyurin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
big-trot,

похоже на багофичу. авторы нужны
...
Рейтинг: 0 / 0
Полнотекстовый поиск по краткому наименованию
    #39166795
big-trot
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Misha Tyurin,

Формально, по умолчанию, всё работает правильно.
Как выполнить настройку полнотекстового поиска, так чтобы подобные словосочетания рассматривались как одна лексема?
Я пробовал создавать словарь синонимов, тезаурусов, и в итоге ничего не получилось.
...
Рейтинг: 0 / 0
Полнотекстовый поиск по краткому наименованию
    #39166827
Фотография Misha Tyurin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
big-trot,

это так парсер парсит. (по секрету -- я уже обсудил с авторами даже)

http://www.postgresql.org/docs/current/static/textsearch-parsers.html // Table 12-1. Default Parser's Token Types
он с цифрой, у вас в примере, не делает:

hword
или
numhword

это ваще всё сложно всегда (например, в сфинксе тоже с этим большая возня: http://sphinxsearch.com/docs/current/conf-blend-chars.html и прочего подобного там еще есть)

так что это такая текущая "багофича" наверное всё таки
...
Рейтинг: 0 / 0
Полнотекстовый поиск по краткому наименованию
    #39166884
big-trot
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Misha Tyurin,

Я перепробовал все Parser's Token Types

ALTER TEXT SEARCH CONFIGURATION russian
ALTER MAPPING FOR asciiword,word,numword,asciihword,hword,numhword,hword_asciipart,hword_part,hword_numpart,blank
WITH thesaurus_sel, sel_synonym, russian_stem;

Ничего не помогло.
Жаль, будем ждать устранения багофичи. Если это так.
...
Рейтинг: 0 / 0
Полнотекстовый поиск по краткому наименованию
    #39166972
Фотография Misha Tyurin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
big-trot,

> перепробовал все Parser's Token Types

дак вам сам парсер сейчас токен c hyphen не генерит
...
Рейтинг: 0 / 0
Полнотекстовый поиск по краткому наименованию
    #39168139
Oleg Bartunov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
big-trot,

авторы в курсе :)
http://www.postgresql.org/message-id/flat/CAO8ar==RC4o7a3Yw_AoQ=TVyH2EmZLx1PRQPGfios+XsXEr+xw@mail.gmail.com#CAO8ar==RC4o7a3Yw_AoQ=TVyH2EmZLx1PRQPGfios+XsXEr+xw@mail.gmail.com]http://www.postgresql.org/message-id/flat/CAO8ar==RC4o7a3Yw_AoQ=TVyH2EmZLx1PRQPGfios XsXEr xw@mail.gmail.com#CAO8ar==RC4o7a3Yw_AoQ=TVyH2EmZLx1PRQPGfios XsXEr xw@mail.gmail.com

Сейчас просто времени нет, попробуйте препроцессить, как Mike предлагает.

Если у вас есть скил программирования на C, то можете форкнуть парсер и сделать все под себя. FTS может использовать кастомный парсер.


Олег
...
Рейтинг: 0 / 0
7 сообщений из 7, страница 1 из 1
Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Полнотекстовый поиск по краткому наименованию
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]