Полнотекстовый поиск по краткому наименованию / PostgreSQL

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Полнотекстовый поиск по краткому наименованию

7 сообщений из 7, страница 1 из 1

Полнотекстовый поиск по краткому наименованию

#39166374

big-trot

Гость

Есть такая фраза - "самолет У-2".
Если выполнить запрос

SELECT * FROM ts_debug('russian','самолет У-2');

то видим
alias description token dictionaries dictionary lexemesword Word all letters самолет {russian_stem} russian_stem {самолет}blank Space symbols {} word Word all letters У {russian_stem} russian_stem {} int Signed integer -2 {simple} simple {-2}

Словосочетание У-2 воспринимается как стоп-слово (У) и целое со знаком.
Вопрос. Как сделать так чтобы "У-2" воспринималась как неделимая лексема. Спасибо.

...

Рейтинг:

0 / 0

09.02.2016, 11:36

| Ответить | Цитировать | Написать

Полнотекстовый поиск по краткому наименованию

#39166735

Misha Tyurin

Участник

Откуда: Тюмень

Сообщения: 2 279

Рейтинг: 0 / 0

big-trot,

похоже на багофичу. авторы нужны

...

Рейтинг:

0 / 0

09.02.2016, 15:15

| Ответить | Цитировать | Написать

Полнотекстовый поиск по краткому наименованию

#39166795

big-trot

Гость

Misha Tyurin,

Формально, по умолчанию, всё работает правильно.
Как выполнить настройку полнотекстового поиска, так чтобы подобные словосочетания рассматривались как одна лексема?
Я пробовал создавать словарь синонимов, тезаурусов, и в итоге ничего не получилось.

...

Рейтинг:

0 / 0

09.02.2016, 16:06

| Ответить | Цитировать | Написать

Полнотекстовый поиск по краткому наименованию

#39166827

Misha Tyurin

Участник

Откуда: Тюмень

Сообщения: 2 279

Рейтинг: 0 / 0

big-trot,

это так парсер парсит. (по секрету -- я уже обсудил с авторами даже)

http://www.postgresql.org/docs/current/static/textsearch-parsers.html // Table 12-1. Default Parser's Token Types
он с цифрой, у вас в примере, не делает:

hword
или
numhword

это ваще всё сложно всегда (например, в сфинксе тоже с этим большая возня: http://sphinxsearch.com/docs/current/conf-blend-chars.html и прочего подобного там еще есть)

так что это такая текущая "багофича" наверное всё таки

...

Рейтинг:

0 / 0

09.02.2016, 16:29

| Ответить | Цитировать | Написать

Полнотекстовый поиск по краткому наименованию

#39166884

big-trot

Гость

Misha Tyurin,

Я перепробовал все Parser's Token Types

ALTER TEXT SEARCH CONFIGURATION russian
ALTER MAPPING FOR asciiword,word,numword,asciihword,hword,numhword,hword_asciipart,hword_part,hword_numpart,blank
WITH thesaurus_sel, sel_synonym, russian_stem;

Ничего не помогло.
Жаль, будем ждать устранения багофичи. Если это так.

...

Рейтинг:

0 / 0

09.02.2016, 17:17

| Ответить | Цитировать | Написать

Полнотекстовый поиск по краткому наименованию

#39166972

Misha Tyurin

Участник

Откуда: Тюмень

Сообщения: 2 279

Рейтинг: 0 / 0

big-trot,

> перепробовал все Parser's Token Types

дак вам сам парсер сейчас токен c hyphen не генерит

...

Рейтинг:

0 / 0

09.02.2016, 18:02

| Ответить | Цитировать | Написать

Полнотекстовый поиск по краткому наименованию

#39168139

Oleg Bartunov

Участник

Сообщения: 220

Рейтинг: 0 / 0

big-trot,

авторы в курсе :)
http://www.postgresql.org/message-id/flat/CAO8ar==RC4o7a3Yw_AoQ=TVyH2EmZLx1PRQPGfios+XsXEr+xw@mail.gmail.com#CAO8ar==RC4o7a3Yw_AoQ=TVyH2EmZLx1PRQPGfios+XsXEr+xw@mail.gmail.com]http://www.postgresql.org/message-id/flat/CAO8ar==RC4o7a3Yw_AoQ=TVyH2EmZLx1PRQPGfios XsXEr xw@mail.gmail.com#CAO8ar==RC4o7a3Yw_AoQ=TVyH2EmZLx1PRQPGfios XsXEr xw@mail.gmail.com

Сейчас просто времени нет, попробуйте препроцессить, как Mike предлагает.

Если у вас есть скил программирования на C, то можете форкнуть парсер и сделать все под себя. FTS может использовать кастомный парсер.

Олег

...

Рейтинг:

0 / 0

11.02.2016, 00:11

| Ответить | Цитировать | Написать

7 сообщений из 7, страница 1 из 1

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Полнотекстовый поиск по краткому наименованию

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=53&gotonew=1&tid=1997445]:	0ms
get settings:	5ms
get forum list:	19ms
check forum access:	3ms
check topic access:	3ms
track hit:	60ms
get topic data:	11ms
get first new msg:	7ms
get forum data:	2ms
get page messages:	54ms
get tp. blocked users:	1ms
others:	214ms

total:	379ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы