|
|
|
Полнотекстовый поиск по краткому наименованию
|
|||
|---|---|---|---|
|
#18+
Есть такая фраза - "самолет У-2". Если выполнить запрос SELECT * FROM ts_debug('russian','самолет У-2'); то видим alias description token dictionaries dictionary lexemesword Word all letters самолет {russian_stem} russian_stem {самолет}blank Space symbols {} word Word all letters У {russian_stem} russian_stem {} int Signed integer -2 {simple} simple {-2} Словосочетание У-2 воспринимается как стоп-слово (У) и целое со знаком. Вопрос. Как сделать так чтобы "У-2" воспринималась как неделимая лексема. Спасибо. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.02.2016, 11:36 |
|
||
|
Полнотекстовый поиск по краткому наименованию
|
|||
|---|---|---|---|
|
#18+
big-trot, похоже на багофичу. авторы нужны ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.02.2016, 15:15 |
|
||
|
Полнотекстовый поиск по краткому наименованию
|
|||
|---|---|---|---|
|
#18+
Misha Tyurin, Формально, по умолчанию, всё работает правильно. Как выполнить настройку полнотекстового поиска, так чтобы подобные словосочетания рассматривались как одна лексема? Я пробовал создавать словарь синонимов, тезаурусов, и в итоге ничего не получилось. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.02.2016, 16:06 |
|
||
|
Полнотекстовый поиск по краткому наименованию
|
|||
|---|---|---|---|
|
#18+
big-trot, это так парсер парсит. (по секрету -- я уже обсудил с авторами даже) http://www.postgresql.org/docs/current/static/textsearch-parsers.html // Table 12-1. Default Parser's Token Types он с цифрой, у вас в примере, не делает: hword или numhword это ваще всё сложно всегда (например, в сфинксе тоже с этим большая возня: http://sphinxsearch.com/docs/current/conf-blend-chars.html и прочего подобного там еще есть) так что это такая текущая "багофича" наверное всё таки ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.02.2016, 16:29 |
|
||
|
Полнотекстовый поиск по краткому наименованию
|
|||
|---|---|---|---|
|
#18+
Misha Tyurin, Я перепробовал все Parser's Token Types ALTER TEXT SEARCH CONFIGURATION russian ALTER MAPPING FOR asciiword,word,numword,asciihword,hword,numhword,hword_asciipart,hword_part,hword_numpart,blank WITH thesaurus_sel, sel_synonym, russian_stem; Ничего не помогло. Жаль, будем ждать устранения багофичи. Если это так. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.02.2016, 17:17 |
|
||
|
Полнотекстовый поиск по краткому наименованию
|
|||
|---|---|---|---|
|
#18+
big-trot, > перепробовал все Parser's Token Types дак вам сам парсер сейчас токен c hyphen не генерит ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.02.2016, 18:02 |
|
||
|
Полнотекстовый поиск по краткому наименованию
|
|||
|---|---|---|---|
|
#18+
big-trot, авторы в курсе :) http://www.postgresql.org/message-id/flat/CAO8ar==RC4o7a3Yw_AoQ=TVyH2EmZLx1PRQPGfios+XsXEr+xw@mail.gmail.com#CAO8ar==RC4o7a3Yw_AoQ=TVyH2EmZLx1PRQPGfios+XsXEr+xw@mail.gmail.com]http://www.postgresql.org/message-id/flat/CAO8ar==RC4o7a3Yw_AoQ=TVyH2EmZLx1PRQPGfios XsXEr xw@mail.gmail.com#CAO8ar==RC4o7a3Yw_AoQ=TVyH2EmZLx1PRQPGfios XsXEr xw@mail.gmail.com Сейчас просто времени нет, попробуйте препроцессить, как Mike предлагает. Если у вас есть скил программирования на C, то можете форкнуть парсер и сделать все под себя. FTS может использовать кастомный парсер. Олег ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.02.2016, 00:11 |
|
||
|
|

start [/forum/topic.php?fid=53&gotonew=1&tid=1997445]: |
0ms |
get settings: |
5ms |
get forum list: |
19ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
60ms |
get topic data: |
11ms |
get first new msg: |
7ms |
get forum data: |
2ms |
get page messages: |
54ms |
get tp. blocked users: |
1ms |
| others: | 214ms |
| total: | 379ms |

| 0 / 0 |
