|
pg_tsparser и русский текст
|
|||
---|---|---|---|
#18+
Кто-нибудь использует парсер pg_tsparser (расширение Postgres Pro для текстового поиска) для поиска в русских текстах. Почему-то у меня он не дружит с русскими буквами. Код: sql 1. 2. 3.
Говорит, что АБВГ - это пробелы. Код: plaintext 1. 2.
С латинскими буковками 'ABCD-234' всё хорошо (во всяком случае так, как бы мне хотелось). Код: plaintext 1. 2. 3. 4.
Русскую буковку среди латинских 'ABЫD-234' тоже определяет пробелом. Осмыссленный текст 'зелёное яблоко' вообще игнорируется. Это у меня что-то не так, я чего-то не понимаю? Или сей парсер не предназначен для русских текстов? postgres 11.1 (теперь уже 11.2) Свойства БД: encoding = 'UTF8' lc_collate = 'ru_RU.UTF-8' lc_ctype = 'ru_RU.UTF-8' ОС openSUSE Leap 15.0 ... |
|||
:
Нравится:
Не нравится:
|
|||
21.02.2019, 12:32 |
|
pg_tsparser и русский текст
|
|||
---|---|---|---|
#18+
Действительно, есть такая проблема. Изначально парсер дружил с русскими буквами. Но в pg 11 и master сделали изменения, из-за которых парсер перестал правильно работат с не ASCII символами. Запушил исправление, теперь парсер должен работать правильно. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.02.2019, 14:36 |
|
pg_tsparser и русский текст
|
|||
---|---|---|---|
#18+
Замечательно. Будем ждать появления этих изменений в официальном издании. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.02.2019, 16:11 |
|
pg_tsparser и русский текст
|
|||
---|---|---|---|
#18+
А ещё, как оказалось, ни default-ный парсер ни tsparser (исправленный из postgrespro 11.2.1) не умеют парсить url-ы в зоне рф (с русскими буковками). Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
... |
|||
:
Нравится:
Не нравится:
|
|||
09.04.2019, 13:42 |
|
|
start [/forum/topic.php?fid=53&fpage=42&tid=1995253]: |
0ms |
get settings: |
11ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
37ms |
get topic data: |
13ms |
get forum data: |
3ms |
get page messages: |
37ms |
get tp. blocked users: |
2ms |
others: | 14ms |
total: | 139ms |
0 / 0 |