Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / tsearch2 русский словарь / 6 сообщений из 6, страница 1 из 1
22.08.2008, 11:49
    #35501194
sourcer
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
tsearch2 русский словарь
CREATE TEXT SEARCH DICTIONARY russian_ispell (TEMPLATE = ispell,DictFile = russian, AffFile = russian, StopWords=russian);

делаю комманду

выдаел ошибку

ERROR: неверная последовательность байт имя кодировки "UTF8": 0xc0e1
HINT: This error can also happen if the byte sequence does not match the encoding expected by the server, which is controlled by "client_encoding".

Причем 0xc0e1 оначает ничто иное что "Аб"
Он почему то пытается читать как утф файл а этот файл win1251

client_encoding=win1251

В чем может быть проблема?
...
Рейтинг: 0 / 0
22.08.2008, 11:53
    #35501210
sourcer
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
tsearch2 русский словарь
Вобщем покопался нашел проблему...
в конфиге прописано жестко client_encoding=WIN1251
однако при старте

SHOW ALL;

показывает что этот параметр всеравно равен UNICODE

может из за этого проблема, но как поправить это?
...
Рейтинг: 0 / 0
22.08.2008, 13:13
    #35501459
Oleg Bartunov
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
tsearch2 русский словарь
sourcerCREATE TEXT SEARCH DICTIONARY russian_ispell (TEMPLATE = ispell,DictFile = russian, AffFile = russian, StopWords=russian);

делаю комманду

выдаел ошибку

ERROR: неверная последовательность байт имя кодировки "UTF8": 0xc0e1
HINT: This error can also happen if the byte sequence does not match the encoding expected by the server, which is controlled by "client_encoding".

Причем 0xc0e1 оначает ничто иное что "Аб"
Он почему то пытается читать как утф файл а этот файл win1251

client_encoding=win1251

В чем может быть проблема?

Словари должны быть в utf8 и все.
...
Рейтинг: 0 / 0
22.08.2008, 13:16
    #35501468
sourcer
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
tsearch2 русский словарь
А то что база в win1251 и репозиторий тоже ничего страшного?
...
Рейтинг: 0 / 0
22.08.2008, 13:28
    #35501502
sourcer
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
tsearch2 русский словарь
Oleg Bartunov sourcerCREATE TEXT SEARCH DICTIONARY russian_ispell (TEMPLATE = ispell,DictFile = russian, AffFile = russian, StopWords=russian);

делаю комманду

выдаел ошибку

ERROR: неверная последовательность байт имя кодировки "UTF8": 0xc0e1
HINT: This error can also happen if the byte sequence does not match the encoding expected by the server, which is controlled by "client_encoding".

Причем 0xc0e1 оначает ничто иное что "Аб"
Он почему то пытается читать как утф файл а этот файл win1251

client_encoding=win1251

В чем может быть проблема?

Словари должны быть в utf8 и все.

поробовал поднять в утф .... словарь поднялся но эффекта нету...
ts_debug возвращает пустоту.

Просто дело в том что база WIN1251 и репозиторий тоже в этой локале.
...
Рейтинг: 0 / 0
04.09.2008, 05:45
    #35521535
Dicor
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
tsearch2 русский словарь
Tsearch2 работает со словарем и базой в кодировке UTF-8. Если Ваше приложение работает в другой кодировке то меняете client_encoding на нужную кодировку в рамках сессии. server_encoding отвечает за кодировку базы.

При создании базы задайте кодировку UTF-8.
Код: plaintext
1.
2.
3.
4.
CREATE DATABASE main_db
  WITH OWNER = postgres
       ENCODING = 'UTF8'
       TABLESPACE = pg_default;
...
Рейтинг: 0 / 0
Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / tsearch2 русский словарь / 6 сообщений из 6, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]