Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Tsearch2 Поиск по украинскому тексту / 9 сообщений из 9, страница 1 из 1
15.12.2008, 15:28
    #35714905
ss25
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Tsearch2 Поиск по украинскому тексту
словарь нашел тут
но не пойму как сформировать нужные файлы
это не помогает
...
Рейтинг: 0 / 0
15.12.2008, 16:31
    #35715146
Oleg Bartunov
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Tsearch2 Поиск по украинскому тексту
ss25словарь нашел тут
но не пойму как сформировать нужные файлы
это не помогает

А что ты делал и как тебя отфутболили ?
...
Рейтинг: 0 / 0
15.12.2008, 21:38
    #35715776
ss25
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Tsearch2 Поиск по украинскому тексту
я не нашел де взять словари для стопслов и аффикс
...
Рейтинг: 0 / 0
16.12.2008, 00:57
    #35715931
ss25
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Tsearch2 Поиск по украинскому тексту
процесс пошел (создал конфигурацию на основе русской потом изменял, добавил словарь но нету стоп слов) но теперь возникла проблема такого плана >>не распознаются слова с апострафом<<

словарь mySpell отсюда ссылка

Код: plaintext
1.
2.
3.
SELECT name, to_tsvector('ukrainian', name) AS UA, to_tsvector('russian', name) AS RU FROM library.udc ORDER BY code

Комп'ютерна наука та технологія. Застосування комп'ютера |##| 'та': 2  'наука': 1  'технологія': 3  'застосування': 4  |##| 'та': 4  'комп': 1 , 7  'наук': 3  'ютер': 8  'ютерн': 2  'технологі': 5  'застосуван': 6  

Народ кто из Украины у кого настроен поиск для Украины поделитесь словарями и конфигами!!
...
Рейтинг: 0 / 0
16.12.2008, 19:47
    #35718290
ss25
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Tsearch2 Поиск по украинскому тексту
Процес застопорился на том что парсер который разбивает слова с апострофом
относя последний к blank (Space symbols)
в итоге получается два токена которые не распознаются словарем ((
...
Рейтинг: 0 / 0
16.12.2008, 20:59
    #35718399
ss25
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Tsearch2 Поиск по украинскому тексту
нагуглил такую тему тока за незнанием С не знаю как приделать под виндовс
http://www.sai.msu.su/~megera/postgres/gist/tsearch/V2/docs/HOWTO-parser-tsearch2.html
...
Рейтинг: 0 / 0
16.12.2008, 23:03
    #35718599
Степан H.
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Tsearch2 Поиск по украинскому тексту
возможно есть смысл упустить апостроф в процессе занесения информации в tsvector ?
...
Рейтинг: 0 / 0
16.12.2008, 23:18
    #35718626
Степан H.
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Tsearch2 Поиск по украинскому тексту
вот стоп слова. проверьте для себя кодировку файла.
...
Рейтинг: 0 / 0
17.12.2008, 14:38
    #35720097
ss25
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Tsearch2 Поиск по украинскому тексту
апостроф убрать не получится поскольку слова тогда не распознаются словарем.

п.с. за стоп слова спасибо.
...
Рейтинг: 0 / 0
Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Tsearch2 Поиск по украинскому тексту / 9 сообщений из 9, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]