Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Java [игнор отключен] [закрыт для гостей] / Apache Lucene генерация возможных словоформ / 3 сообщений из 3, страница 1 из 1
16.12.2015, 16:48
    #39129977
just_vladimir
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Apache Lucene генерация возможных словоформ
Есть задача из нормальной формы слова сгенерировать всевозможные варианты словоформ, подскажите, можно ли такое провернуть используя Apache Lucene? Нужно примерно тоже самое, что делается в этом вопросе с помощью hunspell, но мне нужно, чтобы это можно было сделать чисто на java/
На текущий момент для русского языка нагуглил https://github.com/AKuznetsov/russianmorphology, но с помощью этого пока получается решить только обратную задачу по произвольной словоформе получить нормальную форму.

Есть у кого нибудь подобный опыт?
...
Рейтинг: 0 / 0
17.12.2015, 15:56
    #39130955
rdm
rdm
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Apache Lucene генерация возможных словоформ
just_vladimir, посмотри http://www.basistech.com/
...
Рейтинг: 0 / 0
17.12.2015, 16:37
    #39131016
mayton
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Apache Lucene генерация возможных словоформ
Можно посмотреть исходники алгоритма Snowball. Он делает обратную задачу. Токенизирует слова.
По сути ищет приставки, суффиксы и окончания. И приводит к корню.

И как-то вывести из него обратную формулу. Тоесть взяв любой корень генерировать различные
производные лексемы.

По сабжу я не уверен что они будут иметь смысл с точки зрения русского языка. Но думаю
для тестов автора пойдет.
...
Рейтинг: 0 / 0
Форумы / Java [игнор отключен] [закрыт для гостей] / Apache Lucene генерация возможных словоформ / 3 сообщений из 3, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]