powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / MySQL [игнор отключен] [закрыт для гостей] / распознавание языка
4 сообщений из 4, страница 1 из 1
распознавание языка
    #33116627
Илья*
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Может быть кто нибудь знает, как распознать, на каком языке написан строковой элемент в базе MySQL?
Т.е. в базе данных есть поле "цитата", в котором могут быть занесены цитаты как на русском так и на английском языке. Хотелось бы их уметь запросом отделять друг от друга.
...
Рейтинг: 0 / 0
распознавание языка
    #33118375
Фотография Dmitry Arefiev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Если не вдаваться в MySQL, то возможно сделать эмпирическую оценку, основанную на частоте использования букв в том или ином языке. Если про английский и русский, то в одном английский алфавит, а в другом русский (извините за предложение :) - еще проще. Т.е. если 'a', 'e', 'o' латинские есть в строке, то английский, если 'а', 'е', 'и' русские - русский язык. Я бы начал с этого ...

Удачи,
Дмитрий

--
AnyDAC ( www.da-soft.com ) - Oracle, MySQL, MSSQL, MSAccess, IBM DB2,
Sybase ASA, DbExpress, ODBC freeware data access framework.
...
Рейтинг: 0 / 0
распознавание языка
    #33118468
Илья*
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Спасибо, Дмитрий

У меня была другая идея, похожая на Вашу. Я думаю, что можно подсчитать среднее значения кодов ASCII, скажем, первых десяти символов и в зависимости от его величины принимать решения о языке.

Однако, на мой взгляд, это немного искусственные решения. Хотелось бы чего-нибудь straight-forward.
...
Рейтинг: 0 / 0
распознавание языка
    #33118502
Фотография Dmitry Arefiev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Илья*Хотелось бы чего-нибудь straight-forward.
А вот это на каком языке ? :) Я думаю тогда без семантического / лингвистического анализа не обойтись. А это будет слишком много кода для такой задачи. Я бы пошел простым путем и улучшал код по мере накопления статистики неудачных распознаваний ...

Удачи,
Дмитрий
...
Рейтинг: 0 / 0
4 сообщений из 4, страница 1 из 1
Форумы / MySQL [игнор отключен] [закрыт для гостей] / распознавание языка
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]