|
|
|
распознавание языка
|
|||
|---|---|---|---|
|
#18+
Может быть кто нибудь знает, как распознать, на каком языке написан строковой элемент в базе MySQL? Т.е. в базе данных есть поле "цитата", в котором могут быть занесены цитаты как на русском так и на английском языке. Хотелось бы их уметь запросом отделять друг от друга. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.06.2005, 20:39 |
|
||
|
распознавание языка
|
|||
|---|---|---|---|
|
#18+
Если не вдаваться в MySQL, то возможно сделать эмпирическую оценку, основанную на частоте использования букв в том или ином языке. Если про английский и русский, то в одном английский алфавит, а в другом русский (извините за предложение :) - еще проще. Т.е. если 'a', 'e', 'o' латинские есть в строке, то английский, если 'а', 'е', 'и' русские - русский язык. Я бы начал с этого ... Удачи, Дмитрий -- AnyDAC ( www.da-soft.com ) - Oracle, MySQL, MSSQL, MSAccess, IBM DB2, Sybase ASA, DbExpress, ODBC freeware data access framework. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.06.2005, 21:53 |
|
||
|
распознавание языка
|
|||
|---|---|---|---|
|
#18+
Спасибо, Дмитрий У меня была другая идея, похожая на Вашу. Я думаю, что можно подсчитать среднее значения кодов ASCII, скажем, первых десяти символов и в зависимости от его величины принимать решения о языке. Однако, на мой взгляд, это немного искусственные решения. Хотелось бы чего-нибудь straight-forward. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.06.2005, 00:18 |
|
||
|
распознавание языка
|
|||
|---|---|---|---|
|
#18+
Илья*Хотелось бы чего-нибудь straight-forward. А вот это на каком языке ? :) Я думаю тогда без семантического / лингвистического анализа не обойтись. А это будет слишком много кода для такой задачи. Я бы пошел простым путем и улучшал код по мере накопления статистики неудачных распознаваний ... Удачи, Дмитрий ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.06.2005, 02:42 |
|
||
|
|

start [/forum/topic.php?fid=47&msg=33118375&tid=1853941]: |
0ms |
get settings: |
5ms |
get forum list: |
13ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
172ms |
get topic data: |
9ms |
get forum data: |
2ms |
get page messages: |
49ms |
get tp. blocked users: |
1ms |
| others: | 203ms |
| total: | 458ms |

| 0 / 0 |
