|
|
|
Алгоритм
|
|||
|---|---|---|---|
|
#18+
Как написать программу по нахождению частей речи с алгоритмической стороны? Пример: на вход подаю текст, на выходе получаю последовательность записей с указанием частей речи. Естественно, с использованием таблиц БД с мин.количеством записи. Нет словаря с указанием частей речи (для казахского языка). Может кто разрабатывал? Буду благодарен любому совету по теме . ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.06.2010, 23:21:07 |
|
||
|
Алгоритм
|
|||
|---|---|---|---|
|
#18+
Жаль, что вы создали такую интересную тему накануне выходных. По теме: следует написать стеммер, который и будет парсить все части речи. Вы с какой целью интересуетесь? Учеба или рабочее задание. От цели зависит реализация. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.06.2010, 00:27:43 |
|
||
|
Алгоритм
|
|||
|---|---|---|---|
|
#18+
MIRNIY wrote: > Как написать программу по нахождению частей речи с алгоритмической стороны? Часть речи в русском языке определяется достаточно просто (должна т.е. по моим понятиям). А именно: -- определяется инфинитив слова -- начальная форма. -- по словарю слово находится и определяется его часть речи. Можно, если иметь словарь всех форм всех слов сразу искать форму слова в словаре. Возможно когда-то могут быть случаи, когда одно и то же слово в инфинитиве (или в своих формах) может быть и одной частью речи, и другой, но для русского это нетипично. А вот для английского -- ровно наоборот, там слово очень часто является и глаголом, и существительным, и атрибутивной формой существительного, по сути -- прилагательным. Хотя там и понятие "часть речи" другое, вообще говоря. Posted via ActualForum NNTP Server 1.4 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2010, 18:02:41 |
|
||
|
Алгоритм
|
|||
|---|---|---|---|
|
#18+
MIRNIYКак написать программу по нахождению частей речи с алгоритмической стороны? Пример: на вход подаю текст, на выходе получаю последовательность записей с указанием частей речи. Естественно, с использованием таблиц БД с мин.количеством записи. Нет словаря с указанием частей речи (для казахского языка). Парсер текста с частями речи - это тебе не сферический конь в вакууме. Боюсь что без словаря ты никуда не сдвинешся. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2010, 19:06:05 |
|
||
|
Алгоритм
|
|||
|---|---|---|---|
|
#18+
MasterZiv-- определяется инфинитив слова -- начальная форма.Это даже со словарем задача неоднозначная. киев - это что, чей или чего? мечи - это что или что делай? полка - это что или чего? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2010, 19:11:36 |
|
||
|
Алгоритм
|
|||
|---|---|---|---|
|
#18+
Пару лет назад решал подобную задачу. Для начала отсекали последнюю букву в слове, получалась весьма удачная реализация. С начала тоже никто не верил, что это возможно. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2010, 19:50:17 |
|
||
|
Алгоритм
|
|||
|---|---|---|---|
|
#18+
n_stringотсекали последнюю букву в словеС какой целью, если не секрет? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2010, 19:51:42 |
|
||
|
Алгоритм
|
|||
|---|---|---|---|
|
#18+
miksoftС какой целью, если не секрет?Снизить влияние окончаний и суффиксов. В итоге из слова выделялась морфема и сравнивалась из основного словаря, который тоже состоял из подобных морфем. Приемлимая скорость достигалась на побитовом сравнении по маске, метод описан в вики, лень искать, по имени ученого. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2010, 20:05:07 |
|
||
|
Алгоритм
|
|||
|---|---|---|---|
|
#18+
miksoft wrote: > Это даже со словарем задача неоднозначная. > киев - это что, чей или чего? Это в любом случае существительное > мечи - это что или что делай? Ну, я про это говорил. > полка - это что или чего? я ж говорил, сначала инфинитив найти надо. Но оно вообще говоря и ясно. В таких задачах не бывает без исключений и сложностей. Если обращать внимание на такие проблемы, задачу вообще нельзя решить. Posted via ActualForum NNTP Server 1.4 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2010, 20:28:32 |
|
||
|
Алгоритм
|
|||
|---|---|---|---|
|
#18+
MasterZiv, последнее время мне как-то везет на подобные задачи, я уже даже начинаю смеяться, или сильная программа это когда ты можешь обработать только 90% результатов? Похоже на правду! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2010, 20:34:56 |
|
||
|
Алгоритм
|
|||
|---|---|---|---|
|
#18+
n_stringMasterZiv, последнее время мне как-то везет на подобные задачи, я уже даже начинаю смеяться, или сильная программа это когда ты можешь обработать только 90% результатов? Похоже на правду! Это ближе к экспертной системе чем просто к программе. Если ты выдашь точный результат с вероятность 97% - то ты крут, как варёные яйца! Главное не забудь предупредить заказчика что точность ответа будет сильно зависеть от актуальности словарей. Всего!! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2010, 20:47:04 |
|
||
|
Алгоритм
|
|||
|---|---|---|---|
|
#18+
n_string wrote: > MasterZiv, последнее время мне как-то везет на подобные задачи, я уже > даже начинаю смеяться, или сильная программа это когда ты можешь Ну так а что ты предложить можешь взамен ? Идеи другие есть ? Posted via ActualForum NNTP Server 1.4 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2010, 21:36:01 |
|
||
|
Алгоритм
|
|||
|---|---|---|---|
|
#18+
Эту задачу уже 50 лет решают - решить не могут толком. Вон, Хомского почитайте. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2010, 22:14:51 |
|
||
|
Алгоритм
|
|||
|---|---|---|---|
|
#18+
MasterZivНу так а что ты предложить можешь взамен ? Идеи другие есть ?Нет и еще раз нет. Нет в этом мире серебрянной пули. Но есть экономия рабочего времени, исключение утомительного ручного труда. Как-то написал утилиту, очень плохую, :( но меня поразил ее успех, (руководство не одобрило к применению в работе), люди использовали ее скрытно, но какое еще для разработчика нужно поощрение! Что касается парсинга текстов, я работал наверное со всеми германскими и романскими языками. Что-то было проще, что-то сложнее, скажу только что результат был, поэтому все заявления о невозможности рассматриваю очень осторожно. Обычно, когда разговариваем с шефом на тему какого-нибудь проекта, я так и оговариваю, давайте построим модель, пусть мы потратим время и деньги, но точно оценим результаты успеха и прежде всего увидим экономическую выгоду, что самое важное. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2010, 23:25:33 |
|
||
|
|

start [/forum/topic.php?fid=16&msg=36695886&tid=1343611]: |
0ms |
get settings: |
7ms |
get forum list: |
13ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
182ms |
get topic data: |
7ms |
get forum data: |
2ms |
get page messages: |
45ms |
get tp. blocked users: |
1ms |
| others: | 210ms |
| total: | 471ms |

| 0 / 0 |
