powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Алгоритм
14 сообщений из 14, страница 1 из 1
Алгоритм
    #36695847
MIRNIY
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Как написать программу по нахождению частей речи с алгоритмической стороны?
Пример: на вход подаю текст, на выходе получаю последовательность записей с указанием частей речи. Естественно, с использованием таблиц БД с мин.количеством записи. Нет словаря с указанием частей речи (для казахского языка).

Может кто разрабатывал? Буду благодарен любому совету по теме .
...
Рейтинг: 0 / 0
Алгоритм
    #36695886
Фотография n_string
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Жаль, что вы создали такую интересную тему накануне выходных. По теме: следует написать стеммер, который и будет парсить все части речи. Вы с какой целью интересуетесь? Учеба или рабочее задание. От цели зависит реализация.
...
Рейтинг: 0 / 0
Алгоритм
    #36697084
Фотография MasterZiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
MIRNIY wrote:

> Как написать программу по нахождению частей речи с алгоритмической стороны?

Часть речи в русском языке определяется достаточно просто (должна т.е. по
моим понятиям).
А именно:
-- определяется инфинитив слова -- начальная форма.
-- по словарю слово находится и определяется его часть речи.
Можно, если иметь словарь всех форм всех слов сразу искать
форму слова в словаре.

Возможно когда-то могут быть случаи, когда одно и то же слово
в инфинитиве (или в своих формах) может быть и одной частью речи,
и другой, но для русского это нетипично. А вот для английского --
ровно наоборот, там слово очень часто является и глаголом, и
существительным, и атрибутивной формой существительного, по
сути -- прилагательным. Хотя там и понятие "часть речи" другое,
вообще говоря.
Posted via ActualForum NNTP Server 1.4
...
Рейтинг: 0 / 0
Алгоритм
    #36697154
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
MIRNIYКак написать программу по нахождению частей речи с алгоритмической стороны?
Пример: на вход подаю текст, на выходе получаю последовательность записей с указанием частей речи. Естественно, с использованием таблиц БД с мин.количеством записи. Нет словаря с указанием частей речи (для казахского языка).
Парсер текста с частями речи - это тебе не сферический конь в вакууме. Боюсь что без словаря ты никуда не сдвинешся.
...
Рейтинг: 0 / 0
Алгоритм
    #36697161
miksoft
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
MasterZiv-- определяется инфинитив слова -- начальная форма.Это даже со словарем задача неоднозначная.
киев - это что, чей или чего?
мечи - это что или что делай?
полка - это что или чего?
...
Рейтинг: 0 / 0
Алгоритм
    #36697207
Фотография n_string
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Пару лет назад решал подобную задачу. Для начала отсекали последнюю букву в слове, получалась весьма удачная реализация. С начала тоже никто не верил, что это возможно.
...
Рейтинг: 0 / 0
Алгоритм
    #36697210
miksoft
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
n_stringотсекали последнюю букву в словеС какой целью, если не секрет?
...
Рейтинг: 0 / 0
Алгоритм
    #36697228
Фотография n_string
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
miksoftС какой целью, если не секрет?Снизить влияние окончаний и суффиксов. В итоге из слова выделялась морфема и сравнивалась из основного словаря, который тоже состоял из подобных морфем. Приемлимая скорость достигалась на побитовом сравнении по маске, метод описан в вики, лень искать, по имени ученого.
...
Рейтинг: 0 / 0
Алгоритм
    #36697266
Фотография MasterZiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
miksoft wrote:

> Это даже со словарем задача неоднозначная.
> киев - это что, чей или чего?

Это в любом случае существительное

> мечи - это что или что делай?

Ну, я про это говорил.

> полка - это что или чего?

я ж говорил, сначала инфинитив найти надо.

Но оно вообще говоря и ясно. В таких задачах не бывает
без исключений и сложностей. Если обращать внимание
на такие проблемы, задачу вообще нельзя решить.
Posted via ActualForum NNTP Server 1.4
...
Рейтинг: 0 / 0
Алгоритм
    #36697273
Фотография n_string
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
MasterZiv, последнее время мне как-то везет на подобные задачи, я уже даже начинаю смеяться, или сильная программа это когда ты можешь обработать только 90% результатов? Похоже на правду!
...
Рейтинг: 0 / 0
Алгоритм
    #36697289
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
n_stringMasterZiv, последнее время мне как-то везет на подобные задачи, я уже даже начинаю смеяться, или сильная программа это когда ты можешь обработать только 90% результатов? Похоже на правду!
Это ближе к экспертной системе чем просто к программе. Если ты выдашь точный результат с вероятность 97% - то ты крут, как варёные яйца! Главное не забудь предупредить заказчика что точность ответа будет сильно зависеть от актуальности словарей.

Всего!!
...
Рейтинг: 0 / 0
Алгоритм
    #36697355
Фотография MasterZiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
n_string wrote:

> MasterZiv, последнее время мне как-то везет на подобные задачи, я уже
> даже начинаю смеяться, или сильная программа это когда ты можешь

Ну так а что ты предложить можешь взамен ?
Идеи другие есть ?
Posted via ActualForum NNTP Server 1.4
...
Рейтинг: 0 / 0
Алгоритм
    #36697398
Фотография SQL_Lamer
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Эту задачу уже 50 лет решают - решить не могут толком.
Вон, Хомского почитайте.
...
Рейтинг: 0 / 0
Алгоритм
    #36697482
Фотография n_string
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
MasterZivНу так а что ты предложить можешь взамен ? Идеи другие есть ?Нет и еще раз нет. Нет в этом мире серебрянной пули. Но есть экономия рабочего времени, исключение утомительного ручного труда. Как-то написал утилиту, очень плохую, :( но меня поразил ее успех, (руководство не одобрило к применению в работе), люди использовали ее скрытно, но какое еще для разработчика нужно поощрение!

Что касается парсинга текстов, я работал наверное со всеми германскими и романскими языками. Что-то было проще, что-то сложнее, скажу только что результат был, поэтому все заявления о невозможности рассматриваю очень осторожно. Обычно, когда разговариваем с шефом на тему какого-нибудь проекта, я так и оговариваю, давайте построим модель, пусть мы потратим время и деньги, но точно оценим результаты успеха и прежде всего увидим экономическую выгоду, что самое важное.
...
Рейтинг: 0 / 0
14 сообщений из 14, страница 1 из 1
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Алгоритм
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]