Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Программирование [игнор отключен] [закрыт для гостей] / работа с текстом / 25 сообщений из 51, страница 1 из 3
04.03.2014, 16:07
    #38577935
luziferaza
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
Вечер добрый.

Кто-нибудь знает как программно определить признак существительного?
То есть из текста надо выделить все слова существительные. Я в голове-то такое правило не могу составить, не то что в коде.

Знатоки, прошу помощи :) прошу не куски готового кода, а скорее алгоритм...
...
Рейтинг: 0 / 0
04.03.2014, 16:08
    #38577937
Leonid Kudryavtsev
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
взять словарь
отсканировать
распознать FineReader'ом
...
Рейтинг: 0 / 0
04.03.2014, 16:14
    #38577942
luziferaza
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
Leonid Kudryavtsev,

вы придумали словарь существительных? может тогда отсканируете сами и мне пришлете?
...
Рейтинг: 0 / 0
04.03.2014, 16:32
    #38577969
Leonid Kudryavtsev
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
В любом нормальном словаре слова идут с примечанием в каком качестве оно может использоваться.

Просто сушествительных все равно недостаточно, даже для простых задач AFAIK как минимум нужно знать какого оно рода (муж, сред, женск)

Отсканировать и распознать - без проблем. Деньги готовь ))). Утром деньги, через месяц словарь в электронном варианте. Мало денег - словарь только существительных матерного языка, много - и слов много и не все матерные )))

Можно у Oracle купить. Вроде раньше называлось Oracle Context Cartridge (могу ошибаться). Словарь для русского языка продавался отдельно. Сколько стоит и правила использования по лицензии - можно спросить у продавцов Oracle.
...
Рейтинг: 0 / 0
04.03.2014, 16:36
    #38577974
Leonid Kudryavtsev
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
Для примера, посмотрите хотя бы на викесловарь . Все указано:
ВикисловарьСуществительное, неодушевлённое, мужской род, 2-е склонение (тип склонения 5b по классификации А. Зализняка); также предикатив, наречие.

Корень .... суффикс: -ец.
...
...
Рейтинг: 0 / 0
04.03.2014, 17:06
    #38578023
luziferaza
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
Leonid Kudryavtsev,

Леонид вы сюда пришли количество сообщений вашего профиля накручивать? Ни слова по теме, зато сколько букв.

Использовать словари не разрешено. Есть просто текст. Узнать количество существительных. И в скобочках после каждого слова увы род не написан знаете ли.
Для выполнения задачи мне необходим лишь нормальный алгоритм хотя бы на словах для определения существительное ли слово.
Считайте что я на паскале пишу. Какие словари? Как тут быть?!

Вот например все знают что слон это существительное. А почему? Окончание слова нулевое и все?
А например "крой". Конец слова "-ой" казалось бы. Но ведь есть "худой" и там снова "-ой". Только одно существительное, а другое прилагательные.

Алгоритм, как в статье Определение части речи слишком примитивен....
...
Рейтинг: 0 / 0
04.03.2014, 17:37
    #38578078
Akina
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
Одно и то же по написанию слово в зависимости от контекста может быть и существительным, и другой частью речи. Так что без анализа всей фразы задача в принципе нерешаемая. Да и с анализом не всегда...

Косил косой косой косой косой Косой траву
...
Рейтинг: 0 / 0
04.03.2014, 17:38
    #38578083
Akina
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
luziferazaнапример "крой". Конец слова "-ой" казалось бы. Но ведь есть "худой" и там снова "-ой". Только одно существительное, а другое прилагательные.
Крой, Вася, бога нет!
...
Рейтинг: 0 / 0
04.03.2014, 17:41
    #38578091
luziferaza
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
Akina,

спасибо, я понимаю. Так и выведу на экран "задача не решаемая" :)
...
Рейтинг: 0 / 0
04.03.2014, 19:12
    #38578228
DarkMaster
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
luziferazaСчитайте что я на паскале пишу. Какие словари? Как тут быть?!


1) Любой нормальный паскаль позволяет работать с БД, в которую можно сгрузить твои существительные. На худой конец - их же можно записать в файл, который потом можно загрузить в память для ускорения процесса.
2) Без анализа всего текста - не получится.
3) Над распознаванием глаголов/существительных и т.п. бьются не один год - это одна из ключевых проблем как машинного перевода, так и ИИ.
...
Рейтинг: 0 / 0
04.03.2014, 19:33
    #38578240
mayton
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
luziferaza, скачай словарь существительных. Вроде гуглятся такие вещи.
...
Рейтинг: 0 / 0
04.03.2014, 21:29
    #38578296
Akina
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
... а потом определяй, существительное или нет, методом Монте-Карло...
...
Рейтинг: 0 / 0
04.03.2014, 21:56
    #38578303
rockclimber
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
luziferazaИспользовать словари не разрешено."Мама мыла оконное стекло"
Удачи вам с алгоритмами без словарей... Да и со словарями удача понадобится.
...
Рейтинг: 0 / 0
04.03.2014, 23:28
    #38578344
Изопропил
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
А теперь Горбатый! Я сказал – Горбатый ...
...
Рейтинг: 0 / 0
05.03.2014, 10:01
    #38578514
luziferaza
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
mayton,

Выше написано, что использовать словарь ЗАПРЕЩЕНО. Гуглятся. А то я не знаю, что такое гугл... Без комментариев.
...
Рейтинг: 0 / 0
05.03.2014, 10:24
    #38578541
Dima T
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
luziferazaКто-нибудь знает как программно определить признак существительного?
luziferazaИспользовать словари не разрешено. Есть просто текст. Узнать количество существительных.
Так какая же все-таки задача: узнать количество или выделить существительные?
Выделить без словарей невозможно, а прикинуть примерное количество можно попробовать статистическими методами. Заранее вычислить среднюю долю существительных в тексте.
...
Рейтинг: 0 / 0
05.03.2014, 14:36
    #38579035
Leonid Kudryavtsev
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
luziferazaДля выполнения задачи мне необходим лишь нормальный алгоритм хотя бы на словах для определения существительное ли слово. Считайте что я на паскале пишу...
На паскале не могу. Могу на Java. Пользуйтесь, я добрый:
Код: java
1.
2.
3.
4.
5.
6.
7.
    public String isNoun( String word ) {
        if ( Math.random() < 0.5 ) {
            return "Сушествительное";
        } else { 
            return "НЕ существительное";
        }
    }



luziferaza...А почему? Окончание слова нулевое и все?...

RTFM

Книжка 1 на выбор
Книжка 2 на выбор

====
когда 10 лет назад понадобилось сделать разбор текста и составление именного указателей для книги - задачу успешно решил. Правда вопросы были немного другие, типа
"О.-Р.де Монферан это имя человека, а Геракл и Дева Мария это кто такие?"
а Вы про существительные, скучно )))

А на Ваш вопрос, я ответ находил самостоятельно, где-то на 50-80 страничке учебника русского языка 3-его класса для средней школы. Там табличка окончаний существительных в разных падежах была. Почему, сразу Вас и обрадовал, что даже одного списка слов Вам 100% будет не достаточно, как минимум нужно знать еще род существительного.
...
Рейтинг: 0 / 0
05.03.2014, 14:58
    #38579067
luziferaza
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
Dima T,
а, собственно, чем эти задачи отличаются по сути? Зная все существительные не трудно посчитать их количество.

Leonid Kudryavtsev все юморим. Не совсем понятна ваша тонкая шуточка про окончание и книги на озоне. У Вас самого-то с морфологией как? P.S. ссылочки битые


Есть только книга. Всё! Больше ничего нет. Никаких словарей, никаких указаний рода. Есть просто слова. Нужно узнать существительное или нет. Вот так на вскидку. Да или нет. Без искусственного интеллекта, способного склонять слова и, узнав окончание, делать выводы.
...
Рейтинг: 0 / 0
05.03.2014, 15:01
    #38579073
Lelouch
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
Верните Random от 1 до количества слов, имхо, при заданных условиях это лучшее решение )
...
Рейтинг: 0 / 0
05.03.2014, 15:48
    #38579145
mayton
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
luziferazamayton,

Выше написано, что использовать словарь ЗАПРЕЩЕНО. Гуглятся. А то я не знаю, что такое гугл... Без комментариев.
Я продолжаю настаивать на использовании словаря.
...
Рейтинг: 0 / 0
05.03.2014, 23:09
    #38579579
rockclimber
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
luziferazaЕсть только книга. Всё! Больше ничего нет. Никаких словарей, никаких указаний рода. Есть просто слова. Нужно узнать существительное или нет. Вот так на вскидку. Да или нет. Без искусственного интеллекта, способного склонять слова и, узнав окончание, делать выводы.Уже пять раз повторили - на нет и суда нет. Слово "стекло" - глагол или существительное? А "мыло"? А существительные с окончательными прилагательных (мороженое, пироженое, рабочий...) куда денешь?

luziferazaLeonid Kudryavtsev все юморим.Если ты будешь упорствовать в своем невежестве, кроме юмора увидишь разве что оскорбления.
...
Рейтинг: 0 / 0
06.03.2014, 10:06
    #38579756
luziferaza
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
rockclimber,

а вы у нас первый на очереди? Упорствовать в том, что я не знаю как решить проблему? Ничего некультурного не было написано.

Мною был задан вопрос и даны пояснения по заданию. Мне были даны в ответ куча советов, которые любой человек итак может получить,как выводы из своего же вопроса, погуглив.

Если никому нечего сказать кроме громкого "ЮЗАЙ СЛОВАРЬ!" и перечисления одинаковых слов разных частей речи, то комментарии излишни. Не надо даже тратить свое время на мой пост и тыкать по кнопочкам, чтобы еще раз показать мне истину.
...
Рейтинг: 0 / 0
06.03.2014, 13:44
    #38580141
mayton
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
luziferaza, а кто тебе поставил такую задачу?
...
Рейтинг: 0 / 0
06.03.2014, 14:12
    #38580187
Gwa
Gwa
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
luziferazarockclimber,

а вы у нас первый на очереди? Упорствовать в том, что я не знаю как решить проблему? Ничего некультурного не было написано.

Мною был задан вопрос и даны пояснения по заданию. Мне были даны в ответ куча советов, которые любой человек итак может получить,как выводы из своего же вопроса, погуглив.

Если никому нечего сказать кроме громкого "ЮЗАЙ СЛОВАРЬ!" и перечисления одинаковых слов разных частей речи, то комментарии излишни. Не надо даже тратить свое время на мой пост и тыкать по кнопочкам, чтобы еще раз показать мне истину.
Вам же советовали другой вариант (без словаря): берёте учебник русского языка
и по правилам учитывает изменение окончаний..
Да это будет не 100% попадание, но для большого текста процент
будет достаточно хороший
...
Рейтинг: 0 / 0
06.03.2014, 14:26
    #38580211
Leonid Kudryavtsev
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
работа с текстом
GwaВам же советовали другой вариант (без словаря): берёте учебник русского языка
Я такого не советовал.
GwaДа это будет не 100% попадание, но для большого текста процент будет достаточно хороший
Не знаю, что значит "достаточно хороший".

Но после прочтение учебника лично у меня пропало всякое желание пытаться сделать разбор без учета словаря. Даже наличие словаря слов, без знания рода (муж./жен./сред.) лично мне не помогало.

Задача автора совершенно не понятно, зачем нужно выделять существительные. Подозревая, что это лишь часть какого-то практического проекта. В этом случае, просто выделить существительные не достаточно. Обычно (лично у меня), возникает желание привести их к единственному числу именительного падежа. IMHO Сделать это без знания рода существительного не возможно.
...
Рейтинг: 0 / 0
Форумы / Программирование [игнор отключен] [закрыт для гостей] / работа с текстом / 25 сообщений из 51, страница 1 из 3
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]