|
|
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
Вечер добрый. Кто-нибудь знает как программно определить признак существительного? То есть из текста надо выделить все слова существительные. Я в голове-то такое правило не могу составить, не то что в коде. Знатоки, прошу помощи :) прошу не куски готового кода, а скорее алгоритм... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.03.2014, 16:07 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
взять словарь отсканировать распознать FineReader'ом ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.03.2014, 16:08 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
Leonid Kudryavtsev, вы придумали словарь существительных? может тогда отсканируете сами и мне пришлете? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.03.2014, 16:14 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
В любом нормальном словаре слова идут с примечанием в каком качестве оно может использоваться. Просто сушествительных все равно недостаточно, даже для простых задач AFAIK как минимум нужно знать какого оно рода (муж, сред, женск) Отсканировать и распознать - без проблем. Деньги готовь ))). Утром деньги, через месяц словарь в электронном варианте. Мало денег - словарь только существительных матерного языка, много - и слов много и не все матерные ))) Можно у Oracle купить. Вроде раньше называлось Oracle Context Cartridge (могу ошибаться). Словарь для русского языка продавался отдельно. Сколько стоит и правила использования по лицензии - можно спросить у продавцов Oracle. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.03.2014, 16:32 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
Для примера, посмотрите хотя бы на викесловарь . Все указано: ВикисловарьСуществительное, неодушевлённое, мужской род, 2-е склонение (тип склонения 5b по классификации А. Зализняка); также предикатив, наречие. Корень .... суффикс: -ец. ... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.03.2014, 16:36 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
Leonid Kudryavtsev, Леонид вы сюда пришли количество сообщений вашего профиля накручивать? Ни слова по теме, зато сколько букв. Использовать словари не разрешено. Есть просто текст. Узнать количество существительных. И в скобочках после каждого слова увы род не написан знаете ли. Для выполнения задачи мне необходим лишь нормальный алгоритм хотя бы на словах для определения существительное ли слово. Считайте что я на паскале пишу. Какие словари? Как тут быть?! Вот например все знают что слон это существительное. А почему? Окончание слова нулевое и все? А например "крой". Конец слова "-ой" казалось бы. Но ведь есть "худой" и там снова "-ой". Только одно существительное, а другое прилагательные. Алгоритм, как в статье Определение части речи слишком примитивен.... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.03.2014, 17:06 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
Одно и то же по написанию слово в зависимости от контекста может быть и существительным, и другой частью речи. Так что без анализа всей фразы задача в принципе нерешаемая. Да и с анализом не всегда... Косил косой косой косой косой Косой траву ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.03.2014, 17:37 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
luziferazaнапример "крой". Конец слова "-ой" казалось бы. Но ведь есть "худой" и там снова "-ой". Только одно существительное, а другое прилагательные. Крой, Вася, бога нет! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.03.2014, 17:38 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
Akina, спасибо, я понимаю. Так и выведу на экран "задача не решаемая" :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.03.2014, 17:41 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
luziferazaСчитайте что я на паскале пишу. Какие словари? Как тут быть?! 1) Любой нормальный паскаль позволяет работать с БД, в которую можно сгрузить твои существительные. На худой конец - их же можно записать в файл, который потом можно загрузить в память для ускорения процесса. 2) Без анализа всего текста - не получится. 3) Над распознаванием глаголов/существительных и т.п. бьются не один год - это одна из ключевых проблем как машинного перевода, так и ИИ. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.03.2014, 19:12 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
luziferaza, скачай словарь существительных. Вроде гуглятся такие вещи. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.03.2014, 19:33 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
... а потом определяй, существительное или нет, методом Монте-Карло... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.03.2014, 21:29 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
luziferazaИспользовать словари не разрешено."Мама мыла оконное стекло" Удачи вам с алгоритмами без словарей... Да и со словарями удача понадобится. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.03.2014, 21:56 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
А теперь Горбатый! Я сказал – Горбатый ... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.03.2014, 23:28 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
mayton, Выше написано, что использовать словарь ЗАПРЕЩЕНО. Гуглятся. А то я не знаю, что такое гугл... Без комментариев. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.03.2014, 10:01 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
luziferazaКто-нибудь знает как программно определить признак существительного? luziferazaИспользовать словари не разрешено. Есть просто текст. Узнать количество существительных. Так какая же все-таки задача: узнать количество или выделить существительные? Выделить без словарей невозможно, а прикинуть примерное количество можно попробовать статистическими методами. Заранее вычислить среднюю долю существительных в тексте. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.03.2014, 10:24 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
luziferazaДля выполнения задачи мне необходим лишь нормальный алгоритм хотя бы на словах для определения существительное ли слово. Считайте что я на паскале пишу... На паскале не могу. Могу на Java. Пользуйтесь, я добрый: Код: java 1. 2. 3. 4. 5. 6. 7. luziferaza...А почему? Окончание слова нулевое и все?... RTFM Книжка 1 на выбор Книжка 2 на выбор ==== когда 10 лет назад понадобилось сделать разбор текста и составление именного указателей для книги - задачу успешно решил. Правда вопросы были немного другие, типа "О.-Р.де Монферан это имя человека, а Геракл и Дева Мария это кто такие?" а Вы про существительные, скучно ))) А на Ваш вопрос, я ответ находил самостоятельно, где-то на 50-80 страничке учебника русского языка 3-его класса для средней школы. Там табличка окончаний существительных в разных падежах была. Почему, сразу Вас и обрадовал, что даже одного списка слов Вам 100% будет не достаточно, как минимум нужно знать еще род существительного. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.03.2014, 14:36 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
Dima T, а, собственно, чем эти задачи отличаются по сути? Зная все существительные не трудно посчитать их количество. Leonid Kudryavtsev все юморим. Не совсем понятна ваша тонкая шуточка про окончание и книги на озоне. У Вас самого-то с морфологией как? P.S. ссылочки битые Есть только книга. Всё! Больше ничего нет. Никаких словарей, никаких указаний рода. Есть просто слова. Нужно узнать существительное или нет. Вот так на вскидку. Да или нет. Без искусственного интеллекта, способного склонять слова и, узнав окончание, делать выводы. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.03.2014, 14:58 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
Верните Random от 1 до количества слов, имхо, при заданных условиях это лучшее решение ) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.03.2014, 15:01 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
luziferazamayton, Выше написано, что использовать словарь ЗАПРЕЩЕНО. Гуглятся. А то я не знаю, что такое гугл... Без комментариев. Я продолжаю настаивать на использовании словаря. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.03.2014, 15:48 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
luziferazaЕсть только книга. Всё! Больше ничего нет. Никаких словарей, никаких указаний рода. Есть просто слова. Нужно узнать существительное или нет. Вот так на вскидку. Да или нет. Без искусственного интеллекта, способного склонять слова и, узнав окончание, делать выводы.Уже пять раз повторили - на нет и суда нет. Слово "стекло" - глагол или существительное? А "мыло"? А существительные с окончательными прилагательных (мороженое, пироженое, рабочий...) куда денешь? luziferazaLeonid Kudryavtsev все юморим.Если ты будешь упорствовать в своем невежестве, кроме юмора увидишь разве что оскорбления. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.03.2014, 23:09 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
rockclimber, а вы у нас первый на очереди? Упорствовать в том, что я не знаю как решить проблему? Ничего некультурного не было написано. Мною был задан вопрос и даны пояснения по заданию. Мне были даны в ответ куча советов, которые любой человек итак может получить,как выводы из своего же вопроса, погуглив. Если никому нечего сказать кроме громкого "ЮЗАЙ СЛОВАРЬ!" и перечисления одинаковых слов разных частей речи, то комментарии излишни. Не надо даже тратить свое время на мой пост и тыкать по кнопочкам, чтобы еще раз показать мне истину. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.03.2014, 10:06 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
luziferaza, а кто тебе поставил такую задачу? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.03.2014, 13:44 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
luziferazarockclimber, а вы у нас первый на очереди? Упорствовать в том, что я не знаю как решить проблему? Ничего некультурного не было написано. Мною был задан вопрос и даны пояснения по заданию. Мне были даны в ответ куча советов, которые любой человек итак может получить,как выводы из своего же вопроса, погуглив. Если никому нечего сказать кроме громкого "ЮЗАЙ СЛОВАРЬ!" и перечисления одинаковых слов разных частей речи, то комментарии излишни. Не надо даже тратить свое время на мой пост и тыкать по кнопочкам, чтобы еще раз показать мне истину. Вам же советовали другой вариант (без словаря): берёте учебник русского языка и по правилам учитывает изменение окончаний.. Да это будет не 100% попадание, но для большого текста процент будет достаточно хороший ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.03.2014, 14:12 |
|
||
|
работа с текстом
|
|||
|---|---|---|---|
|
#18+
GwaВам же советовали другой вариант (без словаря): берёте учебник русского языка Я такого не советовал. GwaДа это будет не 100% попадание, но для большого текста процент будет достаточно хороший Не знаю, что значит "достаточно хороший". Но после прочтение учебника лично у меня пропало всякое желание пытаться сделать разбор без учета словаря. Даже наличие словаря слов, без знания рода (муж./жен./сред.) лично мне не помогало. Задача автора совершенно не понятно, зачем нужно выделять существительные. Подозревая, что это лишь часть какого-то практического проекта. В этом случае, просто выделить существительные не достаточно. Обычно (лично у меня), возникает желание привести их к единственному числу именительного падежа. IMHO Сделать это без знания рода существительного не возможно. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.03.2014, 14:26 |
|
||
|
|

start [/forum/topic.php?fid=16&tid=1341439]: |
0ms |
get settings: |
9ms |
get forum list: |
9ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
161ms |
get topic data: |
6ms |
get forum data: |
1ms |
get page messages: |
36ms |
get tp. blocked users: |
1ms |
| others: | 228ms |
| total: | 455ms |

| 0 / 0 |
