|
|
|
Какие языки лучшие для парсинга?
|
|||
|---|---|---|---|
|
#18+
авторлучше для такой задачи наработать ТЗ, описать подходы и алгоритм на русском языке, замакетировать куски на том языке программирования, который близок и понятен уже сейчас, провести обзор по библиотекам для работы с текстом на этом языке программирования, посмотреть адаптацию библиотек к целевому естественному языку, хотя бы кратко описать особенности синтаксиса и морфологии целевого естественного языка, посмотреть, как работают опен-сорсные системы полнотекстового поиска, посмотреть, как интегрируется текущий любимый ЯП с другими, ЯП, для которых есть хорошие библиотеки. Этот цикл прогнать 2-3 раза, чтобы почувствовать предметку. Пару месяцев сидел в одной комнате с господами из http://megaputer.ru/ - так ничего. На плюсах. О том как перестать беспокоится и начать жить писал Д.К. мотивирующие рекламные ролики на русском языке http://www.eralash.ru/video/бразильская-система С уважением, Вр. и.о. КО ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.04.2013, 09:34 |
|
||
|
Какие языки лучшие для парсинга?
|
|||
|---|---|---|---|
|
#18+
(временами жалею, что постеснялся попросится в ученики. К мегапьютерам. Молодой был, тупой, нынче постарел - но не поумнел) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.04.2013, 09:37 |
|
||
|
Какие языки лучшие для парсинга?
|
|||
|---|---|---|---|
|
#18+
Проще всего для парсинга например brainfuck ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.04.2013, 14:38 |
|
||
|
Какие языки лучшие для парсинга?
|
|||
|---|---|---|---|
|
#18+
Pochemuchkin2011Поскольку мне нужно для начала именно с человеческим языком разбираться, то задача сложнее, чем просто чистый парсер для языка программирования со строгими правилами синтаксиса. Вообще-то, "человеческий язык" тоже имеет очень строгие правила синтаксиса - только их больше и они сложнее. Pochemuchkin2011Потому что в человеческих предложениях будут описки, ошибки, в том числе логическо-смысловые. То есть могут отсутствовать знаки препинания и т.п. Я это осознал еще перед тем, как создать тему - именно поэтому классические языки (и так неприспособленные к парсингу) здесь не подходят. Придется не просто парсить и выдавать сообщения об ошибках синтаксиса, а парсить и оценивать вероятность ошибок или принадлежности к частям речи, на основе оценок принимать решения или выдавать возможные варианты. В общем, нечеткая логика , с вероятностным моментом. В лингвистике я как-нибудь разберусь, теория не проблема. Мне инструмент нужен.Вам, я так думаю, для начала необходимо формальное описание синтаксиса. Если я верно помню, для этого лучше всего использовать форму Бэкуса-Наура И, наверное, правильный подход - начать с чего-нибудь более простого, чем "человеческий язык". Например с парсера какого-нибудь компьютерного языка... Pochemuchkin2011 Какие языки могут облегчить эту задачу? "Лучше всего с этой задачей поможет справиться язык, который Вы знаете" (с) Pochemuchkin2011Что, как Вы думаете, лучше для такой задачи? Или предложите что-то своё.Генератор синтаксических парсеров YACC (Yet Another Compiler Compiler): yacc — компьютерная программа, служащая стандартным генератором синтаксических анализаторов (парсеров) в Unix-системах. Название является акронимом «Yet Another Compiler Compiler» («ещё один компилятор компиляторов»). Yacc генерирует парсер на основе аналитической грамматики, описанной в нотации BNF (форма Бэкуса-Наура) или контекстно-свободной грамматики. На выходе yacc выдаётся код парсера на языке программирования Си.Обратите также внимание на ссылки на этой странице. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.04.2013, 01:35 |
|
||
|
Какие языки лучшие для парсинга?
|
|||
|---|---|---|---|
|
#18+
Pochemuchkin2011Просветите. Мне нужно а) для парсинга человеческих языков б) для парсинга языков программирования/скриптов в) для парсинга технических форматов (текстовых) Это все равно что спросить - мне нужен язык для вычислений а) прогнозов погоды б) допустимых прочностных нагрузок с) бухгалтерских балансов Вы не язык ищИте, а методы и их реализации. Язык же выберется сам исходя из удобства доступа к найденным реализациям. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.04.2013, 15:12 |
|
||
|
Какие языки лучшие для парсинга?
|
|||
|---|---|---|---|
|
#18+
Vladimir BaskakovХаскель - язык великолепный но гуманно ли рекомендовать его людям, не знающим про категории грамматик, и при этом предполагающим разбирать тексты на естественных языках? Хаскель сложен даже для специалистов. В Журнале ФП статья где один из "отцов" GHC признаёт что ожидает релизов более простого Haskell т.к. в том состоянии в отором он существует он обладает некоторой избыточностью. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.04.2013, 17:26 |
|
||
|
Какие языки лучшие для парсинга?
|
|||
|---|---|---|---|
|
#18+
maytonт.к. в том состоянии в отором он существует он обладает некоторой избыточностью.Да, он является полигоном для внедрения и тестирование новых фич, но никто ими пользоваться не заставляет. можно юзать подмножество ghc соответствующее стандарту 98-го хаскеля, а там избыточности не много. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.04.2013, 18:04 |
|
||
|
|

start [/forum/topic.php?fid=16&msg=38242037&tid=1341831]: |
0ms |
get settings: |
8ms |
get forum list: |
16ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
138ms |
get topic data: |
12ms |
get forum data: |
3ms |
get page messages: |
66ms |
get tp. blocked users: |
1ms |
| others: | 198ms |
| total: | 448ms |

| 0 / 0 |
