powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Какие языки лучшие для парсинга?
25 сообщений из 32, страница 1 из 2
Какие языки лучшие для парсинга?
    #38225711
Pochemuchkin2011
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Какие языки посоветуете для парсинга других языков?
Наиболее эффективные и приспособленные для этого (или по каким-то другим причинам)?
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38225762
Фотография iv_an_ru
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Pochemuchkin2011,

Вы в курсе, что есть разные категории грамматик?
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38225823
Pochemuchkin2011
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
iv_an_ru,

Просветите. Мне нужно
а) для парсинга человеческих языков
б) для парсинга языков программирования/скриптов
в) для парсинга технических форматов (текстовых)
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38225848
Фотография ZyK_BotaN
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Pochemuchkin2011Какие языки посоветуете для парсинга других языков?
Наиболее эффективные и приспособленные для этого (или по каким-то другим причинам)?Языки с ADT. В первую очередь - хаскель.
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38225851
Фотография ZyK_BotaN
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ZyK_BotaNочередь - хаскель.вот неплохая либа:
http://www.haskell.org/haskellwiki/Parsec
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38225868
Фотография skyANA
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Pochemuchkin2011Какие языки посоветуете для парсинга других языков?
Наиболее эффективные и приспособленные для этого (или по каким-то другим причинам)? ANTLR
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38225916
Pochemuchkin2011
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ZyK_BotaN,

ADT - это Abstract Data Types или Algebraic Data Types?
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38225922
Vladimir Baskakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Хаскель - язык великолепный но гуманно ли рекомендовать его людям, не знающим про категории грамматик, и при этом предполагающим разбирать тексты на естественных языках?

Pochemuchkin2011, Уточните пожалуйста условия задачи.
для парсинга технических форматов (текстовых) - это не XML случайно?
б) для парсинга языков программирования/скриптов - а чего не взять уже что-то готовое? зачем велосипеды?
а) для парсинга человеческих языков - а тот случАй - всех злее будет... чего хотите то?
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38225927
Фотография iv_an_ru
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ZyK_BotaNPochemuchkin2011Какие языки посоветуете для парсинга других языков?
Наиболее эффективные и приспособленные для этого (или по каким-то другим причинам)?Языки с ADT. В первую очередь - хаскель.Злой вы. Человеку буквари нужны, а вы ему хаскель.
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38225957
Pochemuchkin2011
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
iv_an_ru,

Ну почему же прямо буквари - я естественно выучу параллельно языку и всё, что понадобится. Но для начала мне нужно парсить простые вещи (но на языке, на котором это удобнее всего делать), типа человесческих фраз, а затем уже перейти к более сложным вещам - давно уже хочу, но на классических языках это зубодробительно неудобно.

Vladimir Baskakov,

Vladimir BaskakovУточните пожалуйста условия задачи.
для парсинга технических форматов (текстовых) - это не XML случайно?
Нет, не XML, а просто разные форматы. Для XML же куча готовых библиотек под разные языки, а для этих нестандартных форматов нет или трудно адаптировать.

б) для парсинга языков программирования/скриптов - а чего не взять уже что-то готовое? зачем велосипеды?
А может я захочу свой язык написать? ;)

а) для парсинга человеческих языков - а тот случАй - всех злее будет... чего хотите то?
А вот с этого я хочу начать. Для начала распознавать части предложений, а потом видно будет.
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38225964
Фотография iv_an_ru
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Pochemuchkin2011iv_an_ru,

Ну почему же прямо буквари - я естественно выучу параллельно языку и всё, что понадобится. Но для начала мне нужно парсить простые вещи (но на языке, на котором это удобнее всего делать), типа человесческих фраз, а затем уже перейти к более сложным вещам - давно уже хочу, но на классических языках это зубодробительно неудобно.Из чтения букварей вы бы, например, узнали, что парсить предложения, а ещё лучше --- большие куски текста, _проще_, чем отдельные фразы.
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38226000
Vladimir Baskakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Нет, не XML, а просто разные форматы. Для XML же куча готовых библиотек под разные языки, а для этих нестандартных форматов нет или трудно адаптировать.
Если считать "разработку своего языка" и разбор текстов на естественных, что требует приличных знаний по лингвистике - пока фантазиями...

Текстовые технические форматы удобно разбирать с помощью регулярных выражений....
Встроенных в скриптовые языки начиная с PERL.

Pochemuchkin2011 - почитайте книжку про драконов. Если не найдете ее. То однако не судьба. Ссылку класть не стану из принципа.
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38226151
Фотография ZyK_BotaN
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Pochemuchkin2011ZyK_BotaN,

ADT - это Abstract Data Types или Algebraic Data Types?2-е
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38226163
Фотография ZyK_BotaN
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Vladimir Baskakovпри этом предполагающим разбирать тексты на естественных языках?как раз один из самых известных русских хаскелистов и автор книг по данному язычку, занимается работой с естественными текстами, ТС может у него проконсультироваться если есть вопросы. я о Душкине говорю...
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38226178
Фотография ZyK_BotaN
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
iv_an_ruZyK_BotaNпропущено...
Языки с ADT. В первую очередь - хаскель.Злой вы. Человеку буквари нужны, а вы ему хаскель.я, если честно, когда писал парсер на хацкеле, сам наступил на грабли своего непонимания хаскеля, но мне на лоре все быстро разъяснили.

т.е. сообщество хацкелистов - всегда готово помочь, если у новичка возникнут трудности.
если чего-то на лоре не знают, то на стековерфлове быстро ответят на самые экзотические вопросы по цацкелю.
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38226357
Фотография AlexandrPlus
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Pochemuchkin2011iv_an_ru,

Просветите. Мне нужно
а) для парсинга человеческих языков
б) для парсинга языков программирования/скриптов
в) для парсинга технических форматов (текстовых)

Прологи и Рефал не забыть - довольно ловко с помощью них получается
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38226378
Фотография iv_an_ru
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AlexandrPlusPochemuchkin2011iv_an_ru,

Просветите. Мне нужно
а) для парсинга человеческих языков
б) для парсинга языков программирования/скриптов
в) для парсинга технических форматов (текстовых)

Прологи и Рефал не забыть - довольно ловко с помощью них получаетсяКак автор одной из реализаций РЕФАЛА могу "утешить", что отладка рефаловской программы быстро загонит в психушку любого чайника. РЕФАЛ --- это такой ultima ratio regum: если можно без него, то лучше без него :)
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38226424
Vladimir Baskakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AlexandrPlusПрологи и Рефал не забыть - довольно ловко с помощью них получается
каждый питон свое руби хвалит.
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38226443
Vladimir Baskakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Pochemuchkin2011(или по каким-то другим причинам)?
Авторы хаскелей, прологов, лиспов, перлов, питонов и руби и рефалов довольно ловко набросали все на С - С++.... оставив фундаментальные куроводства для начинающих идти тернистым путем познания.
http://ru.wikipedia.org/wiki/???????????:_????????,_??????????_?_???????????
Разобрав суть всяких конечный автоматов, грамматик по этим руководствам - можно перейти к чему душа лежит.
http://habrahabr.ru/post/170735/
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38226452
Фотография AlexandrPlus
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
iv_an_ruAlexandrPlusпропущено...


Прологи и Рефал не забыть - довольно ловко с помощью них получаетсяКак автор одной из реализаций РЕФАЛА могу "утешить", что отладка рефаловской программы быстро загонит в психушку любого чайника. РЕФАЛ --- это такой ultima ratio regum: если можно без него, то лучше без него :)

так речь-то не о языке программирования для домохозяек, а о красоте для обработки символьной информации

любой отлаженный исходник
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
*   Программа вводит одну строку символов,
*   разбивает ее на слова,
*   переставляет в обратном порядке буквы в каждом слове,
*   полученное печатает

$EXTRN CARD , PROUT ;
$ENTRY Go {
            = <Prout <Word <Card >>>;
          }

Word {
      e.1 ' ' e.2 = <Inverse e.1> ' ' <Word e.2>;
      e.1         = <Inverse e.1>;
     }

Inverse {
         s.a e.1 = <Inverse e.1> s.a;
                 = ;
        }

И может быть просто рефал-сообщество IDE не сделало и прочее, необходимое для практики?
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38226472
Vladimir Baskakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
рекурсия как рекурсия.
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38226495
Фотография iv_an_ru
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AlexandrPlusiv_an_ruпропущено...
Как автор одной из реализаций РЕФАЛА могу "утешить", что отладка рефаловской программы быстро загонит в психушку любого чайника. РЕФАЛ --- это такой ultima ratio regum: если можно без него, то лучше без него :)

так речь-то не о языке программирования для домохозяек, а о красоте для обработки символьной информации

любой отлаженный исходник
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
*   Программа вводит одну строку символов,
*   разбивает ее на слова,
*   переставляет в обратном порядке буквы в каждом слове,
*   полученное печатает

$EXTRN CARD , PROUT ;
$ENTRY Go {
            = <Prout <Word <Card >>>;
          }

Word {
      e.1 ' ' e.2 = <Inverse e.1> ' ' <Word e.2>;
      e.1         = <Inverse e.1>;
     }

Inverse {
         s.a e.1 = <Inverse e.1> s.a;
                 = ;
        }

И может быть просто рефал-сообщество IDE не сделало и прочее, необходимое для практики?Один тип данных --- маловато будет. RIGAL в этом смысле получше был, но тоже без особого восторга вспоминается. Серьёзное IDE писать --- фиг окупится, а без него язык не наберёт популярность достаточную, чтоб был смысл писать IDE. Да и писать некому --- Турчин умер, Климов занялся ML-ями, ну и я давно от той темы отошёл.
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38226796
Pochemuchkin2011
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
А зачем писать IDE, если можно написать плагин для Eclipse/Visual Studio/etc.?

ZyK_BotaNкак раз один из самых известных русских хаскелистов и автор книг по данному язычку, занимается работой с естественными текстами, ТС может у него проконсультироваться если есть вопросы. я о Душкине говорю...
А с естественными текстами на каких языках он работает, не знаете?

All:


Поскольку мне нужно для начала именно с человеческим языком разбираться, то задача сложнее, чем просто чистый парсер для языка программирования со строгими правилами синтаксиса.
Потому что в человеческих предложениях будут описки, ошибки, в том числе логическо-смысловые. То есть могут отсутствовать знаки препинания и т.п. Я это осознал еще перед тем, как создать тему - именно поэтому классические языки (и так неприспособленные к парсингу) здесь не подходят. Придется не просто парсить и выдавать сообщения об ошибках синтаксиса, а парсить и оценивать вероятность ошибок или принадлежности к частям речи, на основе оценок принимать решения или выдавать возможные варианты. В общем, нечеткая логика , с вероятностным моментом. В лингвистике я как-нибудь разберусь, теория не проблема. Мне инструмент нужен.
Какие языки могут облегчить эту задачу?

Вот что пока предложили:

Haskell + Parsec
ANTLR
Пролог(-и)
РЕФАЛ
RIGAL
Языки с Algebraic Data Types (согласно Wiki это F#, Visual Prolog, OCaml, Scala, Standard ML, Nemerle, haXe, тот же Haskell и др.)
(?) Lisp, Python, Ruby, JavaScript

Что, как Вы думаете, лучше для такой задачи? Или предложите что-то своё.
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38226799
Фотография ZyK_BotaN
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Pochemuchkin2011А с естественными текстами на каких языках он работает, не знаете?как минимум - русский.
...
Рейтинг: 0 / 0
Какие языки лучшие для парсинга?
    #38226802
Фотография ZyK_BotaN
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Pochemuchkin2011Haskell + Parsecесли задача сильно специфическая, то без парсека придется. сам язык располагает к написанию парсеров, в том числе с нетривиальной вероятностной логикой.

причем эту логику можно в монадки запрятать, что сделает описание грамматики читабельнее.
...
Рейтинг: 0 / 0
25 сообщений из 32, страница 1 из 2
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Какие языки лучшие для парсинга?
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]