|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
Martin114, Проблема с Compreno в том, что работающего переводчика нет. Можно сколько угодно выкладывать "примеры" переводов, выполненных Compreno, но где доказательства, что это перевод программы, а не обманывание публики? Есть ли ПО, которое доступно широким массам и которое можно протестировать, что-то типа Google translate или Яндекс переводчика? Надеюсь у вас нет сомнений в том, что если бы Compreno действительно существовал и работал(!), то уже ABBYY не упустили бы шанса всем его продемонстрировать через веб-морду и пожинать заслуженные лавры? ... |
|||
:
Нравится:
Не нравится:
|
|||
19.12.2014, 11:38 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
474Martin114, Проблема с Compreno в том, что работающего переводчика нет. Можно сколько угодно выкладывать "примеры" переводов, выполненных Compreno, но где доказательства, что это перевод программы, а не обманывание публики? Есть ли ПО, которое доступно широким массам и которое можно протестировать, что-то типа Google translate или Яндекс переводчика? Надеюсь у вас нет сомнений в том, что если бы Compreno действительно существовал и работал(!), то уже ABBYY не упустили бы шанса всем его продемонстрировать через веб-морду и пожинать заслуженные лавры? Согласен, что Compreno - это еще сырая разработка, поэтому демонстрировать нечего. А если и был бы, потребовал бы таких ресурсов, что в вебе его вряд ли можно было бы продемонстрировать (хотя вообще можно было бы предусмотреть регистрацию желающих и назначение каждому места в очереди и промежутка времени для перевода, скажем, абзаца). ... |
|||
:
Нравится:
Не нравится:
|
|||
19.12.2014, 14:42 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
В Википедии есть статья Теория "Смысл-Текст" про историю работ по машинному переводу в СССР (под руководством Мельчука). Так что компьютерная лингвистика может оказаться рискованной областью, в ней и признанные корифеи терпели неудачу. Поэтому скепсис присутствующих вполне понятен. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.12.2014, 17:09 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
474Martin114, Надеюсь у вас нет сомнений в том, что если бы Compreno действительно существовал и работал(!), то уже ABBYY не упустили бы шанса всем его продемонстрировать через веб-морду и пожинать заслуженные лавры? Насчет веб-морды. Есть презентация Извлечение справочных данных из технических текстов на естественных языках . ... |
|||
:
Нравится:
Не нравится:
|
|||
19.12.2014, 22:36 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
474Martin114, Проблема с Compreno в том, что работающего переводчика нет. Можно сколько угодно выкладывать "примеры" переводов, выполненных Compreno, но где доказательства, что это перевод программы, а не обманывание публики? Есть ли ПО, которое доступно широким массам и которое можно протестировать, что-то типа Google translate или Яндекс переводчика? Надеюсь у вас нет сомнений в том, что если бы Compreno действительно существовал и работал(!), то уже ABBYY не упустили бы шанса всем его продемонстрировать через веб-морду и пожинать заслуженные лавры? Цитата отсюда : авторНам посчастливилось поработать как онтоинженерам с Compreno, и поучить его разбирать инженерные тексты (тексты железной инженерии). До «успешного внедрения» нам ещё далеко, но зато и причин скрывать наши результаты за NDA у нас тоже нет. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.12.2014, 23:25 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
Че Вы на ABBYY то зациклились? Сравнивали Abbyy и RCO, результат - в следующем году закупаем RCO FactExtractor. Почему: 1. цена 2. у Abbyy API к IIS привязано, а оно нам нафиг не нужно, так как сервер приложений свой. ... |
|||
:
Нравится:
Не нравится:
|
|||
20.12.2014, 08:35 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
AlexProOraЧе Вы на ABBYY то зациклились? Сравнивали Abbyy и RCO, результат - в следующем году закупаем RCO FactExtractor. Почему: 1. цена 2. у Abbyy API к IIS привязано, а оно нам нафиг не нужно, так как сервер приложений свой. О, спасибо за наводку. ... |
|||
:
Нравится:
Не нравится:
|
|||
20.12.2014, 19:03 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
AlexProOraЧе Вы на ABBYY то зациклились? Сравнивали Abbyy и RCO, результат - в следующем году закупаем RCO FactExtractor. Почему: 1. цена 2. у Abbyy API к IIS привязано, а оно нам нафиг не нужно, так как сервер приложений свой. Вы случайно не знаете, RCO на каком ЯП работают? (В ABBYY, как известно - на C#.) ... |
|||
:
Нравится:
Не нравится:
|
|||
20.12.2014, 23:06 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
Martin114Вы случайно не знаете, RCO на каком ЯП работают? (В ABBYY, как известно - на C#.) На каком написано? не знаю... Там dll-ка, примеры идут на С или С++ (не помню точно), мы будем использовать в связке с Delphi7. ... |
|||
:
Нравится:
Не нравится:
|
|||
21.12.2014, 11:24 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
474Martin114, Проблема с Compreno в том, что работающего переводчика нет. Можно сколько угодно выкладывать "примеры" переводов, выполненных Compreno, но где доказательства, что это перевод программы, а не обманывание публики? Есть ли ПО, которое доступно широким массам и которое можно протестировать, что-то типа Google translate или Яндекс переводчика? Надеюсь у вас нет сомнений в том, что если бы Compreno действительно существовал и работал(!), то уже ABBYY не упустили бы шанса всем его продемонстрировать через веб-морду и пожинать заслуженные лавры? Видимо, Compreno слишком громоздок, чтобы его можно было его просто так подключить в виде веб-морды. Кроме того, в него уже вложено 400 млн., так что бесплатным он быть не может. Хотя его можно использовать по схеме, по которой используется IBM Watson - в виде облака. ... |
|||
:
Нравится:
Не нравится:
|
|||
16.01.2015, 00:13 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
В ноябре 2013-го на Хабре опубликовали статью Анатолия Старостина, руководителя группы семантического анализа и преподавателем кафедры «Компьютерная лингвистика» в МФТИ. Он рассказал о работе своей группы, направлениях компьютерной лингвистики в ABBYY и кто такие онтоинженеры: ScienceHub #06: Компьютерная лингвистика . ... |
|||
:
Нравится:
Не нравится:
|
|||
24.01.2015, 21:13 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
Странно, что Вы так "прицепились" к Abbyy. В России есть множество других компаний, разрабатывающих подобные продукты (Yandex, AviComp, RCO, АйТеко, SyTech и др.), список см. Список программ , Список продуктов . Насчёт компьютерной лингвистики (КЛ), то мне видится, что на сегодняшний день тот очень ограниченный список реально востребованных задач КЛ "поделен" между крупными игроками. Несмотря на заклинания о востребованности и перспективности, крайне трудно найти коммерчески привлекательную задачу КЛ, поскольку 99% информационных потребностей подавляющего большинства пользователей (кстати, и мои в том числе) покрывает полнотекстовый поиск. Скажем, надежды на универсальный семантический поиск, увы, не оправдались. Можно реализовать неплохой семантический анализ, уметь прекрасно выделять именованные сущности, но зачем? И кому это надо? Видимо, в Abbyy только сейчас озаботились этими вопросами, когда практические задачи уже расхватали другие компании, возможно, с менее качественными движками. То есть Abbyy долго делали мотор, пока остальные делали автомобили. Вот как то так... ... |
|||
:
Нравится:
Не нравится:
|
|||
04.02.2015, 19:28 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
k.smith, большое спасибо за информацию. ... |
|||
:
Нравится:
Не нравится:
|
|||
05.02.2015, 11:21 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
k.smithСтранно, что Вы так "прицепились" к Abbyy. В России есть множество других компаний, разрабатывающих подобные продукты (Yandex, AviComp, RCO, АйТеко, SyTech и др.), список см. Список программ , Список продуктов . Насчёт компьютерной лингвистики (КЛ), то мне видится, что на сегодняшний день тот очень ограниченный список реально востребованных задач КЛ "поделен" между крупными игроками. Несмотря на заклинания о востребованности и перспективности, крайне трудно найти коммерчески привлекательную задачу КЛ, поскольку 99% информационных потребностей подавляющего большинства пользователей (кстати, и мои в том числе) покрывает полнотекстовый поиск. Скажем, надежды на универсальный семантический поиск, увы, не оправдались. Можно реализовать неплохой семантический анализ, уметь прекрасно выделять именованные сущности, но зачем? И кому это надо? А если сделать еще один шаг вперед: пользуясь синтактико-семантическими парсерами, автоматически из текста создавать базы знаний (например, в виде онтологий)? И потом работать со знаниями: классифицировать документы, извлекать данные, даже помогать в принятии решений по документам (привет искусственному интеллекту). ... |
|||
:
Нравится:
Не нравится:
|
|||
06.02.2015, 13:26 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
> крайне трудно найти коммерчески привлекательную задачу КЛ Элементарно. В т. ч. и для модного нынче анализа социальных сетей. > покрывает полнотекстовый поиск Вы ошибаетесь, если думаете, что где-то реализован публичный полнотекстовый поиск. ... |
|||
:
Нравится:
Не нравится:
|
|||
06.02.2015, 16:14 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
guest_20040621, >> крайне трудно найти коммерчески привлекательную задачу КЛ >Элементарно. В т. ч. и для модного нынче анализа социальных сетей. Этим много кто занимается. Вопрос только в заказчике с практической задачей, которому интересен анализ сетей или что бы то ни было ещё (перевод, сентиментный анализ, структурирование данных и пр.) и который готов поручить её именно вам/нам, а не какому-нибудь АйТеко. Это - ключевой вопрос, поскольку системы развиваются только на реальных задачах. Всё остальное уже мелочи. Я занимаюсь задачами КЛ 4 года, и считаю вопрос заказчика главным. >> покрывает полнотекстовый поиск >Вы ошибаетесь, если думаете, что где-то реализован публичный полнотекстовый поиск. Да ладно, та же открытая Lucene под разными платформами (Java, .Net), на этом конструкторе быстро реализуются полнотекстовые эффективные поисковики на миллионы документов (на миллиарды не проверял). ... |
|||
:
Нравится:
Не нравится:
|
|||
06.02.2015, 17:24 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
> Этим много кто занимается. Разумеется. И вы где-то правы, говоря о заказчике с практической задачей. Фишка в том, что часть таких задач - предмет текущих научных исследований, по которым нет готовых решений. > Я занимаюсь задачами КЛ 4 года, и считаю вопрос заказчика главным. Я так не думаю. Наиболее интересный вариант - новый рынок и массовый продукт. Это сложно, но реально. > та же открытая Lucene И что, есть публичный сервис с интересным для анализа хранилищем? ... |
|||
:
Нравится:
Не нравится:
|
|||
06.02.2015, 19:14 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
guest_20040621, >> Я занимаюсь задачами КЛ 4 года, и считаю вопрос заказчика главным. >Я так не думаю. Наиболее интересный вариант - новый рынок и массовый продукт. Это сложно, но реально. Особенность КЛ состоит в том, что массовый продукт на нём малореален в связи с тем, что массам это не надо. Возьмём самое востребованное направление - перевод. После того, как он встроен в Google и Yandex, про это направление можно забыть. Даже если сделать переводчик лучше (например, на базе Compreno, хотя тут большие сомнения), то его просто [почти] никто не купит - а зачем? Ну нет у массового пользователя потребностей, которые не решались бы полнотекстовым поиском и решались бы КЛ. Если Вы знаете о потребности хотя бы 1% пользователей (это уже будет массовый продукт!) - свяжитесь со мной по скайпу konstantin.smith , пожалуйста. Если это стоящая идея, то найдём и ресурсы, и финансирование к взаимной выгоде. >> та же открытая Lucene >И что, есть публичный сервис с интересным для анализа хранилищем? А всякие там файловые бесплатные хранилища, облака и пр.? И какой анализ? Массовому пользователю анализ не нужен. Корпоративные же системы, где возможен спеицифический анализ, не хранят свои данные в публичных хранилищах - кто ж согласится на это! ... |
|||
:
Нравится:
Не нравится:
|
|||
06.02.2015, 20:02 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
> Особенность КЛ состоит в том, что массовый продукт на нём малореален Вам так кажется, уверяю вас. Предположу, что в течение года - двух вы увидите и новый рынок, и новые продукты. > Возьмём самое востребованное направление - перевод. Вы, наверное, хотели сказать "самое очевидное"? Наиболее интересные задачи - в междисциплинарной области. > хотя бы 1% пользователей Я не говорил о потребительском рынке. > свяжитесь со мной Не интересно. Деньги - не проблема, просто не интересно. Вы пытаетесь заработать на технологии, тогда как на самом деле это инструмент для прикладных задач. А сформулировать эти задачи вы не можете: вы никогда не выходили за рамки конкретного заказчика. В России "платёжеспособный заказчик" очень часто синоним "тупой заказчик", есть такая особенность деловой практики. > А всякие там Всякие там хранилища - это хранилища, которые организовать и поддерживать стоит денег. Для удовлетворения праздного любопытства никто этим заниматься не будет. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2015, 00:43 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
>Вам так кажется, уверяю вас. Предположу, что в течение года - двух вы увидите и новый рынок, и новые продукты. Буду с нетерпением ждать! >Не интересно. Деньги - не проблема, просто не интересно. Ну если деньги - не проблема, тогда я Вас поздравляю! У меня где-то получается половина бесплатных проектов по КЛ, но без другой коммерческой половины не могу обойтись, так как живу на это. Хорошо, что хоть почти все проекты мне интересны. А мегаинтерес - когда за задачу КЛ платит заказчик, заинтересованный в результате. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2015, 15:30 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
Хорошая тема ... |
|||
:
Нравится:
Не нравится:
|
|||
18.02.2015, 16:46 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
k.smithНасчёт компьютерной лингвистики (КЛ), то мне видится, что на сегодняшний день тот очень ограниченный список реально востребованных задач КЛ "поделен" между крупными игроками. Несмотря на заклинания о востребованности и перспективности, крайне трудно найти коммерчески привлекательную задачу КЛ, поскольку 99% информационных потребностей подавляющего большинства пользователей (кстати, и мои в том числе) покрывает полнотекстовый поиск. Скажем, надежды на универсальный семантический поиск, увы, не оправдались. Можно реализовать неплохой семантический анализ, уметь прекрасно выделять именованные сущности, но зачем? И кому это надо? Видимо, в Abbyy только сейчас озаботились этими вопросами, когда практические задачи уже расхватали другие компании, возможно, с менее качественными движками. То есть Abbyy долго делали мотор, пока остальные делали автомобили. Вот как то так... А как насчет задач классификации и извлечения сущностей в системах электронного документооборота, например, в системах сбора маркетинговой информации? ... |
|||
:
Нравится:
Не нравится:
|
|||
04.03.2015, 21:39 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
Martin114, >А как насчет задач классификации и извлечения сущностей в системах электронного документооборота, например, в системах сбора маркетинговой информации? Хорошие задачи, но только для конкретной системы. Увы, не получается сделать что-то универсальное, но для конкретной системы ЭД при наличии некоторой потребности (например, по тексту документа предложить типовой маршрут согласования на основе информации о прохождении подобных документов) вполне очень даже. Для этого нужно всего ничего: 1) Найти организацию, в которой есть некоторая информационная система; 2) Найти некоторую информационную потребность, на которую сейчас уходит много времени сотрудников (а, следовательно, денег); 3) Понять, насколько её можно автоматизировать и какой при этом получится выигрыш для организации; 4) Оценить стоимость работы, чтобы она была существенно меньше выигрыша; 5) Найти в организации заинтересованных лиц, готовых лоббировать решение; Абстрактное решение этих задач, на мой взгляд, бесперспективно - слишком уж узкие потребности у конечных пользователей. ... |
|||
:
Нравится:
Не нравится:
|
|||
04.03.2015, 22:41 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
k.smith, эти 5 пунктов касается любой задачи ... |
|||
:
Нравится:
Не нравится:
|
|||
05.03.2015, 04:06 |
|
|
start [/forum/topic.php?fid=33&msg=38838533&tid=1547412]: |
0ms |
get settings: |
10ms |
get forum list: |
13ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
59ms |
get topic data: |
12ms |
get forum data: |
3ms |
get page messages: |
63ms |
get tp. blocked users: |
1ms |
others: | 296ms |
total: | 463ms |
0 / 0 |