Будущее компьютерной лингвистики / Разработка информационных систем

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Разработка информационных систем [игнор отключен] [закрыт для гостей] / Будущее компьютерной лингвистики

25 сообщений из 180, страница 6 из 8

все

Будущее компьютерной лингвистики

#38837929

474

Участник

Сообщения: 273

Рейтинг: 0 / 0

Martin114,

Проблема с Compreno в том, что работающего переводчика нет. Можно сколько угодно выкладывать "примеры" переводов, выполненных Compreno, но где доказательства, что это перевод программы, а не обманывание публики?
Есть ли ПО, которое доступно широким массам и которое можно протестировать, что-то типа Google translate или Яндекс переводчика?
Надеюсь у вас нет сомнений в том, что если бы Compreno действительно существовал и работал(!), то уже ABBYY не упустили бы шанса всем его продемонстрировать через веб-морду и пожинать заслуженные лавры?

...

Рейтинг:

0 / 0

19.12.2014, 11:38

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38838154

Martin114

Гость

474Martin114,

Проблема с Compreno в том, что работающего переводчика нет. Можно сколько угодно выкладывать "примеры" переводов, выполненных Compreno, но где доказательства, что это перевод программы, а не обманывание публики?
Есть ли ПО, которое доступно широким массам и которое можно протестировать, что-то типа Google translate или Яндекс переводчика?
Надеюсь у вас нет сомнений в том, что если бы Compreno действительно существовал и работал(!), то уже ABBYY не упустили бы шанса всем его продемонстрировать через веб-морду и пожинать заслуженные лавры?
Согласен, что Compreno - это еще сырая разработка, поэтому демонстрировать нечего. А если и был бы, потребовал бы таких ресурсов, что в вебе его вряд ли можно было бы продемонстрировать (хотя вообще можно было бы предусмотреть регистрацию желающих и назначение каждому места в очереди и промежутка времени для перевода, скажем, абзаца).

...

Рейтинг:

0 / 0

19.12.2014, 14:42

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38838367

Martin114

Гость

В Википедии есть статья Теория "Смысл-Текст" про историю работ по машинному переводу в СССР (под руководством Мельчука).
Так что компьютерная лингвистика может оказаться рискованной областью, в ней и признанные корифеи терпели неудачу.
Поэтому скепсис присутствующих вполне понятен.

...

Рейтинг:

0 / 0

19.12.2014, 17:09

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38838526

Martin114

Гость

474Martin114,
Надеюсь у вас нет сомнений в том, что если бы Compreno действительно существовал и работал(!), то уже ABBYY не упустили бы шанса всем его продемонстрировать через веб-морду и пожинать заслуженные лавры?
Насчет веб-морды. Есть презентация Извлечение справочных данных из технических текстов на естественных языках .

...

Рейтинг:

0 / 0

19.12.2014, 22:36

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38838533

Martin114

Гость

474Martin114,
Проблема с Compreno в том, что работающего переводчика нет. Можно сколько угодно выкладывать "примеры" переводов, выполненных Compreno, но где доказательства, что это перевод программы, а не обманывание публики?
Есть ли ПО, которое доступно широким массам и которое можно протестировать, что-то типа Google translate или Яндекс переводчика?
Надеюсь у вас нет сомнений в том, что если бы Compreno действительно существовал и работал(!), то уже ABBYY не упустили бы шанса всем его продемонстрировать через веб-морду и пожинать заслуженные лавры?
Цитата отсюда :
авторНам посчастливилось поработать как онтоинженерам с Compreno, и поучить его разбирать инженерные тексты (тексты железной инженерии). До «успешного внедрения» нам ещё далеко, но зато и причин скрывать наши результаты за NDA у нас тоже нет.

...

Рейтинг:

0 / 0

19.12.2014, 23:25

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38838616

AlexProOra

Участник

Сообщения: 456

Рейтинг: 0 / 0

Че Вы на ABBYY то зациклились?
Сравнивали Abbyy и RCO, результат - в следующем году закупаем RCO FactExtractor.
Почему:
1. цена
2. у Abbyy API к IIS привязано, а оно нам нафиг не нужно, так как сервер приложений свой.

...

Рейтинг:

0 / 0

20.12.2014, 08:35

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38838794

Martin114

Гость

AlexProOraЧе Вы на ABBYY то зациклились?
Сравнивали Abbyy и RCO, результат - в следующем году закупаем RCO FactExtractor.
Почему:
1. цена
2. у Abbyy API к IIS привязано, а оно нам нафиг не нужно, так как сервер приложений свой.
О, спасибо за наводку.

...

Рейтинг:

0 / 0

20.12.2014, 19:03

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38838851

Martin114

Гость

...

Рейтинг:

0 / 0

20.12.2014, 23:06

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38838930

AlexProOra

Участник

Сообщения: 456

Рейтинг: 0 / 0

Martin114Вы случайно не знаете, RCO на каком ЯП работают? (В ABBYY, как известно - на C#.)
На каком написано? не знаю...
Там dll-ка, примеры идут на С или С++ (не помню точно), мы будем использовать в связке с Delphi7.

...

Рейтинг:

0 / 0

21.12.2014, 11:24

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38855660

Martin114

Гость

474Martin114,

Проблема с Compreno в том, что работающего переводчика нет. Можно сколько угодно выкладывать "примеры" переводов, выполненных Compreno, но где доказательства, что это перевод программы, а не обманывание публики?
Есть ли ПО, которое доступно широким массам и которое можно протестировать, что-то типа Google translate или Яндекс переводчика?
Надеюсь у вас нет сомнений в том, что если бы Compreno действительно существовал и работал(!), то уже ABBYY не упустили бы шанса всем его продемонстрировать через веб-морду и пожинать заслуженные лавры?
Видимо, Compreno слишком громоздок, чтобы его можно было его просто так подключить в виде веб-морды. Кроме того, в него уже вложено 400 млн., так что бесплатным он быть не может.
Хотя его можно использовать по схеме, по которой используется IBM Watson - в виде облака.

...

Рейтинг:

0 / 0

16.01.2015, 00:13

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38862403

Martin114

Гость

В ноябре 2013-го на Хабре опубликовали статью Анатолия Старостина, руководителя группы семантического анализа и преподавателем кафедры «Компьютерная лингвистика» в МФТИ. Он рассказал о работе своей группы, направлениях компьютерной лингвистики в ABBYY и кто такие онтоинженеры: ScienceHub #06: Компьютерная лингвистика .

...

Рейтинг:

0 / 0

24.01.2015, 21:13

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38871725

k.smith

Гость

Странно, что Вы так "прицепились" к Abbyy. В России есть множество других компаний, разрабатывающих подобные продукты (Yandex, AviComp, RCO, АйТеко, SyTech и др.), список см. Список программ , Список продуктов .

Насчёт компьютерной лингвистики (КЛ), то мне видится, что на сегодняшний день тот очень ограниченный список реально востребованных задач КЛ "поделен" между крупными игроками. Несмотря на заклинания о востребованности и перспективности, крайне трудно найти коммерчески привлекательную задачу КЛ, поскольку 99% информационных потребностей подавляющего большинства пользователей (кстати, и мои в том числе) покрывает полнотекстовый поиск. Скажем, надежды на универсальный семантический поиск, увы, не оправдались.
Можно реализовать неплохой семантический анализ, уметь прекрасно выделять именованные сущности, но зачем? И кому это надо?
Видимо, в Abbyy только сейчас озаботились этими вопросами, когда практические задачи уже расхватали другие компании, возможно, с менее качественными движками. То есть Abbyy долго делали мотор, пока остальные делали автомобили.
Вот как то так...

...

Рейтинг:

0 / 0

04.02.2015, 19:28

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38872004

Martin114

Гость

k.smith, большое спасибо за информацию.

...

Рейтинг:

0 / 0

05.02.2015, 11:21

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38873319

Martin114

Гость

k.smithСтранно, что Вы так "прицепились" к Abbyy. В России есть множество других компаний, разрабатывающих подобные продукты (Yandex, AviComp, RCO, АйТеко, SyTech и др.), список см. Список программ , Список продуктов .

Насчёт компьютерной лингвистики (КЛ), то мне видится, что на сегодняшний день тот очень ограниченный список реально востребованных задач КЛ "поделен" между крупными игроками. Несмотря на заклинания о востребованности и перспективности, крайне трудно найти коммерчески привлекательную задачу КЛ, поскольку 99% информационных потребностей подавляющего большинства пользователей (кстати, и мои в том числе) покрывает полнотекстовый поиск. Скажем, надежды на универсальный семантический поиск, увы, не оправдались.
Можно реализовать неплохой семантический анализ, уметь прекрасно выделять именованные сущности, но зачем? И кому это надо?

А если сделать еще один шаг вперед: пользуясь синтактико-семантическими парсерами, автоматически из текста создавать базы знаний (например, в виде онтологий)? И потом работать со знаниями: классифицировать документы, извлекать данные, даже помогать в принятии решений по документам (привет искусственному интеллекту).

...

Рейтинг:

0 / 0

06.02.2015, 13:26

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38873538

guest_20040621

Гость

> крайне трудно найти коммерчески привлекательную задачу КЛ

Элементарно. В т. ч. и для модного нынче анализа социальных сетей.

> покрывает полнотекстовый поиск

Вы ошибаетесь, если думаете, что где-то реализован публичный полнотекстовый поиск.

...

Рейтинг:

0 / 0

06.02.2015, 16:14

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38873596

k.smith

Гость

guest_20040621,
>> крайне трудно найти коммерчески привлекательную задачу КЛ
>Элементарно. В т. ч. и для модного нынче анализа социальных сетей.

Этим много кто занимается. Вопрос только в заказчике с практической задачей, которому интересен анализ сетей или что бы то ни было ещё (перевод, сентиментный анализ, структурирование данных и пр.) и который готов поручить её именно вам/нам, а не какому-нибудь АйТеко. Это - ключевой вопрос, поскольку системы развиваются только на реальных задачах. Всё остальное уже мелочи. Я занимаюсь задачами КЛ 4 года, и считаю вопрос заказчика главным.

>> покрывает полнотекстовый поиск
>Вы ошибаетесь, если думаете, что где-то реализован публичный полнотекстовый поиск.

Да ладно, та же открытая Lucene под разными платформами (Java, .Net), на этом конструкторе быстро реализуются полнотекстовые эффективные поисковики на миллионы документов (на миллиарды не проверял).

...

Рейтинг:

0 / 0

06.02.2015, 17:24

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38873667

guest_20040621

Гость

> Этим много кто занимается.

Разумеется. И вы где-то правы, говоря о заказчике с практической задачей. Фишка в том, что часть таких задач - предмет текущих научных исследований, по которым нет готовых решений.

> Я занимаюсь задачами КЛ 4 года, и считаю вопрос заказчика главным.

Я так не думаю. Наиболее интересный вариант - новый рынок и массовый продукт. Это сложно, но реально.

> та же открытая Lucene

И что, есть публичный сервис с интересным для анализа хранилищем?

...

Рейтинг:

0 / 0

06.02.2015, 19:14

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38873699

k.smith

Гость

guest_20040621,

>> Я занимаюсь задачами КЛ 4 года, и считаю вопрос заказчика главным.
>Я так не думаю. Наиболее интересный вариант - новый рынок и массовый продукт. Это сложно, но реально.

Особенность КЛ состоит в том, что массовый продукт на нём малореален в связи с тем, что массам это не надо. Возьмём самое востребованное направление - перевод. После того, как он встроен в Google и Yandex, про это направление можно забыть. Даже если сделать переводчик лучше (например, на базе Compreno, хотя тут большие сомнения), то его просто [почти] никто не купит - а зачем? Ну нет у массового пользователя потребностей, которые не решались бы полнотекстовым поиском и решались бы КЛ.

Если Вы знаете о потребности хотя бы 1% пользователей (это уже будет массовый продукт!) - свяжитесь со мной по скайпу konstantin.smith , пожалуйста. Если это стоящая идея, то найдём и ресурсы, и финансирование к взаимной выгоде.

>> та же открытая Lucene
>И что, есть публичный сервис с интересным для анализа хранилищем?

А всякие там файловые бесплатные хранилища, облака и пр.? И какой анализ? Массовому пользователю анализ не нужен. Корпоративные же системы, где возможен спеицифический анализ, не хранят свои данные в публичных хранилищах - кто ж согласится на это!

...

Рейтинг:

0 / 0

06.02.2015, 20:02

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38873777

guest_20040621

Гость

> Особенность КЛ состоит в том, что массовый продукт на нём малореален

Вам так кажется, уверяю вас. Предположу, что в течение года - двух вы увидите и новый рынок, и новые продукты.

> Возьмём самое востребованное направление - перевод.

Вы, наверное, хотели сказать "самое очевидное"? Наиболее интересные задачи - в междисциплинарной области.

> хотя бы 1% пользователей

Я не говорил о потребительском рынке.

> свяжитесь со мной

Не интересно. Деньги - не проблема, просто не интересно. Вы пытаетесь заработать на технологии, тогда как на самом деле это инструмент для прикладных задач. А сформулировать эти задачи вы не можете: вы никогда не выходили за рамки конкретного заказчика. В России "платёжеспособный заказчик" очень часто синоним "тупой заказчик", есть такая особенность деловой практики.

> А всякие там

Всякие там хранилища - это хранилища, которые организовать и поддерживать стоит денег. Для удовлетворения праздного любопытства никто этим заниматься не будет.

...

Рейтинг:

0 / 0

07.02.2015, 00:43

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38873905

k.smith

Гость

>Вам так кажется, уверяю вас. Предположу, что в течение года - двух вы увидите и новый рынок, и новые продукты.
Буду с нетерпением ждать!

>Не интересно. Деньги - не проблема, просто не интересно.
Ну если деньги - не проблема, тогда я Вас поздравляю! У меня где-то получается половина бесплатных проектов по КЛ, но без другой коммерческой половины не могу обойтись, так как живу на это. Хорошо, что хоть почти все проекты мне интересны. А мегаинтерес - когда за задачу КЛ платит заказчик, заинтересованный в результате.

...

Рейтинг:

0 / 0

07.02.2015, 15:30

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38883122

sqluserX

Гость

Хорошая тема

...

Рейтинг:

0 / 0

18.02.2015, 16:46

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38895179

Martin114

Гость

k.smithНасчёт компьютерной лингвистики (КЛ), то мне видится, что на сегодняшний день тот очень ограниченный список реально востребованных задач КЛ "поделен" между крупными игроками. Несмотря на заклинания о востребованности и перспективности, крайне трудно найти коммерчески привлекательную задачу КЛ, поскольку 99% информационных потребностей подавляющего большинства пользователей (кстати, и мои в том числе) покрывает полнотекстовый поиск. Скажем, надежды на универсальный семантический поиск, увы, не оправдались.
Можно реализовать неплохой семантический анализ, уметь прекрасно выделять именованные сущности, но зачем? И кому это надо?
Видимо, в Abbyy только сейчас озаботились этими вопросами, когда практические задачи уже расхватали другие компании, возможно, с менее качественными движками. То есть Abbyy долго делали мотор, пока остальные делали автомобили.
Вот как то так...
А как насчет задач классификации и извлечения сущностей в системах электронного документооборота, например, в системах сбора маркетинговой информации?

...

Рейтинг:

0 / 0

04.03.2015, 21:39

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38895220

k.smith

Гость

Martin114, >А как насчет задач классификации и извлечения сущностей в системах электронного документооборота, например, в системах сбора маркетинговой информации?

Хорошие задачи, но только для конкретной системы. Увы, не получается сделать что-то универсальное, но для конкретной системы ЭД при наличии некоторой потребности (например, по тексту документа предложить типовой маршрут согласования на основе информации о прохождении подобных документов) вполне очень даже. Для этого нужно всего ничего:

1) Найти организацию, в которой есть некоторая информационная система;
2) Найти некоторую информационную потребность, на которую сейчас уходит много времени сотрудников (а, следовательно, денег);
3) Понять, насколько её можно автоматизировать и какой при этом получится выигрыш для организации;
4) Оценить стоимость работы, чтобы она была существенно меньше выигрыша;
5) Найти в организации заинтересованных лиц, готовых лоббировать решение;

Абстрактное решение этих задач, на мой взгляд, бесперспективно - слишком уж узкие потребности у конечных пользователей.

...

Рейтинг:

0 / 0

04.03.2015, 22:41

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38895340

ViPRos

Участник

Сообщения: 9 731

Рейтинг: 0 / 0

k.smith,

эти 5 пунктов касается любой задачи

...

Рейтинг:

0 / 0

05.03.2015, 04:06

| Ответить | Цитировать | Написать

Будущее компьютерной лингвистики

#38895368

SashaMercury

Участник

Откуда: Москва

Сообщения: 2 595

Рейтинг: 0 / 0

Ни разу не встретил словосочетание "Тест Тьюринга". Разве не от него нужно скакать при обсуждении данного вопроса ?

...

Рейтинг:

0 / 0

05.03.2015, 07:23

| Ответить | Цитировать | Написать

25 сообщений из 180, страница 6 из 8

все

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=33&msg=38838533&tid=1547412]:	0ms
get settings:	9ms
get forum list:	10ms
check forum access:	2ms
check topic access:	2ms
track hit:	109ms
get topic data:	8ms
get forum data:	2ms
get page messages:	54ms
get tp. blocked users:	1ms
others:	260ms

total:	457ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы