powered by simpleCommunicator - 2.0.52     © 2025 Programmizd 02
Форумы / Разработка информационных систем [игнор отключен] [закрыт для гостей] / Будущее компьютерной лингвистики
25 сообщений из 180, страница 3 из 8
Будущее компьютерной лингвистики
    #38720651
Martin114
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Leonid KudryavtsevА вот, что сама компания Abby считает "исследованиями" ( http://www.abbyy.ru/vacancy/)

Исследования и разработкa

Инженер по тестированию ПО (DataCapture)
Интерфейс-дизайнер
Специалист службы технической поддержки (продукты для разработчиков)
C++ разработчик (Технологии)
Инженер по тестированию ПО (Технологии)
C++ разработчик (PDFTools)
Инженер по тестированию ПО (FineReader)
Заместитель директора продуктового департамента (Headquarters)
Web-аналитик
С++ разработчик без опыта

Но поскольку топикастер C++ не знает...
Вообще-то в ABBYY в основном пишут софт не на C++, а на C#. Одна моя знакомая работала так по аутсорсу с ABBYY.
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38720657
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник

Свои претензии к публикации их докладов я уже высказал.

Кто такой автор, какая у него должность (если он говорит от лица организации), какие у него научные звания (если он ученый). Ничего нет. С таким же успехом, я могу на ближайшем заборе публиковаться. Или дома, на стенке лифта. Там полно таких публикаций. И так же подписываются "Вася", "Игорек" и так далее.

Т.ч. мне, лично, научной деятельности и публикаций и дома в лифте хватает

Кто верстал сборник докладов конференции Диалог - на мой взгляд должен убится ап стену. Повторюсь матом e#$^#ый п#$^#ц.

P.S.
Нашел только одну ссылку на старый доклад, на конференции EVA. После доклада, указан автор доклада, его должность, "заслуги".
conf.cpic.ru/eva99/rus/Zas2-R/dR2-6.doc
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38720660
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Martin114Вообще-то в ABBYY в основном пишут софт не на C++, а на C#. Одна моя знакомая работала так по аутсорсу с ABBYY.
Ссылка и цитата с сайта Abbyy. Открытые у них вакансии.

Думаю, им лучше знать, на чем они пишут и какие специалисты им нужны )))
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38720730
Martin114
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Leonid Kudryavtsev

Свои претензии к публикации их докладов я уже высказал.

Кто такой автор, какая у него должность (если он говорит от лица организации), какие у него научные звания (если он ученый). Ничего нет. С таким же успехом, я могу на ближайшем заборе публиковаться. Или дома, на стенке лифта. Там полно таких публикаций. И так же подписываются "Вася", "Игорек" и так далее.

Т.ч. мне, лично, научной деятельности и публикаций и дома в лифте хватает

Кто верстал сборник докладов конференции Диалог - на мой взгляд должен убится ап стену. Повторюсь матом e#$^#ый п#$^#ц.

P.S.
Нашел только одну ссылку на старый доклад, на конференции EVA. После доклада, указан автор доклада, его должность, "заслуги".
conf.cpic.ru/eva99/rus/Zas2-R/dR2-6.doc

На странице 5 этого сборника есть список рецензентов, они отвечают за качество публикаций.
Leonid KudryavtsevКто такой автор, какая у него должность (если он говорит от лица организации), какие у него научные звания (если он ученый). Ничего нет.
О качестве публикации говорит не список регалий автора. За нее отвечает оргкомитет и рецензенты (и список ссылок на нее говорит многое, если он есть). Когда Альберт Эйнштейн опубликовал в "Annalen der physik" свою теорию относительности, он тоже был никем и звать его было никак.
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38720765
Martin114
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Первое решение на базе новой технологии получило название Abbyy Intelligent Search. Оно предназначено для поиска в корпоративных системах и предоставляет результаты поиска с высокой релевантностью, поскольку учитывает не только все формы слов, но и их значения, смысловые связи между словами, расстояние между словами в искомой фразе и контекст употребления, рассказали CNews в Abbyy.

Важной особенностью смыслового анализа документов является тот факт, что в результатах поиска есть возможность фильтровать слова по их значениям. Пользователь может выбрать, хочет ли он найти среди документов, например, слово «fire» в значении «стрелять», «поджигать» или «увольнять».

Второе из представленных решений, Abbyy Intelligent Tagger, автоматически находит в текстах так называемые «сущности» (названия организаций, персон, гео-объекты, даты и денежные суммы) и размещает их в метаданных документа. В результате, информацию в корпоративных хранилищах можно классифицировать, сортировать или фильтровать по какому-либо признаку.

"Используя выявленные сущности, можно качественно улучшить целый ряд организационных процессов, связанных с анализом содержимого и ключевых параметров документов. Например, повысить приоритет обработки документов, поступающих от самых важных клиентов, создать правила для автоматического сбора сведений о клиенте или партнере, оптимизировать маршрутизацию документа по определенным критериям бизнес-процессов, упростить очистку документов от персональных и конфиденциальных данных", — говорят в Abbyy.
Интересно, на этом форуме есть специалисты, которые занимаются корпоративными базами документов? Как они могут оценить вышепредложенные инструменты? Насколько это актуально?
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38720777
alex55555
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Martin114выяснить, стоит ли вообще заниматься научной работой в области компьютерной лингвистики (КЛ)
Если ради денег - наверное не стоит. Работайте программистом, денег будет больше.
Martin114В Москве КЛ занимаются в фирме ABBYY, руководит научной работой Селегей Владимир Павлович. В Москве, Питере и Нижнем Новгороде в ряде вузов открыты кафедры КЛ, что говорит о востребованности специалистов КЛ например, в той же ABBYY. В мире же можно получить понятие о современном состоянии КЛ по MIT-му журналу Computational Linguistics .
Принципиальная востребованность неких технологий должна быть сконвертирована в вашу зарплату. Этим занимаются конторы типа ABBYY или Google. Если вы хотите зарабатывать и при этом ещё и оставаясь в лингвистике (совмещая приятное с полезным), то в конторах типа ABBYY или Google вам предстоит этап "меня должны заметить". Как уж вы им себя разрекламируете - вопрос непростой, можно свои работы им слать, можно в гости ходить, можно резюме с особо умными достижениями отправить. И если на вас в конце концов обратят внимание вас пустят по стандартной цепочке собеседования, когда ихние архитекторы или кто-то вроде того зададутся вопросом - зачем мне в штат этот человек ? Ваша задача на собеседованиях будет состоять в доказательстве вашей ценности, но не только. Архитектору ещё важно быть уверенным, что вы не составите ему конкуренцию, не начнёте вести пропаганду своих идей и другими способами портить ему жизнь. Ну и наконец, если чел из какого-то отдела, куда вас пошлют собеседоваться, решит, что вы можете быть полезны и одновременно в отделе есть вакансия - возможно вам эту вакансию предложат.

Хотя если у вас в области лингвистики есть международно известное имя - с вами могут гораздо более мягкие переговоры вести.

Ну и общее - не путайте науку и бизнес. Бизнесу нужны продажи, а перспективные разработки у них и так есть, западные статьи они читать умеют, на конференциях и прочих мероприятиях информацию собирают, что-то там себе анализируют и и обобщают. Работу же они вам предложат только рутинную, ибо своих архитекторов (ну или как там называют главных учёных) там и так хватает. И даже что бы предложили работу близкую к лингвистике - надо постараться.
Martin1141) Настолько ли реальны перспективы и задачи КЛ, что ей стоит заниматься?
Вопрос в сроках и удачном попадании в нужное место в нужное время. В долговременной перспективе задачи КЛ очень востребованы. А если удачно произведёте впечатления лично на какого-нибудь высокого начальника хоть в ABBYY, хоть в Google - в кратковременной перспективе у вас так же всё будет хорошо.
Martin1142) Настолько ли будут востребованы специалисты в КЛ, что Москва (ABBYY в частности) может взять человека из другого города?
Попробуйте к ним постучаться. В худшем случае - пробежитесь по стандартному кругу собеседований и лично познакомитесь с народом, который как вам кажется занимается наукой. В лучшем случае - могут принять на работу.
Martin114У меня есть повод для оптимизма: моя землячка сейчас пишет диссер по машинному переводу в Питере (ее работа состыкуется с так называемой логической семантикой). Но в Москву ее так и не взяли - ее работа там оказалась не нужна.
Вот видите - важна не работа, но важно понимать, нафига козе баян, то есть - зачем конторе нужны работники. Развивать научные идеи за большие деньги в аббях с гуглами и так полно желающих, а тут вы со своей диссертацией. Вот если бы вы некий прорыв в КЛ организовали или мировым светилом вас признали - тогда да, вас бы востребовали. А просто диссеры писать им нафиг не надо, на то у них связи с кафедрами и прочими заведениями имеются. В общем - это бизнес, а не наука. Их задача быть в курсе, уметь предложить готовые решения из набора опубликованных. А что-то новое ваять им задачи не ставят, ибо с точки зрения бизнеса такую задачу сложно планировать - когда вы открытие сделаете, кто вас знает.
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38720779
Martin114
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Leonid KudryavtsevMartin114Вообще-то в ABBYY в основном пишут софт не на C++, а на C#. Одна моя знакомая работала так по аутсорсу с ABBYY.
Ссылка и цитата с сайта Abbyy. Открытые у них вакансии.

Думаю, им лучше знать, на чем они пишут и какие специалисты им нужны )))
http://www.abbyy.ru/vacancy/17/:
Разработчик C#
Требования:

Уверенное владение C#
Понимание шаблонов проектирования MVC/ MVP
Опыт работы с ASP.NET Web Forms, AJAX
Знание HTML, CSS, Javascript
Знание MS SQL Server 2005/2008: умение спроектировать структуру БД, писать SQL-запросы и хранимые процедуры
Технический английский

Приветствуется:

XML / XSLT
Опыт работы с ASP.NET MVC, WCF, Web Services
Общее представление о LINQ
Опыт работы с Subversion
Опыт коммерческой разработки приложений
Опыт работы в команде.

Обязанности:

Разработка новых и развитие существующих веб-проектов компании на платформе .Net

Условия:

Возможность участвовать в создании интеллектуальных продуктов, популярных во всем мире.

Уникальная корпоративная культура.

Возможность профессионального роста:

Регулярные бесплатные профессиональные и развивающие курсы, доступные всем сотрудникам офиса. Льготные условия на иные специальные курсы и тренинги
50% компенсация курсов английского для всех желающих. Кроме того, в офисе ведутся курсы немецкого, французского, испанского, китайского языков
Компенсация приобретения профессиональной литературы

Комфортная работа:

Гибкий график работы
Отсутствие дресс-кода
Спортивный зал с разнообразными групповыми занятиями
Тренажерный зал
Массажный кабинет
Свежие фрукты в офисе
Свободная атмосфера (комнаты отдыха, спортивные зоны с настольным футболом, теннисом и т.д.)
Корпоративный тариф сотовой связи

Здоровье и благосостояние сотрудников:

Достойная «белая» зарплата
Частичная компенсация оплаты аренды жилья для иногородних сотрудников
Добровольное медицинское страхование для сотрудников и льготные условия оформления добровольного медицинского страхования для членов семьи
Частичная компенсация абонемента в фитнес клуб
Врач в офисе
Программа потребительского кредитования для сотрудников
Дотирование ипотечных кредитов сотрудников
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38720784
Martin114
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
alex55555 , спасибо за совет, примерно я так и предполагал. Тут два варианта - либо работать специалистом, если нужны деньги или заниматься наукой и работать преподом в вузе, но тогда о больших деньгах нужно забыть. Будем думать.
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38725039
Martin114
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Вот такой вопрос у меня. ABBYY продвигают два решения на базе своей технологии Compreno. Первое решение на базе новой технологии получило название Abbyy Intelligent Search. Оно предназначено для поиска в корпоративных системах и предоставляет результаты поиска с высокой релевантностью, поскольку учитывает не только все формы слов, но и их значения, смысловые связи между словами, расстояние между словами в искомой фразе и контекст употребления.

Важной особенностью смыслового анализа документов является тот факт, что в результатах поиска есть возможность фильтровать слова по их значениям. Пользователь может выбрать, хочет ли он найти среди документов, например, слово «fire» в значении «стрелять», «поджигать» или «увольнять».

Второе из представленных решений, Abbyy Intelligent Tagger, автоматически находит в текстах так называемые «сущности» (названия организаций, персон, гео-объекты, даты и денежные суммы) и размещает их в метаданных документа. В результате, информацию в корпоративных хранилищах можно классифицировать, сортировать или фильтровать по какому-либо признаку.

"Используя выявленные сущности, можно качественно улучшить целый ряд организационных процессов, связанных с анализом содержимого и ключевых параметров документов. Например, повысить приоритет обработки документов, поступающих от самых важных клиентов, создать правила для автоматического сбора сведений о клиенте или партнере, оптимизировать маршрутизацию документа по определенным критериям бизнес-процессов, упростить очистку документов от персональных и конфиденциальных данных", — говорят в Abbyy.

На этом форуме есть специалисты, работающие в области документооборота? Как вы считаете, насколько могут быть востребованы эти два инструмента: поиск документов по смыслу в корпоративных системах и автоматическая классификация документов по определенным заданным признакам?
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38728903
LSV
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Как вы считаете, насколько могут быть востребованы эти два инструмента: поиск документов по смыслу в корпоративных системахВостребованы. Но это вопрос цены и реальных возможностей системы.

Ключевые слова в произвольном документе - не такое простое дело.
Если это деловая графика в заведома неизвестном формате, то кто ее будет парсить на предмет ключевых слов ?
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38747946
Martin114
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
guest_20040621> она плотно и много работала
Я рад за вашу знакомую. К сожалению, качество советов у неё... не очень, прямо скажем.

Чисто с научной точки зрения она более права, чем я (хотя она - не ученый), хотя бы потому что в области Big Data за рубежом существует солидный журнал "Big Data Research" в издательстве Elsevier ( http://www.journals.elsevier.com/big-data-research/ ), а в области компьютерной лингвистики существует дохлый журналец Computational Linguistics в издательстве MIT Press ( http://www.mitpressjournals.org/loi/coli ).
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38748093
guest_20040621
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
> Чисто с научной точки зрения она более права

Вы наукой собираетесь заниматься или вас вакансия в конкретной лавке по-прежнему интересует? Побуду КО: это никак не связанные вещи.
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38754071
Martin114
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
guest_20040621> Чисто с научной точки зрения она более права

Вы наукой собираетесь заниматься или вас вакансия в конкретной лавке по-прежнему интересует? Побуду КО: это никак не связанные вещи.
В данном случае имелась в виду наука. Причем в общемировом плане.
Связь тут имеется такая: можно работать и преподавать в вузе, который готовит специалистов для конкретной лавки.
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38754769
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Почему не во всегалактическом ?

У Вас какое странное понятие о науке IMHO, по крайне мере не совпадающее с моим ))). Работать в какой-то _прикладной_ области, параллельно ездить по конференциям и публиковаться - никто не мешает. Соберете достаточно материала (наработок) для монографии и диссертации... защититесь... надеюсь, зарплаты за _свой_ счет купить пару бутылок коньяка для диссертационного совета хватить )))

IMHO
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38754969
guest_20040621
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
> В данном случае имелась в виду наука. Причем в общемировом плане.

В таком случае я бы порекомендовал вам начать с приведения самооценки к адекватному уровню. Пространные рассуждения на совершенно непрофильном ресурсе исчерпывающе полно говорят и о профессиональной подготовке, и об уровне обсуждения.
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38761349
Martin114
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
LSVКак вы считаете, насколько могут быть востребованы эти два инструмента: поиск документов по смыслу в корпоративных системахВостребованы. Но это вопрос цены и реальных возможностей системы.

Ключевые слова в произвольном документе - не такое простое дело.
Если это деловая графика в заведома неизвестном формате, то кто ее будет парсить на предмет ключевых слов ?
Речь идет не о поиске ключевых слов, а о поиске по значениям и смыслам слов в тексте. Например, если задать для поиска слово "автомобиль", то такая система должна будет искать и по его синонимам "машина", "транспортное средство" и т.д.
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38761352
caballero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
программы не понимают никаких "смыслов"
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38761478
BagaBaga
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Leonid KudryavtsevУ Вас какое странное понятие о науке IMHO, по крайне мере не совпадающее с моим ))). Работать в какой-то _прикладной_ области, параллельно ездить по конференциям и публиковаться - никто не мешает. Соберете достаточно материала (наработок) для монографии и диссертации... защититесь... надеюсь, зарплаты за _свой_ счет купить пару бутылок коньяка для диссертационного совета хватить )))


Леонид, у вас какой-то идеальный работодатель - готовый на недельку отпустить вас ездить по конференциям. И так несколько раз в год. Ну и наработок маловато будет. Там ещё должна быть кучка публикаций в журналах из перечня ВАК. А потом ведущая организация, пара оппонентов... ну и поехало :)
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38761939
Martin114
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
caballeroпрограммы не понимают никаких "смыслов"
Товарисчи из ABBYY разработали систему Compreno, которая претендует на то, чтобы "понимать смысл".
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38762124
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
BagaBagaЛеонид, у вас какой-то идеальный работодатель - готовый на недельку отпустить вас ездить по конференциям. И так несколько раз в год. Ну и наработок маловато будет. Там ещё должна быть кучка публикаций в журналах из перечня ВАК. А потом ведущая организация, пара оппонентов... ну и поехало :)

Ну во первых:

1.1. если тема научных интересов совпадает с профилем деятельности фирмы... тут не "отпустить ездить по конференциям", а за счет фирмы в командировку делать доклады на конференциях.
1.2 "на недельку" - вроде, по закону, отпуск 20 рабочих дней. Странно, что есть проблема "на недельку" куда-то поехать.

2. что такое "ведущая организация" просто не знаю

3. "пара оппонентов" - Когда жена (бывшая) защищала кандидатскую, проблем с оппонентами не было. Дабы. см. пункт 1, необходимое кол-во людей с которыми пили алкоголь на конференциях вполне на оппонентов годились. Проблема была только написать отзывы. Т.к. ряд оппонентов посчитал, что их функция состоит исключительно в том, что бы готовый отзыв подписать, а жена тоже ни фига отзывы не написала.... т.ч. опоненты обломились... пришлось диссертацию читать и честно оппонировать )))

После защиты кандидатской, когда пошли разговоров о докторской, было не менее 5 (ПЯТИ) ПРАКТИЧЕСКИХ тем по которым ее можно написать. Мало того, за которые бы еще и заплатили и/или нашли бы источники финансирования. В том числе и набрать девочек (научный коллектив))) ) которые бы в архива необходимые материалы обрабатывали и выполняли прочею техническую работу.

+ было и предложение за деньги переработать материалы кандидатской, написать и издать книгу.

Но жена сказала, что ей науки хватит и она хочет отдохнуть )))
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38762130
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38762376
caballero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
авторТоварисчи из ABBYY разработали систему Compreno, которая претендует на то, чтобы "понимать смысл".
"Претендовать" можно на что угодно. Пока нет у программы сознания как у человека до тех пор она не будет понимать смысл - будет чистая математика - решение статичтических задач по оптимизации и вероятностям
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38762480
guest_20040621
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
> сознания как у человека

Думаете, среднестатистический человек понимает смысл? Наивный. Человек - набор комплексов и заблуждений.

> решение статичтических задач по оптимизации и вероятностям

И это очень хорошо. Есть проблемы с анализом особенностей изложения и контекстом интерпретации в том смысле, что существует куча факторов, которые может потребоваться учитывать. Но сам по себе формальный анализ - великолепная основа для оценок.
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38762531
Martin114
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
caballeroавторТоварисчи из ABBYY разработали систему Compreno, которая претендует на то, чтобы "понимать смысл".
"Претендовать" можно на что угодно. Пока нет у программы сознания как у человека до тех пор она не будет понимать смысл - будет чистая математика - решение статистических задач по оптимизации и вероятностям
Решение статистических задач по оптимизации и вероятностям не обязательно. Достаточно иметь хорошего филолога со знанием лексической семантики и хорошего программиста. Система Compreno - это как раз попытка программно реализовать семантические наработки ABBYY (подробнее см. здесь: http://www.3dnews.ru/software/624398 ).
...
Рейтинг: 0 / 0
Будущее компьютерной лингвистики
    #38762573
caballero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Martin114,

не сомневаюсь в крутых наработках но к смыслу это не имеет отношения. Семантические связи - та же математика - выбор апарата сути дела не меняет.
...
Рейтинг: 0 / 0
25 сообщений из 180, страница 3 из 8
Форумы / Разработка информационных систем [игнор отключен] [закрыт для гостей] / Будущее компьютерной лингвистики
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]