|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
Leonid KudryavtsevА вот, что сама компания Abby считает "исследованиями" ( http://www.abbyy.ru/vacancy/) Исследования и разработкa Инженер по тестированию ПО (DataCapture) Интерфейс-дизайнер Специалист службы технической поддержки (продукты для разработчиков) C++ разработчик (Технологии) Инженер по тестированию ПО (Технологии) C++ разработчик (PDFTools) Инженер по тестированию ПО (FineReader) Заместитель директора продуктового департамента (Headquarters) Web-аналитик С++ разработчик без опыта Но поскольку топикастер C++ не знает... Вообще-то в ABBYY в основном пишут софт не на C++, а на C#. Одна моя знакомая работала так по аутсорсу с ABBYY. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2014, 18:10 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
Свои претензии к публикации их докладов я уже высказал. Кто такой автор, какая у него должность (если он говорит от лица организации), какие у него научные звания (если он ученый). Ничего нет. С таким же успехом, я могу на ближайшем заборе публиковаться. Или дома, на стенке лифта. Там полно таких публикаций. И так же подписываются "Вася", "Игорек" и так далее. Т.ч. мне, лично, научной деятельности и публикаций и дома в лифте хватает Кто верстал сборник докладов конференции Диалог - на мой взгляд должен убится ап стену. Повторюсь матом e#$^#ый п#$^#ц. P.S. Нашел только одну ссылку на старый доклад, на конференции EVA. После доклада, указан автор доклада, его должность, "заслуги". conf.cpic.ru/eva99/rus/Zas2-R/dR2-6.doc ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2014, 18:18 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
Martin114Вообще-то в ABBYY в основном пишут софт не на C++, а на C#. Одна моя знакомая работала так по аутсорсу с ABBYY. Ссылка и цитата с сайта Abbyy. Открытые у них вакансии. Думаю, им лучше знать, на чем они пишут и какие специалисты им нужны ))) ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2014, 18:22 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
Leonid Kudryavtsev Свои претензии к публикации их докладов я уже высказал. Кто такой автор, какая у него должность (если он говорит от лица организации), какие у него научные звания (если он ученый). Ничего нет. С таким же успехом, я могу на ближайшем заборе публиковаться. Или дома, на стенке лифта. Там полно таких публикаций. И так же подписываются "Вася", "Игорек" и так далее. Т.ч. мне, лично, научной деятельности и публикаций и дома в лифте хватает Кто верстал сборник докладов конференции Диалог - на мой взгляд должен убится ап стену. Повторюсь матом e#$^#ый п#$^#ц. P.S. Нашел только одну ссылку на старый доклад, на конференции EVA. После доклада, указан автор доклада, его должность, "заслуги". conf.cpic.ru/eva99/rus/Zas2-R/dR2-6.doc На странице 5 этого сборника есть список рецензентов, они отвечают за качество публикаций. Leonid KudryavtsevКто такой автор, какая у него должность (если он говорит от лица организации), какие у него научные звания (если он ученый). Ничего нет. О качестве публикации говорит не список регалий автора. За нее отвечает оргкомитет и рецензенты (и список ссылок на нее говорит многое, если он есть). Когда Альберт Эйнштейн опубликовал в "Annalen der physik" свою теорию относительности, он тоже был никем и звать его было никак. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2014, 19:20 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
Первое решение на базе новой технологии получило название Abbyy Intelligent Search. Оно предназначено для поиска в корпоративных системах и предоставляет результаты поиска с высокой релевантностью, поскольку учитывает не только все формы слов, но и их значения, смысловые связи между словами, расстояние между словами в искомой фразе и контекст употребления, рассказали CNews в Abbyy. Важной особенностью смыслового анализа документов является тот факт, что в результатах поиска есть возможность фильтровать слова по их значениям. Пользователь может выбрать, хочет ли он найти среди документов, например, слово «fire» в значении «стрелять», «поджигать» или «увольнять». Второе из представленных решений, Abbyy Intelligent Tagger, автоматически находит в текстах так называемые «сущности» (названия организаций, персон, гео-объекты, даты и денежные суммы) и размещает их в метаданных документа. В результате, информацию в корпоративных хранилищах можно классифицировать, сортировать или фильтровать по какому-либо признаку. "Используя выявленные сущности, можно качественно улучшить целый ряд организационных процессов, связанных с анализом содержимого и ключевых параметров документов. Например, повысить приоритет обработки документов, поступающих от самых важных клиентов, создать правила для автоматического сбора сведений о клиенте или партнере, оптимизировать маршрутизацию документа по определенным критериям бизнес-процессов, упростить очистку документов от персональных и конфиденциальных данных", — говорят в Abbyy. Интересно, на этом форуме есть специалисты, которые занимаются корпоративными базами документов? Как они могут оценить вышепредложенные инструменты? Насколько это актуально? ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2014, 20:38 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
Martin114выяснить, стоит ли вообще заниматься научной работой в области компьютерной лингвистики (КЛ) Если ради денег - наверное не стоит. Работайте программистом, денег будет больше. Martin114В Москве КЛ занимаются в фирме ABBYY, руководит научной работой Селегей Владимир Павлович. В Москве, Питере и Нижнем Новгороде в ряде вузов открыты кафедры КЛ, что говорит о востребованности специалистов КЛ например, в той же ABBYY. В мире же можно получить понятие о современном состоянии КЛ по MIT-му журналу Computational Linguistics . Принципиальная востребованность неких технологий должна быть сконвертирована в вашу зарплату. Этим занимаются конторы типа ABBYY или Google. Если вы хотите зарабатывать и при этом ещё и оставаясь в лингвистике (совмещая приятное с полезным), то в конторах типа ABBYY или Google вам предстоит этап "меня должны заметить". Как уж вы им себя разрекламируете - вопрос непростой, можно свои работы им слать, можно в гости ходить, можно резюме с особо умными достижениями отправить. И если на вас в конце концов обратят внимание вас пустят по стандартной цепочке собеседования, когда ихние архитекторы или кто-то вроде того зададутся вопросом - зачем мне в штат этот человек ? Ваша задача на собеседованиях будет состоять в доказательстве вашей ценности, но не только. Архитектору ещё важно быть уверенным, что вы не составите ему конкуренцию, не начнёте вести пропаганду своих идей и другими способами портить ему жизнь. Ну и наконец, если чел из какого-то отдела, куда вас пошлют собеседоваться, решит, что вы можете быть полезны и одновременно в отделе есть вакансия - возможно вам эту вакансию предложат. Хотя если у вас в области лингвистики есть международно известное имя - с вами могут гораздо более мягкие переговоры вести. Ну и общее - не путайте науку и бизнес. Бизнесу нужны продажи, а перспективные разработки у них и так есть, западные статьи они читать умеют, на конференциях и прочих мероприятиях информацию собирают, что-то там себе анализируют и и обобщают. Работу же они вам предложат только рутинную, ибо своих архитекторов (ну или как там называют главных учёных) там и так хватает. И даже что бы предложили работу близкую к лингвистике - надо постараться. Martin1141) Настолько ли реальны перспективы и задачи КЛ, что ей стоит заниматься? Вопрос в сроках и удачном попадании в нужное место в нужное время. В долговременной перспективе задачи КЛ очень востребованы. А если удачно произведёте впечатления лично на какого-нибудь высокого начальника хоть в ABBYY, хоть в Google - в кратковременной перспективе у вас так же всё будет хорошо. Martin1142) Настолько ли будут востребованы специалисты в КЛ, что Москва (ABBYY в частности) может взять человека из другого города? Попробуйте к ним постучаться. В худшем случае - пробежитесь по стандартному кругу собеседований и лично познакомитесь с народом, который как вам кажется занимается наукой. В лучшем случае - могут принять на работу. Martin114У меня есть повод для оптимизма: моя землячка сейчас пишет диссер по машинному переводу в Питере (ее работа состыкуется с так называемой логической семантикой). Но в Москву ее так и не взяли - ее работа там оказалась не нужна. Вот видите - важна не работа, но важно понимать, нафига козе баян, то есть - зачем конторе нужны работники. Развивать научные идеи за большие деньги в аббях с гуглами и так полно желающих, а тут вы со своей диссертацией. Вот если бы вы некий прорыв в КЛ организовали или мировым светилом вас признали - тогда да, вас бы востребовали. А просто диссеры писать им нафиг не надо, на то у них связи с кафедрами и прочими заведениями имеются. В общем - это бизнес, а не наука. Их задача быть в курсе, уметь предложить готовые решения из набора опубликованных. А что-то новое ваять им задачи не ставят, ибо с точки зрения бизнеса такую задачу сложно планировать - когда вы открытие сделаете, кто вас знает. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2014, 21:59 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
Leonid KudryavtsevMartin114Вообще-то в ABBYY в основном пишут софт не на C++, а на C#. Одна моя знакомая работала так по аутсорсу с ABBYY. Ссылка и цитата с сайта Abbyy. Открытые у них вакансии. Думаю, им лучше знать, на чем они пишут и какие специалисты им нужны ))) http://www.abbyy.ru/vacancy/17/: Разработчик C# Требования: Уверенное владение C# Понимание шаблонов проектирования MVC/ MVP Опыт работы с ASP.NET Web Forms, AJAX Знание HTML, CSS, Javascript Знание MS SQL Server 2005/2008: умение спроектировать структуру БД, писать SQL-запросы и хранимые процедуры Технический английский Приветствуется: XML / XSLT Опыт работы с ASP.NET MVC, WCF, Web Services Общее представление о LINQ Опыт работы с Subversion Опыт коммерческой разработки приложений Опыт работы в команде. Обязанности: Разработка новых и развитие существующих веб-проектов компании на платформе .Net Условия: Возможность участвовать в создании интеллектуальных продуктов, популярных во всем мире. Уникальная корпоративная культура. Возможность профессионального роста: Регулярные бесплатные профессиональные и развивающие курсы, доступные всем сотрудникам офиса. Льготные условия на иные специальные курсы и тренинги 50% компенсация курсов английского для всех желающих. Кроме того, в офисе ведутся курсы немецкого, французского, испанского, китайского языков Компенсация приобретения профессиональной литературы Комфортная работа: Гибкий график работы Отсутствие дресс-кода Спортивный зал с разнообразными групповыми занятиями Тренажерный зал Массажный кабинет Свежие фрукты в офисе Свободная атмосфера (комнаты отдыха, спортивные зоны с настольным футболом, теннисом и т.д.) Корпоративный тариф сотовой связи Здоровье и благосостояние сотрудников: Достойная «белая» зарплата Частичная компенсация оплаты аренды жилья для иногородних сотрудников Добровольное медицинское страхование для сотрудников и льготные условия оформления добровольного медицинского страхования для членов семьи Частичная компенсация абонемента в фитнес клуб Врач в офисе Программа потребительского кредитования для сотрудников Дотирование ипотечных кредитов сотрудников ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2014, 22:10 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
alex55555 , спасибо за совет, примерно я так и предполагал. Тут два варианта - либо работать специалистом, если нужны деньги или заниматься наукой и работать преподом в вузе, но тогда о больших деньгах нужно забыть. Будем думать. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2014, 22:21 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
Вот такой вопрос у меня. ABBYY продвигают два решения на базе своей технологии Compreno. Первое решение на базе новой технологии получило название Abbyy Intelligent Search. Оно предназначено для поиска в корпоративных системах и предоставляет результаты поиска с высокой релевантностью, поскольку учитывает не только все формы слов, но и их значения, смысловые связи между словами, расстояние между словами в искомой фразе и контекст употребления. Важной особенностью смыслового анализа документов является тот факт, что в результатах поиска есть возможность фильтровать слова по их значениям. Пользователь может выбрать, хочет ли он найти среди документов, например, слово «fire» в значении «стрелять», «поджигать» или «увольнять». Второе из представленных решений, Abbyy Intelligent Tagger, автоматически находит в текстах так называемые «сущности» (названия организаций, персон, гео-объекты, даты и денежные суммы) и размещает их в метаданных документа. В результате, информацию в корпоративных хранилищах можно классифицировать, сортировать или фильтровать по какому-либо признаку. "Используя выявленные сущности, можно качественно улучшить целый ряд организационных процессов, связанных с анализом содержимого и ключевых параметров документов. Например, повысить приоритет обработки документов, поступающих от самых важных клиентов, создать правила для автоматического сбора сведений о клиенте или партнере, оптимизировать маршрутизацию документа по определенным критериям бизнес-процессов, упростить очистку документов от персональных и конфиденциальных данных", — говорят в Abbyy. На этом форуме есть специалисты, работающие в области документооборота? Как вы считаете, насколько могут быть востребованы эти два инструмента: поиск документов по смыслу в корпоративных системах и автоматическая классификация документов по определенным заданным признакам? ... |
|||
:
Нравится:
Не нравится:
|
|||
20.08.2014, 22:02 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
Как вы считаете, насколько могут быть востребованы эти два инструмента: поиск документов по смыслу в корпоративных системахВостребованы. Но это вопрос цены и реальных возможностей системы. Ключевые слова в произвольном документе - не такое простое дело. Если это деловая графика в заведома неизвестном формате, то кто ее будет парсить на предмет ключевых слов ? ... |
|||
:
Нравится:
Не нравится:
|
|||
26.08.2014, 12:31 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
guest_20040621> она плотно и много работала Я рад за вашу знакомую. К сожалению, качество советов у неё... не очень, прямо скажем. Чисто с научной точки зрения она более права, чем я (хотя она - не ученый), хотя бы потому что в области Big Data за рубежом существует солидный журнал "Big Data Research" в издательстве Elsevier ( http://www.journals.elsevier.com/big-data-research/ ), а в области компьютерной лингвистики существует дохлый журналец Computational Linguistics в издательстве MIT Press ( http://www.mitpressjournals.org/loi/coli ). ... |
|||
:
Нравится:
Не нравится:
|
|||
16.09.2014, 14:46 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
> Чисто с научной точки зрения она более права Вы наукой собираетесь заниматься или вас вакансия в конкретной лавке по-прежнему интересует? Побуду КО: это никак не связанные вещи. ... |
|||
:
Нравится:
Не нравится:
|
|||
16.09.2014, 16:03 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
guest_20040621> Чисто с научной точки зрения она более права Вы наукой собираетесь заниматься или вас вакансия в конкретной лавке по-прежнему интересует? Побуду КО: это никак не связанные вещи. В данном случае имелась в виду наука. Причем в общемировом плане. Связь тут имеется такая: можно работать и преподавать в вузе, который готовит специалистов для конкретной лавки. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.09.2014, 23:18 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
Почему не во всегалактическом ? У Вас какое странное понятие о науке IMHO, по крайне мере не совпадающее с моим ))). Работать в какой-то _прикладной_ области, параллельно ездить по конференциям и публиковаться - никто не мешает. Соберете достаточно материала (наработок) для монографии и диссертации... защититесь... надеюсь, зарплаты за _свой_ счет купить пару бутылок коньяка для диссертационного совета хватить ))) IMHO ... |
|||
:
Нравится:
Не нравится:
|
|||
23.09.2014, 15:05 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
> В данном случае имелась в виду наука. Причем в общемировом плане. В таком случае я бы порекомендовал вам начать с приведения самооценки к адекватному уровню. Пространные рассуждения на совершенно непрофильном ресурсе исчерпывающе полно говорят и о профессиональной подготовке, и об уровне обсуждения. ... |
|||
:
Нравится:
Не нравится:
|
|||
23.09.2014, 16:39 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
LSVКак вы считаете, насколько могут быть востребованы эти два инструмента: поиск документов по смыслу в корпоративных системахВостребованы. Но это вопрос цены и реальных возможностей системы. Ключевые слова в произвольном документе - не такое простое дело. Если это деловая графика в заведома неизвестном формате, то кто ее будет парсить на предмет ключевых слов ? Речь идет не о поиске ключевых слов, а о поиске по значениям и смыслам слов в тексте. Например, если задать для поиска слово "автомобиль", то такая система должна будет искать и по его синонимам "машина", "транспортное средство" и т.д. ... |
|||
:
Нравится:
Не нравится:
|
|||
29.09.2014, 23:24 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
программы не понимают никаких "смыслов" ... |
|||
:
Нравится:
Не нравится:
|
|||
29.09.2014, 23:38 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
Leonid KudryavtsevУ Вас какое странное понятие о науке IMHO, по крайне мере не совпадающее с моим ))). Работать в какой-то _прикладной_ области, параллельно ездить по конференциям и публиковаться - никто не мешает. Соберете достаточно материала (наработок) для монографии и диссертации... защититесь... надеюсь, зарплаты за _свой_ счет купить пару бутылок коньяка для диссертационного совета хватить ))) Леонид, у вас какой-то идеальный работодатель - готовый на недельку отпустить вас ездить по конференциям. И так несколько раз в год. Ну и наработок маловато будет. Там ещё должна быть кучка публикаций в журналах из перечня ВАК. А потом ведущая организация, пара оппонентов... ну и поехало :) ... |
|||
:
Нравится:
Не нравится:
|
|||
30.09.2014, 08:54 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
caballeroпрограммы не понимают никаких "смыслов" Товарисчи из ABBYY разработали систему Compreno, которая претендует на то, чтобы "понимать смысл". ... |
|||
:
Нравится:
Не нравится:
|
|||
30.09.2014, 13:41 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
BagaBagaЛеонид, у вас какой-то идеальный работодатель - готовый на недельку отпустить вас ездить по конференциям. И так несколько раз в год. Ну и наработок маловато будет. Там ещё должна быть кучка публикаций в журналах из перечня ВАК. А потом ведущая организация, пара оппонентов... ну и поехало :) Ну во первых: 1.1. если тема научных интересов совпадает с профилем деятельности фирмы... тут не "отпустить ездить по конференциям", а за счет фирмы в командировку делать доклады на конференциях. 1.2 "на недельку" - вроде, по закону, отпуск 20 рабочих дней. Странно, что есть проблема "на недельку" куда-то поехать. 2. что такое "ведущая организация" просто не знаю 3. "пара оппонентов" - Когда жена (бывшая) защищала кандидатскую, проблем с оппонентами не было. Дабы. см. пункт 1, необходимое кол-во людей с которыми пили алкоголь на конференциях вполне на оппонентов годились. Проблема была только написать отзывы. Т.к. ряд оппонентов посчитал, что их функция состоит исключительно в том, что бы готовый отзыв подписать, а жена тоже ни фига отзывы не написала.... т.ч. опоненты обломились... пришлось диссертацию читать и честно оппонировать ))) После защиты кандидатской, когда пошли разговоров о докторской, было не менее 5 (ПЯТИ) ПРАКТИЧЕСКИХ тем по которым ее можно написать. Мало того, за которые бы еще и заплатили и/или нашли бы источники финансирования. В том числе и набрать девочек (научный коллектив))) ) которые бы в архива необходимые материалы обрабатывали и выполняли прочею техническую работу. + было и предложение за деньги переработать материалы кандидатской, написать и издать книгу. Но жена сказала, что ей науки хватит и она хочет отдохнуть ))) ... |
|||
:
Нравится:
Не нравится:
|
|||
30.09.2014, 15:00 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
авторТоварисчи из ABBYY разработали систему Compreno, которая претендует на то, чтобы "понимать смысл". "Претендовать" можно на что угодно. Пока нет у программы сознания как у человека до тех пор она не будет понимать смысл - будет чистая математика - решение статичтических задач по оптимизации и вероятностям ... |
|||
:
Нравится:
Не нравится:
|
|||
30.09.2014, 17:09 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
> сознания как у человека Думаете, среднестатистический человек понимает смысл? Наивный. Человек - набор комплексов и заблуждений. > решение статичтических задач по оптимизации и вероятностям И это очень хорошо. Есть проблемы с анализом особенностей изложения и контекстом интерпретации в том смысле, что существует куча факторов, которые может потребоваться учитывать. Но сам по себе формальный анализ - великолепная основа для оценок. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.09.2014, 18:15 |
|
Будущее компьютерной лингвистики
|
|||
---|---|---|---|
#18+
caballeroавторТоварисчи из ABBYY разработали систему Compreno, которая претендует на то, чтобы "понимать смысл". "Претендовать" можно на что угодно. Пока нет у программы сознания как у человека до тех пор она не будет понимать смысл - будет чистая математика - решение статистических задач по оптимизации и вероятностям Решение статистических задач по оптимизации и вероятностям не обязательно. Достаточно иметь хорошего филолога со знанием лексической семантики и хорошего программиста. Система Compreno - это как раз попытка программно реализовать семантические наработки ABBYY (подробнее см. здесь: http://www.3dnews.ru/software/624398 ). ... |
|||
:
Нравится:
Не нравится:
|
|||
30.09.2014, 18:57 |
|
|
start [/forum/topic.php?fid=33&msg=38762130&tid=1547412]: |
0ms |
get settings: |
12ms |
get forum list: |
16ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
61ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
65ms |
get tp. blocked users: |
1ms |
others: | 287ms |
total: | 462ms |
0 / 0 |