|
Готовый компонент для семантического анализа?
|
|||
---|---|---|---|
#18+
Господа, Посоветуйте, пожалуйста, готовый компонент для семантического анализа. Хорошо бы, чтобы он мог: 1) Анализировать текстовые файлы (а лучше ещё и *.doc, *.xls, *.pdf) на наличие в нём слов и словосочетаний. Причём с учётом синонимов, устоявшихся выражений, расстояний между словами и т.д. 2) Анализировать документы на «похожесть». 3) Если он сможет действительно «понимать смысл», строя какой-нибудь «смысловой граф» - это был бы вообще предел мечтаний. При этом хорошо бы, чтобы: 1) На Pentium 4-2000 с 1 Гб ОЗУ и Win2k3 или RH9 он умел проверить 150 Кб текста на наличие в нём 1000 словосочетаний (до 3 слов) за 1 сек., или на «похожесть» на один из 50 документов за 1 сек. 2) Для изменения был бы доступен его исходный код, и/или были бы доступны люди, которые поддерживают этот продукт. Если бы его исходники были ещё и на C++ или C#.Net – было бы просто супер. 3) Лучше всего, чтобы он распространялся по BSD-лицензии (так, кажется, она называется; смысл – «свободно для чего угодно, можете даже закрыть код, только первоначальных авторов упоминайте»); чуть хуже, если по GPL, и совсем плохо, если по коммерческой. Знаю, знаю, не компонент мне, а губозакаточную машинку:). Но всё же – может быть, кто-то знает, применяет и доволен... Тогда поделитесь впечатлениями! ... |
|||
:
Нравится:
Не нравится:
|
|||
10.03.2006, 10:37 |
|
Готовый компонент для семантического анализа?
|
|||
---|---|---|---|
#18+
... |
|||
:
Нравится:
Не нравится:
|
|||
10.03.2006, 11:07 |
|
Готовый компонент для семантического анализа?
|
|||
---|---|---|---|
#18+
Спасибо вам большое! Обязательно попробую! :) ... |
|||
:
Нравится:
Не нравится:
|
|||
10.03.2006, 13:01 |
|
Готовый компонент для семантического анализа?
|
|||
---|---|---|---|
#18+
Есть еще www.rco.ru ... |
|||
:
Нравится:
Не нравится:
|
|||
10.03.2006, 13:04 |
|
Готовый компонент для семантического анализа?
|
|||
---|---|---|---|
#18+
Тоже, судя по всему, хорошая вещь. Хотя как она справится с "инвертированной" задачей быстрого индексирования _одного_ документа и "нечёткого" поиска в нём нескольких тысяч словосочетаний - надо проверить. Спасибо большое и вам! ... |
|||
:
Нравится:
Не нравится:
|
|||
10.03.2006, 14:28 |
|
|
start [/forum/topic.php?fid=33&fpage=61&tid=1549451]: |
0ms |
get settings: |
10ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
71ms |
get topic data: |
11ms |
get forum data: |
2ms |
get page messages: |
42ms |
get tp. blocked users: |
1ms |
others: | 237ms |
total: | 396ms |
0 / 0 |