|
|
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Я прошу господина Di_Line-a создать новый топег для апсуждения праблем сложнастей риализации систем текставага поиска для рускава языка и там эта фсе апсуждать. Ежу ясно что без словоформ эти системы никому не нужны. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 11:10 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Вот что нашел я Про SQLOne Про сфинкс High-Performance-FullText-Search by Петр Зайцев сотоварищи Эффективный полнотекстовый поиск по базам данных - Андрей Аксенов, Петр Зайцев ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 11:23 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 13:32 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
MasterZivЯ прошу господина Di_Line-a создать новый топег для апсуждения праблем сложнастей риализации систем текставага поиска для рускава языка и там эта фсе апсуждать. Ежу ясно что без словоформ эти системы никому не нужны. Интересно, а FTS этот текст сможет разобрать? - Не лично, а так, тяпницей навеяно... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 13:49 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Особенно мне понравилось сравнение с МногоСерчем, заброшенным, имхо, в году эдак 2003-2004... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 13:53 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Di_LIneОсобенно мне понравилось сравнение с МногоСерчем, заброшенным, имхо, в году эдак 2003-2004... а это что? 8 May 2007: mnoGoSearch 3.3.3 is now available Take a look into ChangeLog ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 14:02 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
моррут а это что? 8 May 2007: mnoGoSearch 3.3.3 is now available Take a look into ChangeLog - Ап_мишурился чуток... Лет, порядка, на пяток... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 14:06 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Покачивая ногой, задумчиво в потолок: - И какАго рожна Яндекс, Рамблер и ВебАльта выяживаются, изобретая что-то свое?... - Бери и юзай на полное щастьё! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 14:14 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Di_LIneДля уточнения. Рекомендую посмотреть склонения слов расейскаго языку: 1. с беглой Ё и О - берёг>берегла; любовь>любви(д.п.); церковь>церквей(мн,р.п.) и тп. 2 "она-нок" - ребенок>ребенка(р.п.) 3. с беглой Е - камень>камня(р.п.); свинец>свинца(р.п.); горошек>горошка(р.п.) и тп. 4. с беглой О - петушок>петушка(р.п.); коготь>когтя(р.п.); огонь>огня(р.п.) и тп. 5. с беглой Ё и Й - паёк>пайку(д.п.); буёк>буйком(т.п.) 6. существительные существующие только во мн.ч. - сласти>сластями(т.п.); бусы>бусам(д.п.) 7. существительные м.р. на -ор с беглой о: только ед.ч. - багоР>багРа(р.п.) 8. - земля>землЕю(т.п.); армия>армий(мн,р.п.); спальня>спален(мн,р.п.); беглец>беглецов(мн,в.п.) ... ну и хватит. Тогда вапрос: какой тарабарскмй "ХВУЛ СЁРЧЬ" с этим справиться??? Полнотекстовый поиск используется для фильтрации результатов поиска, выдаваемых для анализа человеку. Никто по фуллтексту ракеты не наводит и ядерными реакторами не управляет, так что приемлемо частичное решение задачи, которое может вызывать как ложные срабатывания, так и пропускать часть нужных результатов. Конечно, чем лучше результаты -- тем лучше, но невозможность идеального решения не означает невостребованности частичных. Указанные проблемы с беглыми гласными решаются словарём, отсутствие же отдельных словоформ для полнотекстового поиска особой проблемой не является, если кроме "дощечки" будет искаться "придощечно" ничего страшного от того, что такого слова нет, не случится. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 17:13 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
DocAlесли кроме "дощечки" будет искаться "придощечно" ничего страшного от того, что такого слова нет, не случитсяOFF: знаете, что такое "фотобарабать"? это первая форма от "фотобарабан" по используемой у нас морфологии. :-) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 17:24 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
LeXa NalBatOFF: знаете, что такое "фотобарабать"? это первая форма от "фотобарабан" по используемой у нас морфологии. :-) - Ты, вашсродь, глаголами на выражайся и причастия нас не матери... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 17:36 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
DocAl... если кроме "дощечки" будет искаться "придощечно" ничего страшного... Дока_Олл, чёт (и нечет тож) у меня не палучлись про склонять и проспрягать это "придощечно"... - Агласте, пжаласта, весь спск.... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 17:38 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Просклонять-проспрягать наречие? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 20:13 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
DocAlПросклонять-проспрягать наречие? А-а-а... Хоть не причастие... Но на фамилий очень похоже... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 20:15 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
MasterZivЯ прошу господина Di_Line-a создать новый топег для апсуждения праблем сложнастей риализации систем текставага поиска для рускава языка и там эта фсе апсуждать. Ежу ясно что без словоформ эти системы никому не нужны. а словоформы подобные кому нужны? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.05.2007, 01:23 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Сравнивать-то особо нечего. Нетрудно выбрать слова, построить по им индекс в базе данных, организовать отношение многие ко многим слово - единица хранения текста. Сложно сделать морфолологический разбор для разных языков. Особо наблюдательные могли заметить, что на странице "Поиск" нашего любимого сайта есть чекбокс - "с учетом морфлогогии". Не помню, кто подарил Judge этот функционал. Ноблагдарен фирме, названия которой я не помню. Помню, что она продается за нехилые деньги, поскольку она была, а может и сейчас есть ЕДИНСТВЕННАЯ разработка для морфлогически ориентированного поиска по русскому тексту в MS SQL. С чем ее сравнивать? Есть конкурирующие продукты? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2007, 20:34 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Возможно, я по-разному воспринимаю англоязычный термин stemming и "морфологический разбор", но мне кажется, полноценный морфологический разбор -- штука слишком сложная и не столь необходимая для полнотекстового поиска, хотя и немного снижающая ложные срабатывания. Ну а стемминг в том же сфинксе есть, сравнивайте на здоровье.) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2007, 21:38 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Cat2 Помню, что она продается за нехилые деньги, поскольку она была, а может и сейчас есть Это 50 баксов - нехилые деньги ? Cat2 ЕДИНСТВЕННАЯ разработка для морфлогически ориентированного поиска по русскому тексту в MS SQL. С чем ее сравнивать? Есть конкурирующие продукты? Пользуйтесь тогда MSSQL2005 - там это бесплатно. Или поиском по этому сайту - конкурирующих продуктов полно ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.06.2007, 22:45 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Oracle10g Oracle Text + RCO ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.06.2007, 08:45 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Di_LIne А что есть - полнотекстовый поиск? Смысла в этом словосочетании ни на грош... Описание полнотекстового поиска в СУБД ЛИНТЕР "FullSearch Linter"]http://www.linter.ru/lindoc/pdf_file/phrase.pdf ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.06.2007, 19:30 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
ЮВ Di_LIne А что есть - полнотекстовый поиск? Смысла в этом словосочетании ни на грош... Описание полнотекстового поиска в СУБД ЛИНТЕР "FullSearch Linter"]http://www.linter.ru/lindoc/pdf_file/phrase.pdf Это то, как понимают и реализовали это предствление разработчики ЛИНТЕР... СУБД ЛИНТЕР со средствами фразового поиска рекомендуется использовать в проектах, где основными определяющими факторами являются скорость поиска и извлечения текста по фразе в больших хранилищах информации (например, интернет-сервер). Средства фразового поиска дают возможность упростить схему хранения данных в приложении и избежать создания некоторых дополнительных таблиц. Система фразового поиска обеспечивает: • варианты поиска слов: по началу, окончанию, части слова, целому слову, поиск с использованием символов шаблона; • поиск по словам, набранным с ошибками (нечеткий поиск). Поддерживаются три основных типа ошибок (пропуск, вставка, замена буквы); • поиск с учетом и без учета регистра букв; • поиск близкорасположенных слов и фраз с известным порядком слов; • поиск по названию и значению атрибута в файлах с гипертекстовой разметкой; • автоматическое определение кодировки русскоязычного текста. В СУБД ЛИНТЕР версии 6.0 и выше дополнительно обеспечивается: • поддержка многобайтных кодировок и иероглифических символов; • хранение информации в кодировке UNICODE. ... и ни слова о поиске по морфоформа того же слова. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.06.2007, 19:56 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Di_LIne... и ни слова о поиске по морфоформа того же слова.а чо только морфоформы? а синонимическим поиском и поиском "по смыслу" кто-нито занимается? А то сплошь и рядом нужен поиск доков, касающихся вполне определенного контекста, но какими словесами этот контекст будет оформлен - предположить бывает трудно. Да и если и есть предположения - количество иных контекстов, обвязанных теми же словесами - подчас пугающе велико. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2007, 11:20 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Di_LIne ... и ни слова о поиске по морфоформа того же слова. Если под термином "морфоформа" понимается вариант словоизменения, то там описаны следующие модификаторы шаблона поиска: SENSITIVE Задает чувствительный к регистру поиск PARTIALLY Задает поиск документов, в которых заданный шаблон поиска может встречаться в любом месте слова AT_BEGIN Задает поиск документов, в которых заданный шаблон поиска может встречаться только в начале слов AT_END Задает поиск документов, в которых заданный шаблон поиска может встречаться только в конце слов FUZZY Задает нечеткий поиск Т. е. конструкции типа "искать по всем морфоформам", например, слова "РЕЛЯЦИОННАЯ", нет. Если имеется ввиду что-то иное - уточните. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2007, 13:41 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
ЮВSENSITIVE\tЗадает чувствительный к регистру поиск PARTIALLY\tЗадает поиск документов, в которых заданный шаблон поиска может встречаться в любом месте слова AT_BEGIN\tЗадает поиск документов, в которых заданный шаблон поиска может встречаться только в начале слов AT_END\tЗадает поиск документов, в которых заданный шаблон поиска может встречаться только в конце слов Ну и что? Тот же ЛАЙКЕ с вариациями... И это называют ФулСерчем?.... ЮВ Если имеется ввиду что-то иное - уточните. Развернытый пример я уже приводил тут... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2007, 16:20 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Вообще-то делают так: The Verity thesaurus operator expands a search to include the specified word and its synonyms (for information on using the thesaurus operator, see “thesaurus” on page 57). You can create a custom thesaurus that contains application-specific synonyms to use in place of the default thesaurus. For example, the default English language thesaurus contains these words as synonyms for “money:” “cash,” “currency,” “lucre,” “wampum,” and “greenbacks.” You can create a custom thesaurus that contains a different set of synonyms for “money,” such as: ”bid,” “tokens,” “credit,” “asset,” and “verbal offer.” To create a custom thesaurus: ... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2007, 16:26 |
|
||
|
|

start [/forum/topic.php?fid=35&msg=34551341&tid=1553296]: |
0ms |
get settings: |
9ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
28ms |
get topic data: |
10ms |
get forum data: |
3ms |
get page messages: |
50ms |
get tp. blocked users: |
1ms |
| others: | 225ms |
| total: | 347ms |

| 0 / 0 |
