|
|
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Hi, all ! Никто нигде не натыкался на сравнение систем полнотекстового поиска в СУБД ? -- Posted via ActualForum NNTP Server 1.4 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.05.2007, 11:02 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
MasterZiv Никто нигде не натыкался на сравнение систем полнотекстового поиска в СУБД ? А что есть - полнотекстовый поиск? Смысла в этом словосочетании ни на грош... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.05.2007, 14:08 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Di_LIne пишет: > А что есть - полнотекстовый поиск? Full Text Search Posted via ActualForum NNTP Server 1.4 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.05.2007, 14:11 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
MasterZiv Di_LIne пишет: > А что есть - полнотекстовый поиск? Full Text Search Спасибо! А то по-аглицки я и не знал как пишется... - Смысл этого "фулл" в чем заключается? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.05.2007, 14:45 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Di_LIne - Смысл этого "фулл" в чем заключается?У Вас не работает Google ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.05.2007, 14:58 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
ChA Di_LIne - Смысл этого "фулл" в чем заключается?У Вас не работает Google ? Это чье-то мнение... Может оное к англицкаму и применимо... А вот к рассейскому - сомнения меня берут. Так как, если говорить о "фул", то без морфологии в русском - не обойтись... А система формообразования слов в русском языке значительно сложнее, чем в аглицком. Вот я и спрашиваю - какой смысл чел вкладывает в это "фулл"? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.05.2007, 15:11 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Di_LIneВот я и спрашиваю - какой смысл чел вкладывает в это "фулл"?Есть подозрение, что общепринятый. Вот, например, о полнотекстовом поиске . Или Вы не верите, что "full text search" эквивалентно "полнотекстовый поиск" ? P.S. IMHO, придирки на пустом месте. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.05.2007, 15:27 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Di_LIne ChA Di_LIne - Смысл этого "фулл" в чем заключается?У Вас не работает Google ? Это чье-то мнение... Может оное к англицкаму и применимо... А вот к рассейскому - сомнения меня берут. Так как, если говорить о "фул", то без морфологии в русском - не обойтись... А система формообразования слов в русском языке значительно сложнее, чем в аглицком. Вот я и спрашиваю - какой смысл чел вкладывает в это "фулл"? Если тебе это кажется сложным, вовсе не значит, что не существует решений. Вот , например. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.05.2007, 15:42 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
DocAlЕсли тебе это кажется сложным, вовсе не значит, что не существует решений. Вот , например. Ага! Тогда поясните мене такой разрез, если теоритически не понятно, на примере: Код: plaintext 1. 2. 3. 4. 5. 1. Поиск ТОЛЬКО точной словоформы данного слова. 2. по вертикали, в рамках только словоформ существительного. 3. тоже, но и с учетом словоформ М и Ж рода 4. тоже, но с учетом морфем прилагательных и наречий 5. весь "примоугольник" ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.05.2007, 16:03 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
ChA[quot Di_LIne] Или Вы не верите, что "full text search" эквивалентно "полнотекстовый поиск" ? За каждым термином скрывается определенный смысл.... Я - только о нем. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.05.2007, 16:06 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
lucene рулит. очень удобно, быстро и не только для СУБД. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.05.2007, 16:27 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Di_LIne По какой схеме должен осуществляться поиск? 1. Поиск ТОЛЬКО точной словоформы данного слова. 2. по вертикали, в рамках только словоформ существительного. 3. тоже, но и с учетом словоформ М и Ж рода 4. тоже, но с учетом морфем прилагательных и наречий 5. весь "примоугольник"Если где-то существует сравнение систем полнотекстового поиска, о котором просил автор, то вероятно, в нем эти подробности будут освещены. К сожалению, мне не приходилось заниматься этим, поэтому мне неизвестны ни такие сравнения, ни системы. Но если кто- то даст ссылку на такое сравнение, или просто список систем с описанием, это (имхо) будет гораздо полезнее для темы и автора, чем раскрытие на 10-ти страницах наиболее полного смысла слова "full". ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.05.2007, 21:22 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Всвязи с "разбродом и шатанием" в толковании терминов, ответ на данный вопрос завист от контекста, стоящего за термином у автора. И в каком-либо сравнении, имхо, не будут сводить воедино морфологический поиск и поиск "на точное вхождение", так как по сути, форме и организации - это две, совершенно различные, по сложности и организации, системы. Для первого варианта - ссылок вагон . А по второму - хотя бы тот же МюСкульный "фул текст серчь"... По нему Дока_Олл может дать более компетентный ответ... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.05.2007, 21:46 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
DocAlЕсли тебе это кажется сложным, вовсе не значит, что не существует решений. Вот , например. Дока_Олл... Мы опять про старое? Даже у Яндекса(!) до сих пор есть заморочки с морфологией русского языка. Так как, по их же признанию, идет непрерывный рост кол-ва новых слов и словоформ... Для примера - "падонкавский" сленг. - Это жизнь... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.05.2007, 22:00 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Для уточнения. Рекомендую посмотреть склонения слов расейскаго языку: 1. с беглой Ё и О - берёг>берегла; любовь>любви(д.п.); церковь>церквей(мн,р.п.) и тп. 2 "она-нок" - ребенок>ребенка(р.п.) 3. с беглой Е - камень>камня(р.п.); свинец>свинца(р.п.); горошек>горошка(р.п.) и тп. 4. с беглой О - петушок>петушка(р.п.); коготь>когтя(р.п.); огонь>огня(р.п.) и тп. 5. с беглой Ё и Й - паёк>пайку(д.п.); буёк>буйком(т.п.) 6. существительные существующие только во мн.ч. - сласти>сластями(т.п.); бусы>бусам(д.п.) 7. существительные м.р. на -ор с беглой о: только ед.ч. - багоР>багРа(р.п.) 8. - земля>землЕю(т.п.); армия>армий(мн,р.п.); спальня>спален(мн,р.п.); беглец>беглецов(мн,в.п.) ... ну и хватит. Тогда вапрос: какой тарабарскмй "ХВУЛ СЁРЧЬ" с этим справиться??? ЗЫ Да! Вот ышо замечательный пример, приведу полностью: --------------------------------------------------------- вошь>вша(и.п.) вошь>вшу(р.п.) вошь>вше(д.п.) вошь>вшой(т.п.) вошь>вошах(п.п.) вошь>вошью(т.п.) вошь>воши(и.п.) вошь>вошей(р.п.) вошь>вошам(д.п.) вошь>вошами(Т.п.) вошь>вши(мн,и.п.) вошь>вшей(мн,р.п.) вошь>вшам(мн,д.п.) вошь>вшами(мн,т.п.) вошь>вшах(мн,п.п.) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 08:18 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Di_LIne Тогда вапрос: какой тарабарскмй "ХВУЛ СЁРЧЬ" с этим справиться??? Например наш рассейский, с соответствующими словарями. Для "албанского" ispell делайте сами ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 09:46 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Di_LIneДля уточнения. Рекомендую посмотреть склонения слов расейскаго языку: 1. с беглой Ё и О - берёг>берегла; любовь>любви(д.п.); церковь>церквей(мн,р.п.) и тп. 2 "она-нок" - ребенок>ребенка(р.п.) 3. с беглой Е - камень>камня(р.п.); свинец>свинца(р.п.); горошек>горошка(р.п.) и тп. 4. с беглой О - петушок>петушка(р.п.); коготь>когтя(р.п.); огонь>огня(р.п.) и тп. 5. с беглой Ё и Й - паёк>пайку(д.п.); буёк>буйком(т.п.) 6. существительные существующие только во мн.ч. - сласти>сластями(т.п.); бусы>бусам(д.п.) 7. существительные м.р. на -ор с беглой о: только ед.ч. - багоР>багРа(р.п.) 8. - земля>землЕю(т.п.); армия>армий(мн,р.п.); спальня>спален(мн,р.п.); беглец>беглецов(мн,в.п.) ... ну и хватит. Тогда вапрос: какой тарабарскмй "ХВУЛ СЁРЧЬ" с этим справиться??? ЗЫ Да! Вот ышо замечательный пример, приведу полностью: --------------------------------------------------------- вошь>вша(и.п.) вошь>вшу(р.п.) вошь>вше(д.п.) вошь>вшой(т.п.) вошь>вошах(п.п.) вошь>вошью(т.п.) вошь>воши(и.п.) вошь>вошей(р.п.) вошь>вошам(д.п.) вошь>вошами(Т.п.) вошь>вши(мн,и.п.) вошь>вшей(мн,р.п.) вошь>вшам(мн,д.п.) вошь>вшами(мн,т.п.) вошь>вшах(мн,п.п.) Вы же эти правила как то запомнили - и компьютер сможет. Правил литературного языка ограниченное количество, а сленг включать необязательно ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 09:57 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
htd Например наш рассейский, с соответствующими словарями. Для "албанского" ispell делайте сами Сам проверл эти словари, али ток так. тынцнул?... 1. Так вот, в тех словарях нет: - Фамилий, коих поболее 100.000; - Отчеств, коих за 40.000; - Далеко не полный состав Имен. Для примера - нет уменьшительно-ласкательных форм. - Географических, исторических и прочих химическо-физическо-математически-металургически-финансовых и прочая, прочая, прочая терминов. Колих, по моей имхе, поболее 6.000.000 "базовых" словоформ насчитывается... - Числительные - не представлены ва-апче как класс. Сии мои утверждения легко проверяются... 2. russian.aff - изобилует ошибками, неточностями и полным отсутствием некоторых частей. В часности - для числительных, местоимений, а так же ряда исключений из Правил орфографии Русского языка. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 10:02 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
SergSuperВы же эти правила как то запомнили - и компьютер сможет. Правил литературного языка ограниченное количество, а сленг включать необязательно Дело-то не в Правилах... С этим я с Вами полностью согласен! А в построении "поисковых последовательностей" образуемых словоформ... Ведь мы говорим о Full Text Search. Мюскульный "фул серчь" дает очень прикольные варианты: Например: При поиске слова "библиотечная" - не дает результата, но при поиске "библиотечный" - результат есть. То есть - это поиск всего лишь "на точное вхождение"... Но ни как не фулл... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 10:08 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
SergSuperПравил литературного языка ограниченное количество, а сленг включать необязательно Дело в том, что правила составляли филологи, а у них понятие логики "немного" отличается от того, что принято в математике. Вот недавно в интернете уточнял про правописание частиц: http://booference.pochta.ru/ortho_xvii.htmlЧастицы бы (б), же (ж), ли (ль) пишутся раздельно, например: сделал бы, если бы, если б, однако же, однако ж, вот же ж ты какой, едва ли, всегда ль. Примечание. Правило не распространяется на те случаи, когда указанные частицы входят в состав цельных слов, например: чтобы, также, неужели и др. Раздельно пишутся частицы ведь, вот, мол и некоторые другие. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 10:33 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Локшин МаркДело в том, что правила составляли филологи, а у них понятие логики "немного" отличается от того, что принято в математике.... а юзаем эти Правила - мы с вами. То есть: - Как хотим, так и юзаем, поплевывая на все Правила, в кучке и россыпью. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 10:36 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Di_LIne, что вы привязались к морфологии? Например в постгресовом tsearch, ссылку на который уже давали, эти системы разделены. И стэммер может включать в себя не только морфологию, а например перевод из HTML в TEXT. И морфологию можно использовать любую, самописную например. :) Да, морфологию и FTS эффективно использовать совместно, но не нужно смешивать. Хотя возможно в других субд они жестко связаны. Tsearch V2 Readme OpenFTS vs Tsearch2 OpenFTS is a middleware between application and database. OpenFTS uses tsearch2 as a storage and database engine as a query executor (searching). Everything else, i.e. parsing of documents, query processing, linguistics, carry outs on client side. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 10:37 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
LeXa NalBatDi_LIne, что вы привязались к морфологии? См. мой первый пост... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 10:43 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Еще аспект: - При поступлении запроса с орфографической ошибкой - что должна делать система Full Text Search ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 10:44 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
LeXa NalBatДа, морфологию и FTS эффективно использовать совместно, но не нужно смешивать. Я об этом уже говорил ... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 10:50 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Я прошу господина Di_Line-a создать новый топег для апсуждения праблем сложнастей риализации систем текставага поиска для рускава языка и там эта фсе апсуждать. Ежу ясно что без словоформ эти системы никому не нужны. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 11:10 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Вот что нашел я Про SQLOne Про сфинкс High-Performance-FullText-Search by Петр Зайцев сотоварищи Эффективный полнотекстовый поиск по базам данных - Андрей Аксенов, Петр Зайцев ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 11:23 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 13:32 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
MasterZivЯ прошу господина Di_Line-a создать новый топег для апсуждения праблем сложнастей риализации систем текставага поиска для рускава языка и там эта фсе апсуждать. Ежу ясно что без словоформ эти системы никому не нужны. Интересно, а FTS этот текст сможет разобрать? - Не лично, а так, тяпницей навеяно... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 13:49 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Особенно мне понравилось сравнение с МногоСерчем, заброшенным, имхо, в году эдак 2003-2004... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 13:53 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Di_LIneОсобенно мне понравилось сравнение с МногоСерчем, заброшенным, имхо, в году эдак 2003-2004... а это что? 8 May 2007: mnoGoSearch 3.3.3 is now available Take a look into ChangeLog ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 14:02 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
моррут а это что? 8 May 2007: mnoGoSearch 3.3.3 is now available Take a look into ChangeLog - Ап_мишурился чуток... Лет, порядка, на пяток... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 14:06 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Покачивая ногой, задумчиво в потолок: - И какАго рожна Яндекс, Рамблер и ВебАльта выяживаются, изобретая что-то свое?... - Бери и юзай на полное щастьё! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 14:14 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Di_LIneДля уточнения. Рекомендую посмотреть склонения слов расейскаго языку: 1. с беглой Ё и О - берёг>берегла; любовь>любви(д.п.); церковь>церквей(мн,р.п.) и тп. 2 "она-нок" - ребенок>ребенка(р.п.) 3. с беглой Е - камень>камня(р.п.); свинец>свинца(р.п.); горошек>горошка(р.п.) и тп. 4. с беглой О - петушок>петушка(р.п.); коготь>когтя(р.п.); огонь>огня(р.п.) и тп. 5. с беглой Ё и Й - паёк>пайку(д.п.); буёк>буйком(т.п.) 6. существительные существующие только во мн.ч. - сласти>сластями(т.п.); бусы>бусам(д.п.) 7. существительные м.р. на -ор с беглой о: только ед.ч. - багоР>багРа(р.п.) 8. - земля>землЕю(т.п.); армия>армий(мн,р.п.); спальня>спален(мн,р.п.); беглец>беглецов(мн,в.п.) ... ну и хватит. Тогда вапрос: какой тарабарскмй "ХВУЛ СЁРЧЬ" с этим справиться??? Полнотекстовый поиск используется для фильтрации результатов поиска, выдаваемых для анализа человеку. Никто по фуллтексту ракеты не наводит и ядерными реакторами не управляет, так что приемлемо частичное решение задачи, которое может вызывать как ложные срабатывания, так и пропускать часть нужных результатов. Конечно, чем лучше результаты -- тем лучше, но невозможность идеального решения не означает невостребованности частичных. Указанные проблемы с беглыми гласными решаются словарём, отсутствие же отдельных словоформ для полнотекстового поиска особой проблемой не является, если кроме "дощечки" будет искаться "придощечно" ничего страшного от того, что такого слова нет, не случится. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 17:13 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
DocAlесли кроме "дощечки" будет искаться "придощечно" ничего страшного от того, что такого слова нет, не случитсяOFF: знаете, что такое "фотобарабать"? это первая форма от "фотобарабан" по используемой у нас морфологии. :-) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 17:24 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
LeXa NalBatOFF: знаете, что такое "фотобарабать"? это первая форма от "фотобарабан" по используемой у нас морфологии. :-) - Ты, вашсродь, глаголами на выражайся и причастия нас не матери... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 17:36 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
DocAl... если кроме "дощечки" будет искаться "придощечно" ничего страшного... Дока_Олл, чёт (и нечет тож) у меня не палучлись про склонять и проспрягать это "придощечно"... - Агласте, пжаласта, весь спск.... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 17:38 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Просклонять-проспрягать наречие? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 20:13 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
DocAlПросклонять-проспрягать наречие? А-а-а... Хоть не причастие... Но на фамилий очень похоже... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2007, 20:15 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
MasterZivЯ прошу господина Di_Line-a создать новый топег для апсуждения праблем сложнастей риализации систем текставага поиска для рускава языка и там эта фсе апсуждать. Ежу ясно что без словоформ эти системы никому не нужны. а словоформы подобные кому нужны? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.05.2007, 01:23 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Сравнивать-то особо нечего. Нетрудно выбрать слова, построить по им индекс в базе данных, организовать отношение многие ко многим слово - единица хранения текста. Сложно сделать морфолологический разбор для разных языков. Особо наблюдательные могли заметить, что на странице "Поиск" нашего любимого сайта есть чекбокс - "с учетом морфлогогии". Не помню, кто подарил Judge этот функционал. Ноблагдарен фирме, названия которой я не помню. Помню, что она продается за нехилые деньги, поскольку она была, а может и сейчас есть ЕДИНСТВЕННАЯ разработка для морфлогически ориентированного поиска по русскому тексту в MS SQL. С чем ее сравнивать? Есть конкурирующие продукты? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2007, 20:34 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Возможно, я по-разному воспринимаю англоязычный термин stemming и "морфологический разбор", но мне кажется, полноценный морфологический разбор -- штука слишком сложная и не столь необходимая для полнотекстового поиска, хотя и немного снижающая ложные срабатывания. Ну а стемминг в том же сфинксе есть, сравнивайте на здоровье.) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2007, 21:38 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Cat2 Помню, что она продается за нехилые деньги, поскольку она была, а может и сейчас есть Это 50 баксов - нехилые деньги ? Cat2 ЕДИНСТВЕННАЯ разработка для морфлогически ориентированного поиска по русскому тексту в MS SQL. С чем ее сравнивать? Есть конкурирующие продукты? Пользуйтесь тогда MSSQL2005 - там это бесплатно. Или поиском по этому сайту - конкурирующих продуктов полно ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.06.2007, 22:45 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Oracle10g Oracle Text + RCO ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.06.2007, 08:45 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Di_LIne А что есть - полнотекстовый поиск? Смысла в этом словосочетании ни на грош... Описание полнотекстового поиска в СУБД ЛИНТЕР "FullSearch Linter"]http://www.linter.ru/lindoc/pdf_file/phrase.pdf ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.06.2007, 19:30 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
ЮВ Di_LIne А что есть - полнотекстовый поиск? Смысла в этом словосочетании ни на грош... Описание полнотекстового поиска в СУБД ЛИНТЕР "FullSearch Linter"]http://www.linter.ru/lindoc/pdf_file/phrase.pdf Это то, как понимают и реализовали это предствление разработчики ЛИНТЕР... СУБД ЛИНТЕР со средствами фразового поиска рекомендуется использовать в проектах, где основными определяющими факторами являются скорость поиска и извлечения текста по фразе в больших хранилищах информации (например, интернет-сервер). Средства фразового поиска дают возможность упростить схему хранения данных в приложении и избежать создания некоторых дополнительных таблиц. Система фразового поиска обеспечивает: • варианты поиска слов: по началу, окончанию, части слова, целому слову, поиск с использованием символов шаблона; • поиск по словам, набранным с ошибками (нечеткий поиск). Поддерживаются три основных типа ошибок (пропуск, вставка, замена буквы); • поиск с учетом и без учета регистра букв; • поиск близкорасположенных слов и фраз с известным порядком слов; • поиск по названию и значению атрибута в файлах с гипертекстовой разметкой; • автоматическое определение кодировки русскоязычного текста. В СУБД ЛИНТЕР версии 6.0 и выше дополнительно обеспечивается: • поддержка многобайтных кодировок и иероглифических символов; • хранение информации в кодировке UNICODE. ... и ни слова о поиске по морфоформа того же слова. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.06.2007, 19:56 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Di_LIne... и ни слова о поиске по морфоформа того же слова.а чо только морфоформы? а синонимическим поиском и поиском "по смыслу" кто-нито занимается? А то сплошь и рядом нужен поиск доков, касающихся вполне определенного контекста, но какими словесами этот контекст будет оформлен - предположить бывает трудно. Да и если и есть предположения - количество иных контекстов, обвязанных теми же словесами - подчас пугающе велико. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2007, 11:20 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Di_LIne ... и ни слова о поиске по морфоформа того же слова. Если под термином "морфоформа" понимается вариант словоизменения, то там описаны следующие модификаторы шаблона поиска: SENSITIVE Задает чувствительный к регистру поиск PARTIALLY Задает поиск документов, в которых заданный шаблон поиска может встречаться в любом месте слова AT_BEGIN Задает поиск документов, в которых заданный шаблон поиска может встречаться только в начале слов AT_END Задает поиск документов, в которых заданный шаблон поиска может встречаться только в конце слов FUZZY Задает нечеткий поиск Т. е. конструкции типа "искать по всем морфоформам", например, слова "РЕЛЯЦИОННАЯ", нет. Если имеется ввиду что-то иное - уточните. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2007, 13:41 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
ЮВSENSITIVE\tЗадает чувствительный к регистру поиск PARTIALLY\tЗадает поиск документов, в которых заданный шаблон поиска может встречаться в любом месте слова AT_BEGIN\tЗадает поиск документов, в которых заданный шаблон поиска может встречаться только в начале слов AT_END\tЗадает поиск документов, в которых заданный шаблон поиска может встречаться только в конце слов Ну и что? Тот же ЛАЙКЕ с вариациями... И это называют ФулСерчем?.... ЮВ Если имеется ввиду что-то иное - уточните. Развернытый пример я уже приводил тут... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2007, 16:20 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Вообще-то делают так: The Verity thesaurus operator expands a search to include the specified word and its synonyms (for information on using the thesaurus operator, see “thesaurus” on page 57). You can create a custom thesaurus that contains application-specific synonyms to use in place of the default thesaurus. For example, the default English language thesaurus contains these words as synonyms for “money:” “cash,” “currency,” “lucre,” “wampum,” and “greenbacks.” You can create a custom thesaurus that contains a different set of synonyms for “money,” such as: ”bid,” “tokens,” “credit,” “asset,” and “verbal offer.” To create a custom thesaurus: ... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2007, 16:26 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Привет, just! Ты пишешь: justjm> Вообще-то делают так:кто и что? -- With best regards, Мимопроходящий. Posted via ActualForum NNTP Server 1.4 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2007, 16:31 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Мимопроходящий Привет, just! Ты пишешь: justjm> Вообще-то делают так:кто и что? -- With best regards, Мимопроходящий. Posted via ActualForum NNTP Server 1.4 Из доки по EFTS. Что это? Хочешь синонимы, склонения, учёт морфологии - бери словарь и подключай свой справочник вместо дефолтного и ищи на здоровье с учётом всего этого или без него. С моей точки зрения - это правильное решение. Я против того, чтобы америкосы или кто-нибудь не русский составлял такой справочник для меня. А те, кто хочет сразу и всё готовое - заведомо ограничивают выбор только "доморощенными" системами. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2007, 17:25 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
just me Я против того, чтобы америкосы или кто-нибудь не русский составлял такой справочник для меня. А те, кто хочет сразу и всё готовое - заведомо ограничивают выбор только "доморощенными" системами. К сему мудрому замечанию, остается сожалеть, что большинство и ведется на мимирикоскую термину "фулсерчу"... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2007, 17:49 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Di_LIne Ну и что? Тот же ЛАЙКЕ с вариациями... И это называют ФулСерчем?.... Вы будете смеяться, но это действительно называется "ФулСерчем". Принципиальные разницы следующие: 1 в скорости обработки запросов. LIKE сканирует каждый раз весь текст документа, а при полнотекстовом поиске выполняется индексация всех входящих в документ слов и дальнйший поиск выполняется с помощью индексов. 2 в использовании фильтров (поиск выполняется в документах любых форматов - doc, pdf, xml и т. п.). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2007, 18:05 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Di_LIne Развернытый пример я уже приводил тут... Поэтому я и просил уточнить, о каком поиске идет речь - морфологическом, полнотекстовом или комбинированном (тот и другой одновременно). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2007, 18:10 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
ЮВПоэтому я и просил уточнить, о каком поиске идет речь - морфологическом, полнотекстовом или комбинированном (тот и другой одновременно). Свое имхо я уже выскаывал вот тут. Так как в моем понимании применять оные термины можно только неразрывно. Ибо, приводя пятничную паралель, Вам говорят, что у Вас стакан FULL. Вы его ап в организм! А он пуст... - Интресно, что Вы сделаете с афтАром такой "шутки"? Возвращаясь к термину "полнотекстовый поиск", праралель таже самая: - Я ищу слово "библиотечная". 1. Должен ли "полнотекстовый поиск" возвращать как результатах поиска и поиск по другим морфемам данного слова, если по заданной морфоформе ничего не найдено? 2. Как "действуют" в такой ситуации указанные системы "полнотекстового поиска"? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2007, 18:28 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Di_LIne Так как в моем понимании применять оные термины можно только неразрывно. Поэтому я и говорю, что прежде всего надо договориться об однозначно понимаемой терминологии. Di_LIne Ибо, приводя пятничную паралель, Вам говорят, что у Вас стакан FULL. Вы его ап в организм! А он пуст... - Интресно, что Вы сделаете с афтАром такой "шутки"? Все зависит от взглядов автора шутки и употребляющего.. "Вам говорят, что у Вас стакан FULL". Не уточняя при этом, чем он FULL- спирт содержащей жидкостью (морфологический состав) или смесью азота и кислорода (полнотекстовый состав). "Вы его ап в организм! А он пуст..." В смысле сам стакан ? Тогда результат мало зависит от его содержимого. Если "ап в организм" содержимое стакана, то надо понимать, какое наполнение стакана ожидаете получить - спирт содержащую жидкость (обеспечили поддержку морфоформ, т. е. "налили") или азотно-кислородный коктейль (полнотекстовый поиск). А если сначала не договорились о содержимом, то последствия будут печальные... Могут подраться... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2007, 19:15 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
ЮВ Di_LIne Так как в моем понимании применять оные термины можно только неразрывно. Поэтому я и говорю, что прежде всего надо договориться об однозначно понимаемой терминологии. О чем я с самого начала топика и спрашиваю... Но... Всем лень читать весь.... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.06.2007, 13:33 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Di_LIne О чем я с самого начала топика и спрашиваю... Но... Всем лень читать весь.... Вы спросили про полнотекстовый поиск - вам ответили, что под этим понимается. Вы хотите, что СУБД обеспечивала морфологический поиск. Другой товарищ пожелал иметь синонимический поиск. Третий захочет, например, лингвистический поиск с учетои иностранных языков (например, запрос формируется на русском языке, а поиск ведется с учетом перевода в китайских, английских и т. п. документах). Четвертому приспичит семантический поиск. Запросы людей обширны и многогранны. Имхо, всё это есть функции специализированных информационно-поисковых систем (ИПС) (как например, графические системы), а не универсальных СУБД. ИПС могут строиться на основе СУБД, но не подменять их. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.06.2007, 19:07 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
ЮВИмхо, всё это есть функции специализированных информационно-поисковых систем (ИПС) (как например, графические системы), а не универсальных СУБД. ИПС могут строиться на основе СУБД, но не подменять их. ... и по сему, так как это "надстройка" над СУБД, в принципе реализуемеая на любой СУБД. По сути, в данном разрезе, так ни кто ничего и не ответил... А посему - это уже перетерание перетертого пюре, что в принципе мне не интересно... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.06.2007, 19:17 |
|
||
|
Сравнение систем Full Text Search
|
|||
|---|---|---|---|
|
#18+
Вот кандидат на сравнение. Русский Текст - Поиск Модуль DataBlade "Русский Текст - Поиск" - это библиотека типов данных и функций, которые расширяют Informix Dynamic Server таким образом, чтобы позволить осуществить более сложный и быстрый поиск по текстовым данным, чем сравнение по ключевым словам, которое предоставляет стандартный SQL. Возможности DataBlade "Русский Текст - Поиск" добавляет серверу баз данных следующие возможности: поиск с учетом всех морфологических форм заданного слова; логические запросы произвольной степени сложности с операторами "И", "ИЛИ", "НЕ"; нечеткий поиск документов с учетом возможных опечаток; поиск по словам, встречающимся на заданном расстоянии друг от друга, при помощи операторов расстояния и соседства; поиск по точной фразе; поиск по документам, представленным в различных форматах, включая издательские системы, публикации в Web и др.; представление результатов поиска по документам, хранящимся в базе данных, в виде текста или текстового файла; настройка на лексику заказчика; поддержка многоязычных документов; построение комбинированных запросов, сочетающих различные виды поиска. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.06.2007, 10:19 |
|
||
|
|

start [/forum/topic.php?all=1&fid=35&tid=1553296]: |
0ms |
get settings: |
10ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
40ms |
get topic data: |
12ms |
get forum data: |
3ms |
get page messages: |
80ms |
get tp. blocked users: |
1ms |
| others: | 11ms |
| total: | 178ms |

| 0 / 0 |
