powered by simpleCommunicator - 2.0.59     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Сравнение СУБД [игнор отключен] [закрыт для гостей] / Сравнение систем Full Text Search
62 сообщений из 62, показаны все 3 страниц
Сравнение систем Full Text Search
    #34547844
Фотография MasterZiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Hi, all !

Никто нигде не натыкался на сравнение систем полнотекстового поиска
в СУБД ?

--

Posted via ActualForum NNTP Server 1.4
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34548512
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
MasterZiv
Никто нигде не натыкался на сравнение систем полнотекстового поиска
в СУБД ?
А что есть - полнотекстовый поиск? Смысла в этом словосочетании ни на грош...
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34548527
Фотография MasterZiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Di_LIne пишет:

> А что есть - полнотекстовый поиск?

Full Text Search
Posted via ActualForum NNTP Server 1.4
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34548656
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
MasterZiv
Di_LIne пишет:

> А что есть - полнотекстовый поиск?

Full Text Search
Спасибо! А то по-аглицки я и не знал как пишется...
- Смысл этого "фулл" в чем заключается?
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34548697
Фотография ChA
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Di_LIne - Смысл этого "фулл" в чем заключается?У Вас не работает Google ?
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34548755
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ChA Di_LIne - Смысл этого "фулл" в чем заключается?У Вас не работает Google ?
Это чье-то мнение... Может оное к англицкаму и применимо...
А вот к рассейскому - сомнения меня берут.
Так как, если говорить о "фул", то без морфологии в русском - не обойтись...
А система формообразования слов в русском языке значительно сложнее, чем в аглицком.
Вот я и спрашиваю - какой смысл чел вкладывает в это "фулл"?
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34548816
Фотография ChA
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Di_LIneВот я и спрашиваю - какой смысл чел вкладывает в это "фулл"?Есть подозрение, что общепринятый. Вот, например, о полнотекстовом поиске . Или Вы не верите, что "full text search" эквивалентно "полнотекстовый поиск" ?

P.S. IMHO, придирки на пустом месте.
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34548874
DocAl
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Di_LIne ChA Di_LIne - Смысл этого "фулл" в чем заключается?У Вас не работает Google ?
Это чье-то мнение... Может оное к англицкаму и применимо...
А вот к рассейскому - сомнения меня берут.
Так как, если говорить о "фул", то без морфологии в русском - не обойтись...
А система формообразования слов в русском языке значительно сложнее, чем в аглицком.
Вот я и спрашиваю - какой смысл чел вкладывает в это "фулл"?
Если тебе это кажется сложным, вовсе не значит, что не существует решений. Вот , например.
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34548971
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
DocAlЕсли тебе это кажется сложным, вовсе не значит, что не существует решений. Вот , например.
Ага! Тогда поясните мене такой разрез, если теоритически не понятно, на примере:
Код: plaintext
1.
2.
3.
4.
5.
 ДОСКА                      -> ДОЩЕЧКА                   -> ДОСОЧКА
 Падежные формы ед. числа   Падежные формы ед. числа     Падежные формы ед. числа
 Падежные формы мн. числа   Падежные формы мн. числа     Падежные формы мн. числа
 Прилагательные             Прилагательные               Прилагательные
 Наречие                    Наречие                      Наречие  
По какой схеме должен осуществляться поиск?
1. Поиск ТОЛЬКО точной словоформы данного слова.
2. по вертикали, в рамках только словоформ существительного.
3. тоже, но и с учетом словоформ М и Ж рода
4. тоже, но с учетом морфем прилагательных и наречий
5. весь "примоугольник"
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34548985
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ChA[quot Di_LIne] Или Вы не верите, что "full text search" эквивалентно "полнотекстовый поиск" ?
За каждым термином скрывается определенный смысл.... Я - только о нем.
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34549092
akurgan
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
lucene рулит. очень удобно, быстро и не только для СУБД.
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34549801
Фотография S.G.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Di_LIne
По какой схеме должен осуществляться поиск?
1. Поиск ТОЛЬКО точной словоформы данного слова.
2. по вертикали, в рамках только словоформ существительного.
3. тоже, но и с учетом словоформ М и Ж рода
4. тоже, но с учетом морфем прилагательных и наречий
5. весь "примоугольник"Если где-то существует сравнение систем полнотекстового поиска, о котором просил автор, то вероятно, в нем эти подробности будут освещены. К сожалению, мне не приходилось заниматься этим, поэтому мне неизвестны ни такие сравнения, ни системы. Но если кто- то даст ссылку на такое сравнение, или просто список систем с описанием, это (имхо) будет гораздо полезнее для темы и автора, чем раскрытие на 10-ти страницах наиболее полного смысла слова "full".
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34549821
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Всвязи с "разбродом и шатанием" в толковании терминов, ответ на данный вопрос завист от контекста, стоящего за термином у автора. И в каком-либо сравнении, имхо, не будут сводить воедино морфологический поиск и поиск "на точное вхождение", так как по сути, форме и организации - это две, совершенно различные, по сложности и организации, системы.
Для первого варианта - ссылок вагон .
А по второму - хотя бы тот же МюСкульный "фул текст серчь"... По нему Дока_Олл может дать более компетентный ответ...
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34549840
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
DocAlЕсли тебе это кажется сложным, вовсе не значит, что не существует решений. Вот , например.
Дока_Олл... Мы опять про старое?
Даже у Яндекса(!) до сих пор есть заморочки с морфологией русского языка.
Так как, по их же признанию, идет непрерывный рост кол-ва новых слов и словоформ...
Для примера - "падонкавский" сленг.
- Это жизнь...
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34550157
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Для уточнения.

Рекомендую посмотреть склонения слов расейскаго языку:
1. с беглой Ё и О - берёг>берегла; любовь>любви(д.п.); церковь>церквей(мн,р.п.) и тп.
2 "она-нок" - ребенок>ребенка(р.п.)
3. с беглой Е - камень>камня(р.п.); свинец>свинца(р.п.); горошек>горошка(р.п.) и тп.
4. с беглой О - петушок>петушка(р.п.); коготь>когтя(р.п.); огонь>огня(р.п.) и тп.
5. с беглой Ё и Й - паёк>пайку(д.п.); буёк>буйком(т.п.)
6. существительные существующие только во мн.ч. - сласти>сластями(т.п.); бусы>бусам(д.п.)
7. существительные м.р. на -ор с беглой о: только ед.ч. - багоР>багРа(р.п.)
8. - земля>землЕю(т.п.); армия>армий(мн,р.п.); спальня>спален(мн,р.п.); беглец>беглецов(мн,в.п.)

... ну и хватит.

Тогда вапрос: какой тарабарскмй "ХВУЛ СЁРЧЬ" с этим справиться???

ЗЫ
Да! Вот ышо замечательный пример, приведу полностью:
---------------------------------------------------------
вошь>вша(и.п.)
вошь>вшу(р.п.)
вошь>вше(д.п.)
вошь>вшой(т.п.)
вошь>вошах(п.п.)
вошь>вошью(т.п.)
вошь>воши(и.п.)
вошь>вошей(р.п.)
вошь>вошам(д.п.)
вошь>вошами(Т.п.)
вошь>вши(мн,и.п.)
вошь>вшей(мн,р.п.)
вошь>вшам(мн,д.п.)
вошь>вшами(мн,т.п.)
вошь>вшах(мн,п.п.)
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34550310
htd
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
htd
Гость
Di_LIne
Тогда вапрос: какой тарабарскмй "ХВУЛ СЁРЧЬ" с этим справиться???

Например наш рассейский, с соответствующими словарями. Для "албанского" ispell делайте сами
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34550349
Фотография SergSuper
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Di_LIneДля уточнения.

Рекомендую посмотреть склонения слов расейскаго языку:
1. с беглой Ё и О - берёг>берегла; любовь>любви(д.п.); церковь>церквей(мн,р.п.) и тп.
2 "она-нок" - ребенок>ребенка(р.п.)
3. с беглой Е - камень>камня(р.п.); свинец>свинца(р.п.); горошек>горошка(р.п.) и тп.
4. с беглой О - петушок>петушка(р.п.); коготь>когтя(р.п.); огонь>огня(р.п.) и тп.
5. с беглой Ё и Й - паёк>пайку(д.п.); буёк>буйком(т.п.)
6. существительные существующие только во мн.ч. - сласти>сластями(т.п.); бусы>бусам(д.п.)
7. существительные м.р. на -ор с беглой о: только ед.ч. - багоР>багРа(р.п.)
8. - земля>землЕю(т.п.); армия>армий(мн,р.п.); спальня>спален(мн,р.п.); беглец>беглецов(мн,в.п.)

... ну и хватит.

Тогда вапрос: какой тарабарскмй "ХВУЛ СЁРЧЬ" с этим справиться???

ЗЫ
Да! Вот ышо замечательный пример, приведу полностью:
---------------------------------------------------------
вошь>вша(и.п.)
вошь>вшу(р.п.)
вошь>вше(д.п.)
вошь>вшой(т.п.)
вошь>вошах(п.п.)
вошь>вошью(т.п.)
вошь>воши(и.п.)
вошь>вошей(р.п.)
вошь>вошам(д.п.)
вошь>вошами(Т.п.)
вошь>вши(мн,и.п.)
вошь>вшей(мн,р.п.)
вошь>вшам(мн,д.п.)
вошь>вшами(мн,т.п.)
вошь>вшах(мн,п.п.)
Вы же эти правила как то запомнили - и компьютер сможет. Правил литературного языка ограниченное количество, а сленг включать необязательно
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34550360
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
htd
Например наш рассейский, с соответствующими словарями. Для "албанского" ispell делайте сами
Сам проверл эти словари, али ток так. тынцнул?...
1. Так вот, в тех словарях нет:
- Фамилий, коих поболее 100.000;
- Отчеств, коих за 40.000;
- Далеко не полный состав Имен. Для примера - нет уменьшительно-ласкательных форм.
- Географических, исторических и прочих химическо-физическо-математически-металургически-финансовых и прочая, прочая, прочая терминов.
Колих, по моей имхе, поболее 6.000.000 "базовых" словоформ насчитывается...
- Числительные - не представлены ва-апче как класс.
Сии мои утверждения легко проверяются...

2. russian.aff - изобилует ошибками, неточностями и полным отсутствием некоторых частей.
В часности - для числительных, местоимений, а так же ряда исключений из Правил орфографии
Русского языка.
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34550379
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
SergSuperВы же эти правила как то запомнили - и компьютер сможет. Правил литературного языка ограниченное количество, а сленг включать необязательно
Дело-то не в Правилах... С этим я с Вами полностью согласен!
А в построении "поисковых последовательностей" образуемых словоформ...
Ведь мы говорим о Full Text Search.
Мюскульный "фул серчь" дает очень прикольные варианты:
Например: При поиске слова "библиотечная" - не дает результата, но при поиске "библиотечный" - результат есть.
То есть - это поиск всего лишь "на точное вхождение"...
Но ни как не фулл...
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34550469
Локшин Марк
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
SergSuperПравил литературного языка ограниченное количество, а сленг включать необязательно
Дело в том, что правила составляли филологи, а у них понятие логики "немного" отличается от того, что принято в математике. Вот недавно в интернете уточнял про правописание частиц:
http://booference.pochta.ru/ortho_xvii.htmlЧастицы бы (б), же (ж), ли (ль) пишутся раздельно, например: сделал бы, если бы, если б, однако же, однако ж, вот же ж ты какой, едва ли, всегда ль.
Примечание. Правило не распространяется на те случаи, когда указанные частицы входят в состав цельных слов, например: чтобы, также, неужели и др.

Раздельно пишутся частицы ведь, вот, мол и некоторые другие.
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34550477
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Локшин МаркДело в том, что правила составляли филологи, а у них понятие логики "немного" отличается от того, что принято в математике.... а юзаем эти Правила - мы с вами.
То есть: - Как хотим, так и юзаем, поплевывая на все Правила, в кучке и россыпью.
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34550487
LeXa NalBat
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Di_LIne, что вы привязались к морфологии? Например в постгресовом tsearch, ссылку на который уже давали, эти системы разделены. И стэммер может включать в себя не только морфологию, а например перевод из HTML в TEXT. И морфологию можно использовать любую, самописную например. :) Да, морфологию и FTS эффективно использовать совместно, но не нужно смешивать. Хотя возможно в других субд они жестко связаны.

Tsearch V2 Readme
OpenFTS vs Tsearch2
OpenFTS is a middleware between application and database. OpenFTS uses tsearch2 as a storage and database engine as a query executor (searching). Everything else, i.e. parsing of documents, query processing, linguistics, carry outs on client side.
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34550510
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
LeXa NalBatDi_LIne, что вы привязались к морфологии?
См. мой первый пост...
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34550515
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Еще аспект:
- При поступлении запроса с орфографической ошибкой - что должна делать система Full Text Search ?
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34550538
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
LeXa NalBatДа, морфологию и FTS эффективно использовать совместно, но не нужно смешивать. Я об этом уже говорил ...
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34550625
Фотография MasterZiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Я прошу господина Di_Line-a создать новый топег для апсуждения праблем сложнастей риализации
систем текставага поиска для рускава языка и там эта фсе апсуждать. Ежу ясно что без словоформ эти системы никому не нужны.
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34550671
Фотография MasterZiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34551186
sergkarpenko
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34551244
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
MasterZivЯ прошу господина Di_Line-a создать новый топег для апсуждения праблем сложнастей риализации
систем текставага поиска для рускава языка и там эта фсе апсуждать. Ежу ясно что без словоформ эти системы никому не нужны.
Интересно, а FTS этот текст сможет разобрать?
- Не лично, а так, тяпницей навеяно...
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34551257
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Особенно мне понравилось сравнение с МногоСерчем, заброшенным, имхо, в году эдак 2003-2004...
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34551295
моррут
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Di_LIneОсобенно мне понравилось сравнение с МногоСерчем, заброшенным, имхо, в году эдак 2003-2004...

а это что?
8 May 2007: mnoGoSearch 3.3.3 is now available Take a look into ChangeLog
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34551310
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
моррут а это что?
8 May 2007: mnoGoSearch 3.3.3 is now available Take a look into ChangeLog
- Ап_мишурился чуток... Лет, порядка, на пяток...
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34551341
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Покачивая ногой, задумчиво в потолок:
- И какАго рожна Яндекс, Рамблер и ВебАльта выяживаются, изобретая что-то свое?...
- Бери и юзай на полное щастьё!
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34552239
DocAl
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Di_LIneДля уточнения.

Рекомендую посмотреть склонения слов расейскаго языку:
1. с беглой Ё и О - берёг>берегла; любовь>любви(д.п.); церковь>церквей(мн,р.п.) и тп.
2 "она-нок" - ребенок>ребенка(р.п.)
3. с беглой Е - камень>камня(р.п.); свинец>свинца(р.п.); горошек>горошка(р.п.) и тп.
4. с беглой О - петушок>петушка(р.п.); коготь>когтя(р.п.); огонь>огня(р.п.) и тп.
5. с беглой Ё и Й - паёк>пайку(д.п.); буёк>буйком(т.п.)
6. существительные существующие только во мн.ч. - сласти>сластями(т.п.); бусы>бусам(д.п.)
7. существительные м.р. на -ор с беглой о: только ед.ч. - багоР>багРа(р.п.)
8. - земля>землЕю(т.п.); армия>армий(мн,р.п.); спальня>спален(мн,р.п.); беглец>беглецов(мн,в.п.)

... ну и хватит.

Тогда вапрос: какой тарабарскмй "ХВУЛ СЁРЧЬ" с этим справиться???

Полнотекстовый поиск используется для фильтрации результатов поиска, выдаваемых для анализа человеку. Никто по фуллтексту ракеты не наводит и ядерными реакторами не управляет, так что приемлемо частичное решение задачи, которое может вызывать как ложные срабатывания, так и пропускать часть нужных результатов. Конечно, чем лучше результаты -- тем лучше, но невозможность идеального решения не означает невостребованности частичных.
Указанные проблемы с беглыми гласными решаются словарём, отсутствие же отдельных словоформ для полнотекстового поиска особой проблемой не является, если кроме "дощечки" будет искаться "придощечно" ничего страшного от того, что такого слова нет, не случится.
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34552283
LeXa NalBat
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
DocAlесли кроме "дощечки" будет искаться "придощечно" ничего страшного от того, что такого слова нет, не случитсяOFF: знаете, что такое "фотобарабать"? это первая форма от "фотобарабан" по используемой у нас морфологии. :-)
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34552330
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
LeXa NalBatOFF: знаете, что такое "фотобарабать"? это первая форма от "фотобарабан" по используемой у нас морфологии. :-)
- Ты, вашсродь, глаголами на выражайся и причастия нас не матери...
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34552339
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
DocAl... если кроме "дощечки" будет искаться "придощечно" ничего страшного...
Дока_Олл, чёт (и нечет тож) у меня не палучлись про склонять и проспрягать это "придощечно"...
- Агласте, пжаласта, весь спск....
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34552748
DocAl
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Просклонять-проспрягать наречие?
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34552753
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
DocAlПросклонять-проспрягать наречие?
А-а-а... Хоть не причастие... Но на фамилий очень похоже...
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34553529
Фотография iscrafm
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
MasterZivЯ прошу господина Di_Line-a создать новый топег для апсуждения праблем сложнастей риализации
систем текставага поиска для рускава языка и там эта фсе апсуждать. Ежу ясно что без словоформ эти системы никому не нужны.
а словоформы подобные кому нужны?
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34569375
Фотография Cat2
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Модератор форума
Сравнивать-то особо нечего. Нетрудно выбрать слова, построить по им индекс в базе данных, организовать отношение многие ко многим слово - единица хранения текста.
Сложно сделать морфолологический разбор для разных языков. Особо наблюдательные могли заметить, что на странице "Поиск" нашего любимого сайта есть чекбокс - "с учетом морфлогогии". Не помню, кто подарил Judge этот функционал. Ноблагдарен фирме, названия которой я не помню.

Помню, что она продается за нехилые деньги, поскольку она была, а может и сейчас есть ЕДИНСТВЕННАЯ разработка для морфлогически ориентированного поиска по русскому тексту в MS SQL. С чем ее сравнивать? Есть конкурирующие продукты?
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34569417
DocAl
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Возможно, я по-разному воспринимаю англоязычный термин stemming и "морфологический разбор", но мне кажется, полноценный морфологический разбор -- штука слишком сложная и не столь необходимая для полнотекстового поиска, хотя и немного снижающая ложные срабатывания. Ну а стемминг в том же сфинксе есть, сравнивайте на здоровье.)
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34579453
Lepsik
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Cat2
Помню, что она продается за нехилые деньги, поскольку она была, а может и сейчас есть


Это 50 баксов - нехилые деньги ?

Cat2
ЕДИНСТВЕННАЯ разработка для морфлогически ориентированного поиска по русскому тексту в MS SQL. С чем ее сравнивать? Есть конкурирующие продукты?

Пользуйтесь тогда MSSQL2005 - там это бесплатно. Или поиском по этому сайту - конкурирующих продуктов полно
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34582888
мимо
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Oracle10g
Oracle Text + RCO
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34585098
ЮВ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Di_LIne
А что есть - полнотекстовый поиск? Смысла в этом словосочетании ни на грош...

Описание полнотекстового поиска в СУБД ЛИНТЕР

"FullSearch Linter"]http://www.linter.ru/lindoc/pdf_file/phrase.pdf
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34585146
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ЮВ Di_LIne
А что есть - полнотекстовый поиск? Смысла в этом словосочетании ни на грош...

Описание полнотекстового поиска в СУБД ЛИНТЕР

"FullSearch Linter"]http://www.linter.ru/lindoc/pdf_file/phrase.pdf
Это то, как понимают и реализовали это предствление разработчики ЛИНТЕР...
СУБД ЛИНТЕР со средствами фразового поиска рекомендуется использовать в проектах,
где основными определяющими факторами являются скорость поиска и извлечения
текста по фразе в больших хранилищах информации (например, интернет-сервер).
Средства фразового поиска дают возможность упростить схему хранения данных в
приложении и избежать создания некоторых дополнительных таблиц.
Система фразового поиска обеспечивает:
• варианты поиска слов: по началу, окончанию, части слова, целому слову, поиск с
использованием символов шаблона;
• поиск по словам, набранным с ошибками (нечеткий поиск). Поддерживаются три
основных типа ошибок (пропуск, вставка, замена буквы);
• поиск с учетом и без учета регистра букв;
• поиск близкорасположенных слов и фраз с известным порядком слов;
• поиск по названию и значению атрибута в файлах с гипертекстовой разметкой;
• автоматическое определение кодировки русскоязычного текста.
В СУБД ЛИНТЕР версии 6.0 и выше дополнительно обеспечивается:
• поддержка многобайтных кодировок и иероглифических символов;
• хранение информации в кодировке UNICODE.

... и ни слова о поиске по морфоформа того же слова.
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34585760
assa
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Di_LIne... и ни слова о поиске по морфоформа того же слова.а чо только морфоформы?
а синонимическим поиском и поиском "по смыслу" кто-нито занимается?
А то сплошь и рядом нужен поиск доков, касающихся вполне определенного контекста, но какими словесами этот контекст будет оформлен - предположить бывает трудно. Да и если и есть предположения - количество иных контекстов, обвязанных теми же словесами - подчас пугающе велико.
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34586081
ЮВ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Di_LIne
... и ни слова о поиске по морфоформа того же слова.

Если под термином "морфоформа" понимается вариант словоизменения, то там описаны следующие модификаторы шаблона поиска:

SENSITIVE Задает чувствительный к регистру поиск
PARTIALLY Задает поиск документов, в которых заданный шаблон поиска может встречаться в любом месте слова
AT_BEGIN Задает поиск документов, в которых заданный шаблон поиска может встречаться только в начале слов
AT_END Задает поиск документов, в которых заданный шаблон поиска может встречаться только в конце слов
FUZZY Задает нечеткий поиск

Т. е. конструкции типа "искать по всем морфоформам", например, слова "РЕЛЯЦИОННАЯ", нет.
Если имеется ввиду что-то иное - уточните.
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34586499
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ЮВSENSITIVE\tЗадает чувствительный к регистру поиск
PARTIALLY\tЗадает поиск документов, в которых заданный шаблон поиска может встречаться в любом месте слова
AT_BEGIN\tЗадает поиск документов, в которых заданный шаблон поиска может встречаться только в начале слов
AT_END\tЗадает поиск документов, в которых заданный шаблон поиска может встречаться только в конце слов
Ну и что? Тот же ЛАЙКЕ с вариациями...
И это называют ФулСерчем?....


ЮВ
Если имеется ввиду что-то иное - уточните.
Развернытый пример я уже приводил тут...
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34586514
just me
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Вообще-то делают так:

The Verity thesaurus operator expands a search to include the specified word
and its synonyms (for information on using the thesaurus operator, see
“thesaurus” on page 57). You can create a custom thesaurus that contains
application-specific synonyms to use in place of the default thesaurus.
For example, the default English language thesaurus contains these words as
synonyms for “money:” “cash,” “currency,” “lucre,” “wampum,” and
“greenbacks.” You can create a custom thesaurus that contains a different set
of synonyms for “money,” such as: ”bid,” “tokens,” “credit,” “asset,” and
“verbal offer.”
To create a custom thesaurus:
...
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34586525
Мимопроходящий
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Привет, just!
Ты пишешь:

justjm> Вообще-то делают так:кто и что?

--
With best regards, Мимопроходящий.

Posted via ActualForum NNTP Server 1.4
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34586637
just me
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Мимопроходящий
Привет, just!
Ты пишешь:

justjm> Вообще-то делают так:кто и что?

--
With best regards, Мимопроходящий.

Posted via ActualForum NNTP Server 1.4

Из доки по EFTS. Что это? Хочешь синонимы, склонения, учёт морфологии - бери словарь и подключай свой справочник вместо дефолтного и ищи на здоровье с учётом всего этого или без него. С моей точки зрения - это правильное решение. Я против того, чтобы америкосы или кто-нибудь не русский составлял такой справочник для меня. А те, кто хочет сразу и всё готовое - заведомо ограничивают выбор только "доморощенными" системами.
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34586680
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
just me Я против того, чтобы америкосы или кто-нибудь не русский составлял такой справочник для меня. А те, кто хочет сразу и всё готовое - заведомо ограничивают выбор только "доморощенными" системами.
К сему мудрому замечанию, остается сожалеть, что большинство и ведется на мимирикоскую термину "фулсерчу"...
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34586713
ЮВ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Di_LIne Ну и что? Тот же ЛАЙКЕ с вариациями...
И это называют ФулСерчем?....


Вы будете смеяться, но это действительно называется "ФулСерчем".
Принципиальные разницы следующие:
1 в скорости обработки запросов.
LIKE сканирует каждый раз весь текст документа, а при полнотекстовом поиске выполняется индексация всех входящих в документ слов и дальнйший поиск выполняется с помощью индексов.
2 в использовании фильтров (поиск выполняется в документах любых форматов - doc, pdf, xml и т. п.).
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34586722
ЮВ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Di_LIne
Развернытый пример я уже приводил тут...

Поэтому я и просил уточнить, о каком поиске идет речь - морфологическом, полнотекстовом или комбинированном (тот и другой одновременно).
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34586750
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ЮВПоэтому я и просил уточнить, о каком поиске идет речь - морфологическом, полнотекстовом или комбинированном (тот и другой одновременно).
Свое имхо я уже выскаывал вот тут.
Так как в моем понимании применять оные термины можно только неразрывно.
Ибо, приводя пятничную паралель, Вам говорят, что у Вас стакан FULL.
Вы его ап в организм! А он пуст...
- Интресно, что Вы сделаете с афтАром такой "шутки"?

Возвращаясь к термину "полнотекстовый поиск", праралель таже самая:
- Я ищу слово "библиотечная".
1. Должен ли "полнотекстовый поиск" возвращать как результатах поиска и поиск по другим морфемам данного слова, если по заданной морфоформе ничего не найдено?
2. Как "действуют" в такой ситуации указанные системы "полнотекстового поиска"?
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34586807
ЮВ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Di_LIne
Так как в моем понимании применять оные термины можно только неразрывно.


Поэтому я и говорю, что прежде всего надо договориться об однозначно понимаемой терминологии.

Di_LIne
Ибо, приводя пятничную паралель, Вам говорят, что у Вас стакан FULL.
Вы его ап в организм! А он пуст...
- Интресно, что Вы сделаете с афтАром такой "шутки"?

Все зависит от взглядов автора шутки и употребляющего..
"Вам говорят, что у Вас стакан FULL". Не уточняя при этом, чем он FULL- спирт содержащей жидкостью (морфологический состав) или смесью азота и кислорода (полнотекстовый состав).

"Вы его ап в организм! А он пуст..." В смысле сам стакан ? Тогда результат мало зависит от его содержимого. Если "ап в организм" содержимое стакана, то надо понимать, какое наполнение стакана ожидаете получить - спирт содержащую жидкость (обеспечили поддержку морфоформ, т. е. "налили") или азотно-кислородный коктейль (полнотекстовый поиск).
А если сначала не договорились о содержимом, то последствия будут печальные...
Могут подраться...
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34591612
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ЮВ Di_LIne
Так как в моем понимании применять оные термины можно только неразрывно.


Поэтому я и говорю, что прежде всего надо договориться об однозначно понимаемой терминологии.

О чем я с самого начала топика и спрашиваю...
Но... Всем лень читать весь....
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34592980
ЮВ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Di_LIne О чем я с самого начала топика и спрашиваю...
Но... Всем лень читать весь....

Вы спросили про полнотекстовый поиск - вам ответили, что под этим понимается.
Вы хотите, что СУБД обеспечивала морфологический поиск.
Другой товарищ пожелал иметь синонимический поиск.
Третий захочет, например, лингвистический поиск с учетои иностранных языков (например, запрос формируется на русском языке, а поиск ведется с учетом перевода в китайских, английских и т. п. документах).
Четвертому приспичит семантический поиск.
Запросы людей обширны и многогранны.
Имхо, всё это есть функции специализированных информационно-поисковых систем (ИПС) (как например, графические системы), а не универсальных СУБД. ИПС могут строиться на основе СУБД, но не подменять их.
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34593005
Фотография Di_LIne
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ЮВИмхо, всё это есть функции специализированных информационно-поисковых систем (ИПС) (как например, графические системы), а не универсальных СУБД. ИПС могут строиться на основе СУБД, но не подменять их.
... и по сему, так как это "надстройка" над СУБД, в принципе реализуемеая на любой СУБД.
По сути, в данном разрезе, так ни кто ничего и не ответил...
А посему - это уже перетерание перетертого пюре, что в принципе мне не интересно...
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34619201
!
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
!
Гость
Вот кандидат на сравнение.


Русский Текст - Поиск

Модуль DataBlade "Русский Текст - Поиск" - это библиотека типов данных и функций, которые
расширяют Informix Dynamic Server таким образом, чтобы позволить осуществить более сложный и
быстрый поиск по текстовым данным, чем сравнение по ключевым словам, которое предоставляет
стандартный SQL.


Возможности


DataBlade "Русский Текст - Поиск" добавляет серверу баз данных следующие возможности:

поиск с учетом всех морфологических форм заданного слова;

логические запросы произвольной степени сложности с операторами "И", "ИЛИ", "НЕ";

нечеткий поиск документов с учетом возможных опечаток;

поиск по словам, встречающимся на заданном расстоянии друг от друга, при помощи операторов
расстояния и соседства;

поиск по точной фразе;

поиск по документам, представленным в различных форматах, включая издательские системы,
публикации в Web и др.;

представление результатов поиска по документам, хранящимся в базе данных, в виде текста или
текстового файла;

настройка на лексику заказчика;


поддержка многоязычных документов;

построение комбинированных запросов, сочетающих различные виды поиска.
...
Рейтинг: 0 / 0
Сравнение систем Full Text Search
    #34620868
ЮВ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Статья о полнотекстовом поиске в Oracle:

http://www.interface.ru/home.asp?artId=5679
...
Рейтинг: 0 / 0
62 сообщений из 62, показаны все 3 страниц
Форумы / Сравнение СУБД [игнор отключен] [закрыт для гостей] / Сравнение систем Full Text Search
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]