|
|
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
Di_LIneS.G.Di_LIne, Будь любезен, покажи определение понятия "полнотекстовый поиск" и то, что в него входит и морфология. Я вот, не нашел. Нашел другое: Тошь мне, нашел аф_таритет, педивикию... Ну во всяком случае википедия для меня бОльший авторитет.. гораздо бОльший, чем Di_LIne Di_LIne И так. Технология называется "Full Text Search". Дайте дословный перевод этого названия на русский и его смысл. Пожалуйста. Поиск по всему тексту. Ни слова о том, каким конкретно должен быть поиск. Смысл: есть текст, мы по нему ищем слова. Di_LIne А пока - немножко теории. В русском языке слово может иметь 12 форм: по 6 падежных форм для единственного и множественного числа для существительных. Меня мало волнуют словоформы русского языка. Меня волнует, почему ты решил, что в определении Full Text Serach должен обязательно входить и поиск словоформ? Почему? Я понимаю, что так оно лучше. Но, имхо, в определение не входит. Ок, вот моя идея: Чуть раньше, когда компы были не такими мощными, было трудно, вернее- медленно, просто найти слово в большом объеме текста, так как грубо говоря %like% дает плохой результат по времени. Когда разработали алгоритм такого поиска, быстрого, он и был назван FTS. Далее, так как аппетит приходит во время еды, были разработаны способы поиска словоформ. В принципе, их тоже можно отнести к FTS, а можно и не относить. Не случайно в моей ссылке есть разделение "интеллектуальный поиск" и "текстовый поиск". ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 18:52 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
Di_LIneЗайцев Фёдорможно ссылку хоть на одну статью? Ышо раз: Ссылко на Яндекс. пасиба. там нет ничего о "полнотекстовости". вообще. как и в прошлый раз, видимо. Di_LIne Смотреть - 2-й радел. Где русским по белому написано " Зачем нужны морфология и синтаксис или Как искать ветра в поле " которую я уже приводил в топиге... тут тоже нет ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 18:53 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
Зайцев ФёдорDi_LIne3. Полный - подразумевает использование в работе полный набор Правил того языка, к которому система применяется. если не секрет, откуда берутся такие формулировки? - Как это откуда? - Как можно програмировать на Сях, Дельфях и тп, не зная Правил программирования, ситнаксис и особенности данного языка? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 18:56 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
S.G.Di_LIne А пока - немножко теории. В русском языке слово может иметь 12 форм: по 6 падежных форм для единственного и множественного числа для существительных. Меня мало волнуют словоформы русского языка. Меня волнует, почему ты решил, что в определении Full Text Serach должен обязательно входить и поиск словоформ? А, кстати, зря... И в том же посте, чуть ниже, я привел пример и попросил дать ответы на конкреные вопросы по примеру. Но что-то ни кто не ответил вообще НИЧЕГО по ним. Это так, реплика в сторону, если не нравится. А обязательность использования морфологии я показал на примерах, и в часности, для создания систем "документооборота". Но опять - НИ КТО ни чего не смог возразить... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 19:02 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
Di_LIne Ышо раз: Ссылко на Яндекс. Смотреть - 2-й радел. Где русским по белому написано " Зачем нужны морфология и синтаксис или Как искать ветра в поле " которую я уже приводил в топиге...Спасибо. И где там написано: "Яндекс осуществляет технологию Full Text Search, которая включает как простой поиск, так и поиск словоформ"? Да, там написано: авторЗадача Яndex.Dict - понимание и расширение запроса пользователя и передача обработанного запроса независимому поисковому механизму. Яndex.Dict работает с уже готовым индексом, созданным без учета морфологии языка. Принцип взаимодействия Яndex.Dict с поисковым механизмом — преобразование ("морфологизация") поискового запроса, то есть каждый элемент поискового запроса, опознаваемый как слово русского языка, заменяется на все его словоформы.Но они нигде не называют это "полнотекстовым поиском". Они называют это поиском со включенной "морфологизацией" запроса. Ы? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 19:05 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
Di_LIne А обязательность использования морфологии я показал на примерах, и в часности, для создания систем "документооборота". Но опять - НИ КТО ни чего не смог возразить...не-а, Di_Line ни что несмог до казать. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 19:07 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
Зайцев Фёдорпасиба. там нет ничего о "полнотекстовости". вообще. как и в прошлый раз, видимо. Видимо пока не прочитаете ДОСЛОВНО - не успокоится народ. Не лично! Ладно... Но КОНКРЕТНЫЕ ПРИМЕРЫ , приведенные в топике, уж извольте или опровергнуть, или согласиться с ними. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 19:07 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
Di_LIneЗайцев ФёдорDi_LIne3. Полный - подразумевает использование в работе полный набор Правил того языка, к которому система применяется. если не секрет, откуда берутся такие формулировки? - Как это откуда? - Как можно програмировать на Сях, Дельфях и тп, не зная Правил программирования, ситнаксис и особенности данного языка? некто в этой теме пытается убедить оппонентов в том, что его представление о фтс истинное. по дороге всплывают доверительно съеденные собаки, ПРаВИЛА рУссКогО языкА, ссылки на статьи о пользе морфологии, правила программирования и синтаксис Си и т.д. однако ни из чего пока не следует, что вышеупомянутое представление является общепринятым или хотя бы поддерживается множеством авторитетных организаций. на данный момент более-менее достоверно известно, что 1) Di_LIne согласен с мнением Di_LIne и не согласен с мнением остальных высказавшихся 2) МП поддерживает Di_LIne, а не его точку зрения. маловато будет 2-х человек для общепринятости и одного Di_LIne в качестве признанного авторитетной. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 19:10 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
S.G.Но они нигде не называют это "полнотекстовым поиском". Они называют это поиском со включенной "морфологизацией" запроса. Ы? Из той же статьи: ЯндексРаспространено мнение, что шаблон "*", означающий любой набор символов, достаточен для поиска в русских текстах . ... и ниже по тексту. И еще от туда же: ЯндексОтсутствие морфологии сильно, а иногда катастрофически влияет на чувствительность и избирательность поиска. Ы? А FTS откровенно лагает на конкретных, приведенных выше, примерах. Ну и какая наф от него польза тогда, ы? И еще раз, отправная точка : авторНету там ни какого "полнотекстового поиска" для русского языка. Не-ту! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 19:13 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
Hello, Зайцев! You wrote on Wed, 22 Jul 09 16:10:15 GMT: Зайцев ЗФ> некто в этой теме пытается убедить оппонентов в том, что его представление о фтс истинное. ты станешь спорить с MS? повторяю для упёртых. FTS от MS для английского (и прочих "нерусских") языка работает с учетом морфологии. для русского - нет (по крайней мере до 2005 включительно). в 2005 было обещано, но не реализовано. есть сторонние разработки, позволяющие задействовать полноценный FTS для русского языка на платформе MS. вплоть до MS SQL-2000. благо интерфейс и движок у MS для этого имеется. но вы конечно можете продолжать квадратное катать, а круглое носить. ваше право. -- With best regards, Мимопроходящий. Posted via ActualForum NNTP Server 1.4 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 19:22 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
S.G., Народ, не парьтесь, у него просто нормально объяснить не получается ;-) Если понимать FTS как "обычный большой индекс" всей текстовой информации (как LIKE), то его работа будет очень, очень, очень, очень, очень, очень медленной. С целью увеличения скорости работы такого поиска, при создании FTS данные предварительно обрабатываются. Это позволяет не только сократить объем самого индекса, а соответственно и скорость работы, но и искать слова в других словоформах. Теоретически, это можно назвать "морфологическим анализом", т.к. обработка основана на правилах естественного языка. Но ее цель не "анализировать", а "увеличить производительность". Другими словами, FTS без морфологического анализа будет работать, но очень медленно. Поэтому в современных БД индексируемые данные для FTS предварительно обрабатывается с учетом морфологии. Можно сказать, что Di_LIne прав в том, что в FTS используется морфологический анализ, но он путает причину и следствие. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 19:22 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
Зайцев Фёдороднако ни из чего пока не следует, что вышеупомянутое представление является общепринятым или хотя бы поддерживается множеством авторитетных организаций. Мда... Это - полный ПАРАГРАФ. Бо, ссылаюсь на исторический факт и авторитетное развитие Истории, как вы любите: 1. Теория Относительности Энштейна - опрокидывала Афтаритетные мнения в... 2. Коперник - тоже переворачивал систему мировозрения с головы на ноги... Если бы кто-то не ставил под сомнения аФФтаритетоф, то сидели бы по самые уши в первобытном дерьме. Ни кто Науку бы не развивал, не пытался осмыслить заново, не ставил бы конкреных экспериментов обрушивающих все предыдущие представляения и запихивающих тех самых аФФтаритетов к г... посамые не балуйся. А сидели бы и кидались сцылками на афтаритеты, которые есть Истина в последней инстанции. - Фсио! Теперь мона и забанится. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 19:23 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
РеалистДругими словами, FTS без морфологического анализа будет работать, но очень медленно. Не, ты не в теме.... С морфологией-то как раз и растут затраты времени на обработку. Но с ней - резко растет ТОЧНОСТЬ поиска. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 19:26 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
Да, кста! Дайте, плиз, ссылку (хотя бы одну), что поведение FTS для указанных примеров - есть единственно правильное и иначе быть не должно. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 19:29 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
Мимопроходящийты станешь спорить с MS? повторяю для упёртых. сорь, иногда мне нужно по 2.75 раза повторять нет, конечно. они же про свою реализацию пишут. а вот это - тип данных timestamp по их версии ) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 19:37 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
Di_LIne Мда... Это - полный ПАРАГРАФ. Бо, ссылаюсь на исторический факт и авторитетное развитие Истории, как вы любите: 1. Теория Относительности Энштейна - опрокидывала Афтаритетные мнения в... 2. Коперник - тоже переворачивал систему мировозрения с головы на ноги... Если бы кто-то не ставил под сомнения аФФтаритетоф, то сидели бы по самые уши в первобытном дерьме. Ни кто Науку бы не развивал, не пытался осмыслить заново, не ставил бы конкреных экспериментов обрушивающих все предыдущие представляения и запихивающих тех самых аФФтаритетов к г... посамые не балуйся. А сидели бы и кидались сцылками на афтаритеты, которые есть Истина в последней инстанции. - Фсио! Теперь мона и забанится. т.е. некто Di_LIne позволил себе хамить лишь потому, что 1) он гением, первооткрывателем, носителем нового знания о полнотекстовом поиске, по причине чего любое его определение истинно 2) никто не может подтвердить его правоту, т.к. остальное человечество просто ещё не доросло это понимания сути. 3) простым смертным не дозволяется высказывать иметь мнение, отличное от Истинного. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 19:43 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
Зайцев Фёдора вот это - тип данных timestamp по их версии )А что, хороший пример. У меня вопрос к апологетам FTS: - Поле timestamp учитывается в FTS по названию месяца и/или прописью? Типо бландынко набрала: - Все документы в сентябре... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 19:46 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
Hello, Зайцев! You wrote on Wed, 22 Jul 09 16:37:10 GMT: ЗФ> Зайцев ФёдорМимопроходящийты станешь спорить с MS? ЗФ> нет, конечно. ЗФ> они же про свою реализацию пишут.итак, нет возражений, касаемо FTS от MS? идём дальше. как обстоят дела с "английским" у Оракл Текст? -- With best regards, Мимопроходящий. Posted via ActualForum NNTP Server 1.4 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 19:52 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
Зайцев Фёдор, еще раз: - Дайте ссылку на авторитетный источник, где бы утверждалось, что поведение FTS относительно Русского языка, НЕ учитывать морфологию, правильное и быть так должно . Я хоть какую-то смог нарыть, что морфологию нужно учитывать. - Ждем-с, ответного хода аппонентов... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 19:52 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
Мимопроходящий идём дальше. Да ну его, МП... Дело же не в сути вопроса, а в 2-х вещах: 1. Прикрутил к проекту FTS - и ниии...фсё! - У мну все крута, а юзверь сам дурак, искать не умеет. 2. Можно гордо в бумашке к проекту написать: - Система обеспечивает полнотекстовый поиск по документам. И срубить на сем бабла. А если будут притензии - см п.1 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 19:59 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
Меня вообще удивляет, как о проблемах поиска с учетом морфологии может высказывыться человек, который не в состоянии формулировать свои мысли на русском языке, я говорю Di_Line. Причем я понимаю, что он использует "падонкаффский" сленг специально, но мы ведь на инженерном sql.ru а не на форуме подростков-малолеток, верно? Предлагаю топик закрыть, т.к. его автор уже давно во всем разобрался, а троллинг откровенно раздражает. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 20:00 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
Ggg_old, Поддерживаю! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 20:04 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
Ggg_old но мы ведь на инженерном sql.ru а не на форуме подростков-малолеток, верно? Верно, кто же спорит? Вот и дайте четкий, инженерный ответ, почему НЕ нужно учитывать морфологию. Я уже какой раз об этом прошу... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 20:14 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
Di_LIneВерно, кто же спорит? Вот и дайте четкий, инженерный ответ, почему НЕ нужно учитывать морфологию. Я уже какой раз об этом прошу... Вау, вот это в натуре другой базар! На не гнилые комменты и ответить не в падлу ;-)))))))))) По теме топика: Под FTS каждый производитель БД понимает то, что он реализовал. Ссылку на MS тебе уже давали. Вот на 1С , вот PostgeSQL , вот MySQL . Действительно, там есть поиск с учетом морфологии языка, действительно учитывать при поиске морфологию нужно . Но анализ морфологии - это следствие оптимизации FTS. Но никак не на оборот. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 20:33 |
|
||
|
Выбор СУБД с полнотекстовым поиском
|
|||
|---|---|---|---|
|
#18+
Реалист, для начала: Толковый словарь Ожегова Морфология - раздел граматики, наука о частях речи , об их категориях и о формах слов РеалистДействительно, там есть поиск с учетом морфологии языка... Морфология языка - это как? Это так, на заметку что бы взять... Реалист действительно учитывать при поиске морфологию нужно . Ок! А если она НЕ учитывается, как в случае FTS, тогда что? Реалист Но анализ морфологии... Анализ морфологии СЛОВА - сделают лингвисты, напишут Правила, внесут учебники, словари и тп. Реалист Но анализ морфологии - это следствие оптимизации FTS. Но никак не на оборот. То есть морфология слов в Языке появляется из-за оптимизации FTS? Или же FTS должна быть оптимизирована под морфологию применяемую в конкретном Языке, литературном, разговорном и тд? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2009, 20:54 |
|
||
|
|

start [/forum/search_topic.php?author=Gernichenko&author_mode=last_topics&do_search=1]: |
0ms |
get settings: |
11ms |
get forum list: |
14ms |
get settings: |
10ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
44ms |
get topic data: |
10ms |
get forum data: |
3ms |
get page messages: |
60ms |
get tp. blocked users: |
1ms |
| others: | 486ms |
| total: | 660ms |

| 0 / 0 |
