powered by simpleCommunicator - 2.0.59     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Другие СУБД [игнор отключен] [закрыт для гостей] / СУБД Тайга
25 сообщений из 340, страница 12 из 14
СУБД Тайга
    #38239276
Ukraine
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
iv_an_ru,

нет, позиции слов такой индекс (с 99% сжатием) не содержит. Только вхождения.
Но уверяю вас, ваша фраза выдаст искомые документы, поскольку чем больше слов в фразе тем точнее поиск по документу.
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239278
Фотография iv_an_ru
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ukraine"полнотекстовый поиск от стороннего производителя для индексации литералов"А вот фиг вам, а не сторонний производитель.
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239279
Фотография iv_an_ru
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ukraineнет, позиции слов такой индекс (с 99% сжатием) не содержит. Только вхождения.Фтопку. Как после этого сортировать по релевантности?
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239281
Фотография iv_an_ru
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
UkraineНо уверяю вас, ваша фраза выдаст искомые документы, поскольку чем больше слов в фразе тем точнее поиск по документу.Ну поищите в английском корпусе длинную фразу "To be, or not to be: that is the question" без учёта позиций слов. Вы найдёт почти все индексированные документы.
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239282
Ukraine
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
iv_an_ruUkraineнет, позиции слов такой индекс (с 99% сжатием) не содержит. Только вхождения.Фтопку. Как после этого сортировать по релевантности?

Как вариант, допустим из хранилища вернулось 10 таких документов.
Тогда эти документы читаются с диска и анализируются более подробно.

Но ты не понял саму суть такого инвертированого индекса. Полнотекстовый поиск здесь по большому счету наклейка.
А если смотреть глубже то это тоже РДФ хранилище.

Ведь например можно хранить такие документы.

"Документ Кот"=>"серые глаза длинный хвост усы ловит мышей пьет молоко"
"Документ Собака"=>"длинный хвост зеленые глаза ест косточки пьет воду"
"Документ Ежик"=>"серые глаза короткий хвост иголки усы ловит мышей пьет молоко"
....

Как видим, здесь уже нет понятие порядок фразы, ближе фраза дальше фраза. Просто обьект и факт о этом обьекте.
И такую схему я могу хранить все с темже 95-99% сжатием. А вы - нет :)
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239284
Ukraine
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
iv_an_ruUkraineНо уверяю вас, ваша фраза выдаст искомые документы, поскольку чем больше слов в фразе тем точнее поиск по документу.Ну поищите в английском корпусе длинную фразу "To be, or not to be: that is the question" без учёта позиций слов. Вы найдёт почти все индексированные документы.

ваш индекс тоже ничего не найдет, потому что там везде стоп слова или слова по два символа (малозначащие).
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239285
Ukraine
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ukraineiv_an_ruпропущено...
Фтопку. Как после этого сортировать по релевантности?

Как вариант, допустим из хранилища вернулось 10 таких документов.
Тогда эти документы читаются с диска и анализируются более подробно.

Но ты не понял саму суть такого инвертированого индекса. Полнотекстовый поиск здесь по большому счету наклейка.
А если смотреть глубже то это тоже РДФ хранилище.

Ведь например можно хранить такие документы.

"Документ Кот"=>"серые глаза длинный хвост усы ловит мышей пьет молоко"
"Документ Собака"=>"длинный хвост зеленые глаза ест косточки пьет воду"
"Документ Ежик"=>"серые глаза короткий хвост иголки усы ловит мышей пьет молоко"
....

Как видим, здесь уже нет понятие порядок фразы, ближе фраза дальше фраза. Просто обьект и факт о этом обьекте.
И такую схему я могу хранить все с темже 95-99% сжатием. А вы - нет :)

А, ну и запрос "пьет молоко ловит мышей", вернет Кота и Ежика :)
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239286
Фотография iv_an_ru
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
UkraineКак вариант, допустим из хранилища вернулось 10 таких документов.
Тогда эти документы читаются с диска и анализируются более подробно.Ага, значит все равно появляется диск со всеми документами в исходном виде. Только у себя мы их не считаем за гигабайты, а у других считаем. Прелестно.
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239289
Фотография iv_an_ru
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ukraineiv_an_ruНу поищите в английском корпусе длинную фразу "To be, or not to be: that is the question" без учёта позиций слов. Вы найдёт почти все индексированные документы.ваш индекс тоже ничего не найдет, потому что там везде стоп слова или слова по два символа (малозначащие).Стоп они или не стоп, я решу сам. Но если вас это смущает, рассмотрите фразу "Mother Mary comes to me speaking words of wisdom", которая даст почти тот же эффект --- все слова очень ходовые.
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239330
Oleg77777
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
MX-9Oleg77777Вот тут все знатоки Кэша, а вот скажите мне, там есть иерархии на измерениях, или что-то подобное?

А в других "многомерных" СУБД?

CACHE ( а также все его MUMPS-язычные родственники и родители - DIAMS - MSM -GTM - MINIM )
- это деревья стволом вверх ветвями вниз

каждая ветка суть "измерение" (мерность)

на концах ветвей обязательно и в развилках необязательно прицеплены текстовые строки ("записи")

выше по дереву - выше по иерархии
^o - пример обращения к самой верхней точке перевернутого дерева
^o("вес машины ФФ-6543") - это обращение к одной из характеристик некоторого экземпляра из класса обьектов
^o("вес машины ФФ-6534","в том числе вес кабины")- а это к характеристике его некоторой составной части

все
------------------------------------


Спасибо, про это я и спрашивал. Теперь знаю, как жизнь устроена. Нужно больше думать про дерева.
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239351
Фотография Вечность
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
UkrainemaytonМожно еще спросить астро-физика в чём профит его наблюдений за
спектрами и излучениями? Обидеться. Или по мордасам ударит.
Или оба кейса.

Нет, хороший астрофизик на пальцах обьяснит что такое спектр.
Что звук и свет, как не странно имеют одну природу. Разнятся только длиной волны.
Что цвет это тоже длина волны и так далее.Я бы на такого хорошего астрофизика сама бы обиделась и даже кейсом по мордасам ударила бы!
Даже я, такая вот вся блондинко, и то знаю, что звук и свет существенно разную природу имеют!
Достаточно хотя бы вспомнить, что звук - продольные колебания, свет - поперечные.
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239361
Ukraine
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
iv_an_ruUkraineКак вариант, допустим из хранилища вернулось 10 таких документов.
Тогда эти документы читаются с диска и анализируются более подробно.Ага, значит все равно появляется диск со всеми документами в исходном виде. Только у себя мы их не считаем за гигабайты, а у других считаем. Прелестно.

есть формат збруч-2 и там, если нужно по точному вхождению фразы искать, хранятся позиции слов. Но сжатие 85%
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239365
Ukraine
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
iv_an_ruUkraineпропущено...
ваш индекс тоже ничего не найдет, потому что там везде стоп слова или слова по два символа (малозначащие).Стоп они или не стоп, я решу сам. Но если вас это смущает, рассмотрите фразу "Mother Mary comes to me speaking words of wisdom", которая даст почти тот же эффект --- все слова очень ходовые.

Статистика говорит что 99.9% слов редкоиспользуемые.
Вот взять этот сайт и тоже самое 0.1% слов встречается больше чем на сто страницах из миллионов.
Кури бесконечную дисперсию.
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239369
Ukraine
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Поэтому ты удивишся, но на твою фразу найдется куда меньше доков чем ты думаешь.
На этом сайте так я думаю не более пары доков )
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239381
Ukraine
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ВечностьUkraineпропущено...


Нет, хороший астрофизик на пальцах обьяснит что такое спектр.
Что звук и свет, как не странно имеют одну природу. Разнятся только длиной волны.
Что цвет это тоже длина волны и так далее.Я бы на такого хорошего астрофизика сама бы обиделась и даже кейсом по мордасам ударила бы!
Даже я, такая вот вся блондинко, и то знаю, что звук и свет существенно разную природу имеют!
Достаточно хотя бы вспомнить, что звук - продольные колебания, свет - поперечные.

Не внимательно прочитала.
Я написал что имеют одинаковую ПРИРОДУ.
Тоесть суть - колебания волны в разных диапазонах.
Звук и свет радиоволны инфракрасный диапазон и тд
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239393
Ukraine
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ukraineiv_an_ruпропущено...
Фтопку. Как после этого сортировать по релевантности?

Как вариант, допустим из хранилища вернулось 10 таких документов.
Тогда эти документы читаются с диска и анализируются более подробно.

Но ты не понял саму суть такого инвертированого индекса. Полнотекстовый поиск здесь по большому счету наклейка.
А если смотреть глубже то это тоже РДФ хранилище.

Ведь например можно хранить такие документы.

"Документ Кот"=>"серые глаза длинный хвост усы ловит мышей пьет молоко"
"Документ Собака"=>"длинный хвост зеленые глаза ест косточки пьет воду"
"Документ Ежик"=>"серые глаза короткий хвост иголки усы ловит мышей пьет молоко"
....

Как видим, здесь уже нет понятие порядок фразы, ближе фраза дальше фраза. Просто обьект и факт о этом обьекте.
И такую схему я могу хранить все с темже 95-99% сжатием. А вы - нет :)

Я как понимаю к этому посту претензий нет ?
Оказывается "банальный полнотекстовый поиск" суть рдф упрощенной модели со свойствами хранить дынные в очень пожатом виде ))
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239401
Ukraine
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
maytonUkraine, извини уже поздно. Я под воздействием Морфея и слабо следил за дискурсом.

РДФ - это что?

Очередная мулька нынче модная среди новосибирцев
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239413
Ukraine
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вечность,

Кстате картинко. От радиации до радиоволн. Спектр, специально для блондинок
http://ru.m.wikipedia.org/wiki/Файл:Spectre.svg
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239421
Vladimir Baskakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ukraineiv_an_ru,

Так что, либрусек можно представить в качестве направленного графа с миллиардами графов или нет ?
так мне неинтересно слова искать. Мне нужно цепочками. с выпадающими звеньями. с обработкой морфем. что б на запрос ==кошка кушала котлету== откликалось и ==кошки с удовольствием кушали вкусные котлеты==.

Хочу такой либрусек. Будет?
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239428
Vladimir Baskakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
оффтопом - почему локальный поиск гугла и яндекса угробили? Удобно же было. Что вместо использовать?
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239430
iv_an_ruUkraineНо уверяю вас, ваша фраза выдаст искомые документы, поскольку чем больше слов в фразе тем точнее поиск по документу.Ну поищите в английском корпусе длинную фразу "To be, or not to be: that is the question" без учёта позиций слов. Вы найдёт почти все индексированные документы.

Этот человек неделю назад не знал смысла слова MVCC (и возможно не знает до сих пор). Что ты хочешь от него?

Восходящая звезда.... такая звезда...
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239431
Ukraine
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вечность,

http://www.bestreferat.ru/referat-95465.html

Вот еще. Обратить внимание на табличку.
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239441
Vladimir BaskakovUkraineiv_an_ru,

Так что, либрусек можно представить в качестве направленного графа с миллиардами графов или нет ?
так мне неинтересно слова искать. Мне нужно цепочками. с выпадающими звеньями. с обработкой морфем. что б на запрос ==кошка кушала котлету== откликалось и ==кошки с удовольствием кушали вкусные котлеты==.

Хочу такой либрусек. Будет?

На стебельке? Конечно не будет. Автору станет скучно заниматься своим курсовым проектом намного раньше, чем он осознает необходимость и вообще факт существования морфем.
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239442
Ukraine
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Vladimir BaskakovUkraineiv_an_ru,

Так что, либрусек можно представить в качестве направленного графа с миллиардами графов или нет ?
так мне неинтересно слова искать. Мне нужно цепочками. с выпадающими звеньями. с обработкой морфем. что б на запрос ==кошка кушала котлету== откликалось и ==кошки с удовольствием кушали вкусные котлеты==.

Хочу такой либрусек. Будет?

Стемить слова нужно. В моем случае можно слова шаблонами задавать.

Напр.
"кошк% кушал% котлет%"

% - это любой символ или набор символов
...
Рейтинг: 0 / 0
СУБД Тайга
    #38239446
Ukraine
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Проясним ситуац,

Грекс вернулся.
Рад что ты зализал раны выпрямил хвост и прибежал опять на клич срача.
На этот раз подготовился по методичкам или будет как прошлый раз ? )
...
Рейтинг: 0 / 0
25 сообщений из 340, страница 12 из 14
Форумы / Другие СУБД [игнор отключен] [закрыт для гостей] / СУБД Тайга
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]