powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Релевантность
10 сообщений из 60, страница 3 из 3
Релевантность
    #36486479
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Блин парень! Определись на чём ты будешь писать. Я больше тебя не могу консультировать по сферическому коню в вакууме!
...
Рейтинг: 0 / 0
Релевантность
    #36486509
gnot
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
maytonБлин парень! Определись на чём ты будешь писать. Я больше тебя не могу консультировать по сферическому коню в вакууме!
блин надо сначала определиться, что мы хотим написать. А потом уже на чем! Ну на яве+Оракл для БД) И что дальше?
...
Рейтинг: 0 / 0
Релевантность
    #36486528
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Отлично. Тогда ты можешь обойтись вообще без СУБД. Читал про Lucene?
...
Рейтинг: 0 / 0
Релевантность
    #36486581
gnot
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
maytonОтлично. Тогда ты можешь обойтись вообще без СУБД. Читал про Lucene?
Конечно стыдно, но не читал) Но в задании сказано про базы данных..
...
Рейтинг: 0 / 0
Релевантность
    #36486598
gnot
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
это свободная библиотека для высокоскоростного полнотекстового поиска, написанная на Java.
...
Рейтинг: 0 / 0
Релевантность
    #36486603
gnot
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Так.
1)
Полноте́кстовый по́иск -поиск документа в базе данных текстов на основании содержимого этих документов, а также совокупность методов оптимизации этого процесса
Современные алгоритмы заранее формируют для поиска так называемый полнотекстовый индекс — словарь, в котором перечислены все слова и указано, в каких местах они встречаются. При наличии такого индекса достаточно осуществить поиск нужных слов в нём и тогда сразу же будет получен список документов, в которых они встречаются
2)
Текстовые возможности СУБД Oracle основаны на использовании специального вида индекса, являющегося одним из встроенных в систему вариантов «предметного» индекса (domain index), используемого для организации работы со сложно устроенными данными. Oracle Text имеет в готовом виде три вида текстового индекса:

* CTXSYS.CONTEXT - для выполнения полнотекстового поиска по текстовым документам;

То есть, CTXSYS.CONTEXT - это и есть тот самый полнотекстовый индекс — словарь?
...
Рейтинг: 0 / 0
Релевантность
    #36486920
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
gnotТекстовые возможности СУБД Oracle основаны на использовании специального вида индекса, являющегося одним из встроенных в систему вариантов «предметного» индекса (domain index), используемого для организации работы со сложно устроенными данными. Oracle Text имеет в готовом виде три вида текстового индекса:

* CTXSYS.CONTEXT - для выполнения полнотекстового поиска по текстовым документам;

То есть, CTXSYS.CONTEXT - это и есть тот самый полнотекстовый индекс — словарь?
Вобщем ты двигаешься в правильном направлении. Только задаёшь слишком сложные формулировки вопросов. Какая вобшем-то разница предметный он или доменный. Забей. Эти определения ровным счётом ничего не значат для твоей работы. Читай примеры. Изучай. Дальше я тебе не помошник. Понадобится конкретный вопрос по OracleText - подними новую ветку. Ну всё.

Оревуар.
...
Рейтинг: 0 / 0
Релевантность
    #36489023
gnot
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Вот! Сделаю так.
http://www.citforum.ru/database/articles/rel_search.shtml
По этому принципу. То есть таблица с Document (имя документа, расположение в файловой системе,), Term(поле-список терминов-фраз), таблица Term_in_Doc-термины в документах(содержит частоту вхождения тех или иных фраз в тот или иной документ).
Но мы имеем только частоту вхождения той или иной фразы в тот или иной документ...

То есть, может частота вхождения в документ фразы служить критерием релевантности??????

Или еще надо что-то накрутить? Например, не по частоте, а по какому-то другому критерию?
...
Рейтинг: 0 / 0
Релевантность
    #36489080
gnot
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
или вообще по тупому сделать:
в БД таблицу ТЕРМИНОЛОГИЯ с полями:
id фраза релевантность

И у для каждой фразы ставить соответственно число(в поле релевантность). Чем больше это число, тем больше релевантность

Так хоть можно??? Конечно тупо, но зачем замудряться, если в задании о большем не сказано?
...
Рейтинг: 0 / 0
Релевантность
    #36490840
gnot
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
maytongnotО! Представим себе, что словосочетания находятся в каком -либо поле в таблице БД.
Здесь - архитектурный просчёт. Поисковые системы по тексту так не проектируются. Если вы хотите обсуждать термин релевантность - это одно. А если вы фантазируете на тему, как работает TextSearch - то скорее всего ошибаетесь. Я вообще не понимаю в чём смысл такого (очевидно ненормализованного) хранения данных.
хм... Вроде как примерно так и делается...
Вот примеры:
http://www.citforum.ru/database/oracle/oratext_easy/
http://www.citforum.ru/database/articles/rel_search.shtml

Или я чего-то не понял?
...
Рейтинг: 0 / 0
10 сообщений из 60, страница 3 из 3
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Релевантность
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]