Релевантность / Программирование

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Программирование [игнор отключен] [закрыт для гостей] / Релевантность

10 сообщений из 60, страница 3 из 3

все

Релевантность

#36486479

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Блин парень! Определись на чём ты будешь писать. Я больше тебя не могу консультировать по сферическому коню в вакууме!

...

Рейтинг:

0 / 0

24.02.2010, 17:58:36

| Ответить | Цитировать | Написать

Релевантность

#36486509

gnot

Гость

maytonБлин парень! Определись на чём ты будешь писать. Я больше тебя не могу консультировать по сферическому коню в вакууме!
блин надо сначала определиться, что мы хотим написать. А потом уже на чем! Ну на яве+Оракл для БД) И что дальше?

...

Рейтинг:

0 / 0

24.02.2010, 18:09:43

| Ответить | Цитировать | Написать

Релевантность

#36486528

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Отлично. Тогда ты можешь обойтись вообще без СУБД. Читал про Lucene?

...

Рейтинг:

0 / 0

24.02.2010, 18:20:49

| Ответить | Цитировать | Написать

Релевантность

#36486581

gnot

Гость

maytonОтлично. Тогда ты можешь обойтись вообще без СУБД. Читал про Lucene?
Конечно стыдно, но не читал) Но в задании сказано про базы данных..

...

Рейтинг:

0 / 0

24.02.2010, 18:56:46

| Ответить | Цитировать | Написать

Релевантность

#36486598

gnot

Гость

это свободная библиотека для высокоскоростного полнотекстового поиска, написанная на Java.

...

Рейтинг:

0 / 0

24.02.2010, 19:02:38

| Ответить | Цитировать | Написать

Релевантность

#36486603

gnot

Гость

Так.
1)
Полноте́кстовый по́иск -поиск документа в базе данных текстов на основании содержимого этих документов, а также совокупность методов оптимизации этого процесса
Современные алгоритмы заранее формируют для поиска так называемый полнотекстовый индекс — словарь, в котором перечислены все слова и указано, в каких местах они встречаются. При наличии такого индекса достаточно осуществить поиск нужных слов в нём и тогда сразу же будет получен список документов, в которых они встречаются
2)
Текстовые возможности СУБД Oracle основаны на использовании специального вида индекса, являющегося одним из встроенных в систему вариантов «предметного» индекса (domain index), используемого для организации работы со сложно устроенными данными. Oracle Text имеет в готовом виде три вида текстового индекса:

* CTXSYS.CONTEXT - для выполнения полнотекстового поиска по текстовым документам;

То есть, CTXSYS.CONTEXT - это и есть тот самый полнотекстовый индекс — словарь?

...

Рейтинг:

0 / 0

24.02.2010, 19:08:10

| Ответить | Цитировать | Написать

Релевантность

#36486920

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

gnotТекстовые возможности СУБД Oracle основаны на использовании специального вида индекса, являющегося одним из встроенных в систему вариантов «предметного» индекса (domain index), используемого для организации работы со сложно устроенными данными. Oracle Text имеет в готовом виде три вида текстового индекса:

* CTXSYS.CONTEXT - для выполнения полнотекстового поиска по текстовым документам;

То есть, CTXSYS.CONTEXT - это и есть тот самый полнотекстовый индекс — словарь?
Вобщем ты двигаешься в правильном направлении. Только задаёшь слишком сложные формулировки вопросов. Какая вобшем-то разница предметный он или доменный. Забей. Эти определения ровным счётом ничего не значат для твоей работы. Читай примеры. Изучай. Дальше я тебе не помошник. Понадобится конкретный вопрос по OracleText - подними новую ветку. Ну всё.

Оревуар.

...

Рейтинг:

0 / 0

24.02.2010, 23:18:14

| Ответить | Цитировать | Написать

Релевантность

#36489023

gnot

Гость

Вот! Сделаю так.
http://www.citforum.ru/database/articles/rel_search.shtml
По этому принципу. То есть таблица с Document (имя документа, расположение в файловой системе,), Term(поле-список терминов-фраз), таблица Term_in_Doc-термины в документах(содержит частоту вхождения тех или иных фраз в тот или иной документ).
Но мы имеем только частоту вхождения той или иной фразы в тот или иной документ...

То есть, может частота вхождения в документ фразы служить критерием релевантности??????

Или еще надо что-то накрутить? Например, не по частоте, а по какому-то другому критерию?

...

Рейтинг:

0 / 0

25.02.2010, 22:10:34

| Ответить | Цитировать | Написать

Релевантность

#36489080

gnot

Гость

или вообще по тупому сделать:
в БД таблицу ТЕРМИНОЛОГИЯ с полями:
id фраза релевантность

И у для каждой фразы ставить соответственно число(в поле релевантность). Чем больше это число, тем больше релевантность

Так хоть можно??? Конечно тупо, но зачем замудряться, если в задании о большем не сказано?

...

Рейтинг:

0 / 0

25.02.2010, 23:12:05

| Ответить | Цитировать | Написать

Релевантность

#36490840

gnot

Гость

maytongnotО! Представим себе, что словосочетания находятся в каком -либо поле в таблице БД.
Здесь - архитектурный просчёт. Поисковые системы по тексту так не проектируются. Если вы хотите обсуждать термин релевантность - это одно. А если вы фантазируете на тему, как работает TextSearch - то скорее всего ошибаетесь. Я вообще не понимаю в чём смысл такого (очевидно ненормализованного) хранения данных.
хм... Вроде как примерно так и делается...
Вот примеры:
http://www.citforum.ru/database/oracle/oratext_easy/
http://www.citforum.ru/database/articles/rel_search.shtml

Или я чего-то не понял?

...

Рейтинг:

0 / 0

26.02.2010, 18:12:19

| Ответить | Цитировать | Написать

10 сообщений из 60, страница 3 из 3

все

Форумы / Программирование [игнор отключен] [закрыт для гостей] / Релевантность

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=16&msg=36486581&tid=1343863]:	0ms
get settings:	8ms
get forum list:	10ms
check forum access:	2ms
check topic access:	2ms
track hit:	183ms
get topic data:	6ms
get forum data:	1ms
get page messages:	26ms
get tp. blocked users:	1ms
others:	203ms

total:	442ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы