|
|
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
Блин парень! Определись на чём ты будешь писать. Я больше тебя не могу консультировать по сферическому коню в вакууме! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.02.2010, 17:58:36 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
maytonБлин парень! Определись на чём ты будешь писать. Я больше тебя не могу консультировать по сферическому коню в вакууме! блин надо сначала определиться, что мы хотим написать. А потом уже на чем! Ну на яве+Оракл для БД) И что дальше? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.02.2010, 18:09:43 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
Отлично. Тогда ты можешь обойтись вообще без СУБД. Читал про Lucene? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.02.2010, 18:20:49 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
maytonОтлично. Тогда ты можешь обойтись вообще без СУБД. Читал про Lucene? Конечно стыдно, но не читал) Но в задании сказано про базы данных.. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.02.2010, 18:56:46 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
это свободная библиотека для высокоскоростного полнотекстового поиска, написанная на Java. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.02.2010, 19:02:38 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
Так. 1) Полноте́кстовый по́иск -поиск документа в базе данных текстов на основании содержимого этих документов, а также совокупность методов оптимизации этого процесса Современные алгоритмы заранее формируют для поиска так называемый полнотекстовый индекс — словарь, в котором перечислены все слова и указано, в каких местах они встречаются. При наличии такого индекса достаточно осуществить поиск нужных слов в нём и тогда сразу же будет получен список документов, в которых они встречаются 2) Текстовые возможности СУБД Oracle основаны на использовании специального вида индекса, являющегося одним из встроенных в систему вариантов «предметного» индекса (domain index), используемого для организации работы со сложно устроенными данными. Oracle Text имеет в готовом виде три вида текстового индекса: * CTXSYS.CONTEXT - для выполнения полнотекстового поиска по текстовым документам; То есть, CTXSYS.CONTEXT - это и есть тот самый полнотекстовый индекс — словарь? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.02.2010, 19:08:10 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
gnotТекстовые возможности СУБД Oracle основаны на использовании специального вида индекса, являющегося одним из встроенных в систему вариантов «предметного» индекса (domain index), используемого для организации работы со сложно устроенными данными. Oracle Text имеет в готовом виде три вида текстового индекса: * CTXSYS.CONTEXT - для выполнения полнотекстового поиска по текстовым документам; То есть, CTXSYS.CONTEXT - это и есть тот самый полнотекстовый индекс — словарь? Вобщем ты двигаешься в правильном направлении. Только задаёшь слишком сложные формулировки вопросов. Какая вобшем-то разница предметный он или доменный. Забей. Эти определения ровным счётом ничего не значат для твоей работы. Читай примеры. Изучай. Дальше я тебе не помошник. Понадобится конкретный вопрос по OracleText - подними новую ветку. Ну всё. Оревуар. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.02.2010, 23:18:14 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
Вот! Сделаю так. http://www.citforum.ru/database/articles/rel_search.shtml По этому принципу. То есть таблица с Document (имя документа, расположение в файловой системе,), Term(поле-список терминов-фраз), таблица Term_in_Doc-термины в документах(содержит частоту вхождения тех или иных фраз в тот или иной документ). Но мы имеем только частоту вхождения той или иной фразы в тот или иной документ... То есть, может частота вхождения в документ фразы служить критерием релевантности?????? Или еще надо что-то накрутить? Например, не по частоте, а по какому-то другому критерию? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.02.2010, 22:10:34 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
или вообще по тупому сделать: в БД таблицу ТЕРМИНОЛОГИЯ с полями: id фраза релевантность И у для каждой фразы ставить соответственно число(в поле релевантность). Чем больше это число, тем больше релевантность Так хоть можно??? Конечно тупо, но зачем замудряться, если в задании о большем не сказано? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.02.2010, 23:12:05 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
maytongnotО! Представим себе, что словосочетания находятся в каком -либо поле в таблице БД. Здесь - архитектурный просчёт. Поисковые системы по тексту так не проектируются. Если вы хотите обсуждать термин релевантность - это одно. А если вы фантазируете на тему, как работает TextSearch - то скорее всего ошибаетесь. Я вообще не понимаю в чём смысл такого (очевидно ненормализованного) хранения данных. хм... Вроде как примерно так и делается... Вот примеры: http://www.citforum.ru/database/oracle/oratext_easy/ http://www.citforum.ru/database/articles/rel_search.shtml Или я чего-то не понял? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.02.2010, 18:12:19 |
|
||
|
|

start [/forum/topic.php?fid=16&msg=36486581&tid=1343863]: |
0ms |
get settings: |
8ms |
get forum list: |
10ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
183ms |
get topic data: |
6ms |
get forum data: |
1ms |
get page messages: |
26ms |
get tp. blocked users: |
1ms |
| others: | 203ms |
| total: | 442ms |

| 0 / 0 |
