|
|
|
Полнотекстовый поиск в ASA
|
|||
|---|---|---|---|
|
#18+
Здравствуйте. Пробовал ли кто-нибудь новый полнотекстовый поиск в ASA, разумеется, с данными на русском языке? Как я понял, он не понимает грамматических форм слов, но поддерживает n-граммы. Насколько он быстрый, стабильный и т. п.? В данный момент две базы на PostgreSQL c "родным" полнотекстовым поиском (tsearch2) и "репликацией" путем периодического дампа таблиц с помощью pg_dump, копирования и заливки с предварительным удалением старой таблицы (размер базы пока позволяет). Одна из баз находится на VPS, на котором работает сайт, вторая - в офисе. В связи с этим интересует возможность реальной репликации с помощью SQLRemote. Использую java с hibernate. Хватит ли web edition? Есть ли смысл в таком переходе? Имею небольшой опыт с ASA 10. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.03.2009, 12:48 |
|
||
|
Полнотекстовый поиск в ASA
|
|||
|---|---|---|---|
|
#18+
Лично я с ним не работал, так как небыло нужды в таком инструменте. Почитайте вот это: http://iablog.sybase.com/paulley/2008/05/full-text-search-in-sql-anywhere/#more-54 и это: http://sqlanywhere.blogspot.com/search?updated-min=2008-01-01T00%3A00%3A00-05%3A00&updated-max=2009-01-01T00%3A00%3A00-05%3A00&max-results=50 Там где-то еще был один пост про скорострельность.. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.03.2009, 13:44 |
|
||
|
Полнотекстовый поиск в ASA
|
|||
|---|---|---|---|
|
#18+
>Пробовал ли кто-нибудь новый полнотекстовый поиск в ASA, разумеется, с данными на русском >языке? Как я понял, он не понимает грамматических форм слов, но поддерживает n-граммы. >Насколько он быстрый, стабильный и т. п.? Я пробовал. Да, он не понимает грамматических форм. Я реально использую только обычный полнотестовый индекс (не n-граммный). Почему? Потому что когда создаешь 2 индекса - один обычный, другой n-грамный, то при запросе не понятно какой из них будет использоваться, кроме того в этом случае наблюдал зависания в запросах (правда тестировал этот вариант еще с очень ранней версией 11.0.0). Что касается не n-грамного. Сейчас реально его использую. Однако: 1) При больших объемах данных (скажем 3-10 милионов записей) при поиске по очень распространненому слову ищет ну ОЧЕНЬ медленно. Например есть база организаций, в которых много всяких ООО. Если задать в поиске ООО - запрос зависает на несколько минут. При повторном поиске по тому же слову,- все очень быстро (наверное кэш рулит.) 2) Если свойство индекса IMMEDIATE REFRESH - возможны тормоза при insert/update/delete. Кроме того, я имел не приятный опыт, когда база периодичесик падала с ASSERTION "Can't find expected posting -- transaction rolled back". У меня там было 2 таблицы - обе с текстовым индексом. В одну данные заполнялись по тригеру update/insert/delete из другой. Как только я пересоздал индекс с 'MANUAL REFRESH' падения с таким ASSERTION прекратились. Однако обновление текстового индекса стало занимать порядка 6 часов, что не радует. SA 11.0.1 - еще немного сыровата. То может работать месяц без всяких проблем, то начинает падать с разными ASSERTION. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.03.2009, 15:14 |
|
||
|
|

start [/forum/topic.php?fid=55&gotonew=1&tid=2011109]: |
0ms |
get settings: |
8ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
146ms |
get topic data: |
12ms |
get first new msg: |
8ms |
get forum data: |
2ms |
get page messages: |
46ms |
get tp. blocked users: |
2ms |
| others: | 9ms |
| total: | 254ms |

| 0 / 0 |

Извините, этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
... ля, ля, ля ...