powered by simpleCommunicator - 2.0.59     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Sybase ASA, ASE, IQ [игнор отключен] [закрыт для гостей] / Полнотекстовый поиск в ASA
3 сообщений из 3, страница 1 из 1
Полнотекстовый поиск в ASA
    #35900175
th0rn
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Здравствуйте. Пробовал ли кто-нибудь новый полнотекстовый поиск в ASA, разумеется, с данными на русском языке? Как я понял, он не понимает грамматических форм слов, но поддерживает n-граммы. Насколько он быстрый, стабильный и т. п.?

В данный момент две базы на PostgreSQL c "родным" полнотекстовым поиском (tsearch2) и "репликацией" путем периодического дампа таблиц с помощью pg_dump, копирования и заливки с предварительным удалением старой таблицы (размер базы пока позволяет). Одна из баз находится на VPS, на котором работает сайт, вторая - в офисе. В связи с этим интересует возможность реальной репликации с помощью SQLRemote. Использую java с hibernate. Хватит ли web edition? Есть ли смысл в таком переходе? Имею небольшой опыт с ASA 10.
...
Рейтинг: 0 / 0
Полнотекстовый поиск в ASA
    #35900373
Фотография Ggg_old
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Лично я с ним не работал, так как небыло нужды в таком инструменте.
Почитайте вот это:
http://iablog.sybase.com/paulley/2008/05/full-text-search-in-sql-anywhere/#more-54
и это:
http://sqlanywhere.blogspot.com/search?updated-min=2008-01-01T00%3A00%3A00-05%3A00&updated-max=2009-01-01T00%3A00%3A00-05%3A00&max-results=50

Там где-то еще был один пост про скорострельность..
...
Рейтинг: 0 / 0
Полнотекстовый поиск в ASA
    #35900658
AntonXZ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
>Пробовал ли кто-нибудь новый полнотекстовый поиск в ASA, разумеется, с данными на русском >языке? Как я понял, он не понимает грамматических форм слов, но поддерживает n-граммы. >Насколько он быстрый, стабильный и т. п.?

Я пробовал.
Да, он не понимает грамматических форм. Я реально использую только обычный полнотестовый индекс (не n-граммный). Почему? Потому что когда создаешь 2 индекса - один обычный, другой n-грамный, то при запросе не понятно какой из них будет использоваться, кроме того в этом случае наблюдал зависания в запросах (правда тестировал этот вариант еще с очень ранней версией 11.0.0).

Что касается не n-грамного. Сейчас реально его использую. Однако:
1) При больших объемах данных (скажем 3-10 милионов записей) при поиске по очень распространненому слову ищет ну ОЧЕНЬ медленно. Например есть база организаций, в которых много всяких ООО. Если задать в поиске ООО - запрос зависает на несколько минут. При повторном поиске по тому же слову,- все очень быстро (наверное кэш рулит.)
2) Если свойство индекса IMMEDIATE REFRESH - возможны тормоза при insert/update/delete. Кроме того, я имел не приятный опыт, когда база периодичесик падала с ASSERTION "Can't find expected posting -- transaction rolled back". У меня там было 2 таблицы - обе с текстовым индексом. В одну данные заполнялись по тригеру update/insert/delete из другой. Как только я пересоздал индекс с 'MANUAL REFRESH' падения с таким ASSERTION прекратились. Однако обновление текстового индекса стало занимать порядка 6 часов, что не радует.

SA 11.0.1 - еще немного сыровата. То может работать месяц без всяких проблем, то начинает падать с разными ASSERTION.
...
Рейтинг: 0 / 0
3 сообщений из 3, страница 1 из 1
Форумы / Sybase ASA, ASE, IQ [игнор отключен] [закрыт для гостей] / Полнотекстовый поиск в ASA
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]