Поиск подстроки в таблице / Программирование

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Программирование [игнор отключен] [закрыт для гостей] / Поиск подстроки в таблице

8 сообщений из 8, страница 1 из 1

Поиск подстроки в таблице

#37083775

x1ca4064

Участник

Сообщения: 1 191

Рейтинг: 0 / 0

Hi, All!

Задача:

Есть таблица с текстовым полем. Таблица меняется редко относительно поиска в ней. Хочется быстро находить записи, содержащие заданную подстроку. Т.к. подстрока может быть не только в начале текста, LIKE не будет эффективным.

Какие алгоритмы посоветуете?

...

Рейтинг:

0 / 0

28.01.2011, 11:20

| Ответить | Цитировать | Написать

Поиск подстроки в таблице

#37083846

krvsa

Участник

Откуда: г Волжский

Сообщения: 13 823

Рейтинг: 1 / 0

x1ca4064 , если "подстроки" имеют вполне определённые назначение - можно сделать индекс по ним... Или таблички типа

ПодстрокаКодЗначение
Строки содержащие подстрокуКодИД строки

...

Рейтинг:

0 / 0

28.01.2011, 11:42

| Ответить | Цитировать | Написать

Поиск подстроки в таблице

#37083879

x1ca4064

Участник

Сообщения: 1 191

Рейтинг: 0 / 0

krvsa,

Нет, подстрока произвольна.

...

Рейтинг:

0 / 0

28.01.2011, 11:49

| Ответить | Цитировать | Написать

Поиск подстроки в таблице

#37084051

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

On 28.01.2011 11:20, x1ca4064 wrote:

> Какие алгоритмы посоветуете?

Какие ещё алгоритмы ? Полнотектовый поиск
нужно применять, full text search -индексы.
Они же R-tree.

Posted via ActualForum NNTP Server 1.4

...

Рейтинг:

0 / 0

28.01.2011, 12:51

| Ответить | Цитировать | Написать

Поиск подстроки в таблице

#37084085

krvsa

Участник

Откуда: г Волжский

Сообщения: 13 823

Рейтинг: 1 / 0

x1ca4064 , насколько "длинна" и "широка" та табличка?

Как вариант, предложил бы такой способ... Сделать некий "индекс" или опять же таблички такого вида:
- Значения полей строки просто склеиваются через некий разделитель
- Такие строки так же склеиваются в одну строку через еще один разделитель (количество строк ограничено конечно)
- Вся эта "каша" "порционально" записывается со ссылками на строки, в неё входящие

Строчная группаКодЗначение
Строки первоначальной таблицыКодИД строкиКод группы
Т.о. первоначальный поиск подстроки проводится по "строчным группам", выявляя предполагаемый список строк, её содержащий... Не дюже загнул?
Потом делается запрос к оригиналу, но уже с указанием ИД предполагаемых строк...

Понятна идея?
Х/з конечно какое там будет ускорение... Но как теория наверно сойдёт.

...

Рейтинг:

0 / 0

28.01.2011, 13:04

| Ответить | Цитировать | Написать

Поиск подстроки в таблице

#37084089

krvsa

Участник

Откуда: г Волжский

Сообщения: 13 823

Рейтинг: 1 / 0

MasterZivнужно применять, full text search -индексы.
Они же R-tree.
Они есть в каждой СУБД?

...

Рейтинг:

0 / 0

28.01.2011, 13:05

| Ответить | Цитировать | Написать

Поиск подстроки в таблице

#37084924

x1ca4064

Участник

Сообщения: 1 191

Рейтинг: 0 / 0

krvsa,

Спасибо за идею, сейчас обдумываю (то бишь пока не понял).

Данные, котрые могут быть существенны:

Кол-во записей в таблице: около 100 000 ( меньше, скорее всего)

Кол-во символов в поле : меньше 100

Кол-во символов в алфавите: примерно 100

Кол-во символов в подстроке: меньше 20

...

Рейтинг:

0 / 0

28.01.2011, 16:56

| Ответить | Цитировать | Написать

Поиск подстроки в таблице

#37085789

krvsa

Участник

Откуда: г Волжский

Сообщения: 13 823

Рейтинг: 1 / 0

x1ca4064сейчас обдумываю (то бишь пока не понял)
Хм...
Ну вот смотри... У тебя в индекс какой длинны можно значение запихмуть т.с. помаксимуму? У меня только 255 символов вообще на все про все...

Ну допустим у тебя их N... Тогда количество строк в "группе"

Код: plaintext

К=N/ 100

Т.о. склеиваем поля из К-строк в одно значение и записываем его в первую мою табличку... А ссылки на ИД тех строк - вовторую... Ну и т.д.

Теперь поиск.
- Получаем подстроку
- Ищем её вхождение в моей первой табличке, тем самым получаем набор строк в оригинале
- Теперь уточняем в оригинале где таки встречается та подстрока, но уже по нашему перечню ИДшек, а не повсей табличе
Вот в этом может и будет выигрыш...

Если и теперьне понятно - выкладывай тестовый пример таблички, я покажу на нём.

...

Рейтинг:

0 / 0

29.01.2011, 10:47

| Ответить | Цитировать | Написать

8 сообщений из 8, страница 1 из 1

Форумы / Программирование [игнор отключен] [закрыт для гостей] / Поиск подстроки в таблице

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=16&msg=37085789&tid=1343174]:	0ms
get settings:	10ms
get forum list:	17ms
check forum access:	4ms
check topic access:	4ms
track hit:	190ms
get topic data:	8ms
get forum data:	2ms
get page messages:	44ms
get tp. blocked users:	1ms
others:	256ms

total:	536ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы