Как при поиске подмножества использовать индекс / PostgreSQL

ReSQL.ru

2.0.60

Полная версия Контакт Правила FAQ Помощь

Гость

Войти | Профиль | Очистить

Нов. | Гор. | Избр.

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Действия ...

Доб. в избранное
Игнор. тему
Прикреп. тему
Пометить прочит. / непрочит.
Фильтр:
Сообщения автора темы
Сообщение содержит вложения
Сообщение содержит картинки
Сообщение содержит видеоклипы
Сообщение содержит аудиоклипы
Сообщение содержит картинки или видео 18+

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Как при поиске подмножества использовать индекс / 4 сообщений из 4, страница 1 из 1

12.12.2008, 17:38

#35711763

Gold_

Гость

Как при поиске подмножества использовать индекс

В таблице есть поле типа bit varying необходимо найти все записи, которые являются подмножестов заданного множества .
Сооотвествие пожмножеству проверяю следующей процедурой:

Код: plaintext

1.
2.
3.
4.

CREATE OR REPLACE FUNCTION is_subset(bit varying, bit varying)
  RETURNS boolean AS
$BODY$SELECT $ 1 ::label_big | $ 2 ::label_big # $ 2 ::label_big = '0'::label_big;$BODY$
  LANGUAGE 'sql' IMMUTABLE STRICT;

При запросах индексы не используются.
Кто подскажет какой хитрый способ, чтобы задействовать индексы при поиска вхождения в множество.
В качестве примера такой скрипт:

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.

CREATE DOMAIN label_big
  AS bit( 500 );

CREATE TABLE tdlm_label
(
  label bit varying
);


INSERT INTO tdlm_label
(SELECT '1'::label_big >>  (random()* 30 )::INT  |
	'1'::label_big >>  (random()* 30 )::INT  |
	'1'::label_big >>  (random()* 30 )::INT  |
	'1'::label_big >>  (random()* 30 )::INT  |
	'1'::label_big >>  (random()* 30 )::INT  |
	'1'::label_big >>  (random()* 30 )::INT  |
	'1'::label_big >>  (random()* 30 )::INT  |
	'1'::label_big >>  (random()* 30 )::INT  |
	'1'::label_big >>  (random()* 30 )::INT  |
	'1'::label_big >>  (random()* 30 )::INT  |
	'1'::label_big >>  (random()* 30 )::INT  
 FROM generate_series( 1 , 1000000 )  as s );

SELECT * FROM tdlm_label WHERE is_subset(label,'111111111111111111111111111111111111111111111111111111111111111111111111111111111'::label_big)

Спасибо.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

14.12.2008, 15:18

#35713185

Funny_Falcon

Участник

Сообщения: 448
Рейтинг: 0 / 0

Как при поиске подмножества использовать индекс

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.

-- Установить contrib/intarray
create index gix_tdlm_label on tdlm_label 
using gist ( ( label_big_to_array(label) ) gist__int_ops );

SELECT * FROM tdlm_label 
WHERE
	label_big_to_array('111111111111111111111111111111111111111111111111111111111111111111111111111111111'::label_big)
	@> label_big_to_array(label);

CREATE OR REPLACE FUNCTION is_subset(label_big, label_big)
  RETURNS boolean AS
$BODY$SELECT label_big_to_array($ 1 ) <@ label_big_to_array($ 2 ) $BODY$
  LANGUAGE 'sql' IMMUTABLE STRICT;

SELECT * FROM tdlm_label 
WHERE
	is_subset(label, '111111111111111111111111111111111111111111111111111111111111111111111111111111111'::label_big);

Примечание: первоначально попробовал gin индекс - получилось намного медленнее, чем gist.
Полагаю, для запроса типа && - т.е. пересечения, а не подмножества, их скорость должна быть равна, или даже у gin скорость будет больше. Но именно для подмножества gist быстрее во много раз.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

14.12.2008, 15:28

#35713191

Funny_Falcon

Участник

Сообщения: 448
Рейтинг: 0 / 0

Как при поиске подмножества использовать индекс

Простите, функцию забыл:

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.

create or replace function label_big_to_array(label_big )
returns int4[]
as $$
  select ARRAY( 
	select i 
	from generate_series( 0 , bit_length($ 1 )- 1 ) as i
	where $ 1  << i & '1'::label_big <> '0'::label_big )
$$ language sql immutable strict;

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

15.12.2008, 11:47

#35714168

Gold_

Гость

Как при поиске подмножества использовать индекс

Funny_Falcon

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.

-- Установить contrib/intarray
create index gix_tdlm_label on tdlm_label 
using gist ( ( label_big_to_array(label) ) gist__int_ops );

SELECT * FROM tdlm_label 
WHERE
	label_big_to_array('111111111111111111111111111111111111111111111111111111111111111111111111111111111'::label_big)
	@> label_big_to_array(label);

CREATE OR REPLACE FUNCTION is_subset(label_big, label_big)
  RETURNS boolean AS
$BODY$SELECT label_big_to_array($ 1 ) <@ label_big_to_array($ 2 ) $BODY$
  LANGUAGE 'sql' IMMUTABLE STRICT;

SELECT * FROM tdlm_label 
WHERE
	is_subset(label, '111111111111111111111111111111111111111111111111111111111111111111111111111111111'::label_big);

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=53&tablet=1&tid=2003793]:	0ms
get settings:	8ms
get forum list:	16ms
check forum access:	3ms
check topic access:	3ms
track hit:	74ms
get topic data:	22ms
get forum data:	4ms
get page messages:	63ms
get tp. blocked users:	2ms
others:	223ms

total:	418ms