Быстрая выборка по содержимому поля int[] / PostgreSQL

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Быстрая выборка по содержимому поля int[]

2 сообщений из 2, страница 1 из 1

Быстрая выборка по содержимому поля int[]

#38918081

Rickkk

Гость

Здравствуйте, коллеги!

Существует таблица размера 41 ГБ в 100 млн записей.

Код: plsql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.

CREATE UNLOGGED TABLE tst_good_equivalent_links_total
(
  id bigint,
  parent_ge_id bigint,
  child_ge_id bigint,
  created_at timestamp without time zone,
  updated_at timestamp without time zone,
  is_replace_link smallint,
  is_direct_link integer,
  lvl integer,
  ge_type integer,
  cross_type integer,
  ipath integer[]
)
WITH (
  OIDS=FALSE
)

Пример:
Поле parent_ge_id содержит 1. Поле child_ge_id содержит 7.
В таком случае поле ipath содержит элементы, с помощью которых можно прийти от 1 к 7.
К примеру, массив ipath будет содержать 1,3,6,9,4,7.

В соответствии с условиями задания, мне нужно находить и удалять строки в tst_good_equivalent_links_total, поле ipath, которых будет содержать соответствующие одиночные связи.
Стоящие рядом элементы ipath и будут составлять одиночные связи, в вышеуказанном примере это 1-3,3-6,6-9,9-4,4-7.

Для поиска я выполняю запрос:

Код: plsql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

select id,
parent_ge_id ,
child_ge_id
from public.tst_good_equivalent_links_total gelt
where 
cross_type=2 --связи автоматические
and
(15770615::text || '&' || 15827090::text)::query_int ~~ ipath  --данные узлы присутствуют в пути
and
abs(idx(ipath, 15770615::int)-idx(ipath, 15827090::int))=1 ; --в пути между ними прямая связь

...

Рейтинг:

0 / 0

26.03.2015, 19:13

| Ответить | Цитировать | Написать

Быстрая выборка по содержимому поля int[]

#38918310

Maxim Boguk

Участник

Откуда: Melbourne, Австралия

Сообщения: 5 148

Рейтинг: 0 / 0

RickkkЗдравствуйте, коллеги!

Существует таблица размера 41 ГБ в 100 млн записей.

Код: plsql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.

CREATE UNLOGGED TABLE tst_good_equivalent_links_total
(
  id bigint,
  parent_ge_id bigint,
  child_ge_id bigint,
  created_at timestamp without time zone,
  updated_at timestamp without time zone,
  is_replace_link smallint,
  is_direct_link integer,
  lvl integer,
  ge_type integer,
  cross_type integer,
  ipath integer[]
)
WITH (
  OIDS=FALSE
)

Код: plsql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

select id,
parent_ge_id ,
child_ge_id
from public.tst_good_equivalent_links_total gelt
where 
cross_type=2 --связи автоматические
and
(15770615::text || '&' || 15827090::text)::query_int ~~ ipath  --данные узлы присутствуют в пути
and
abs(idx(ipath, 15770615::int)-idx(ipath, 15827090::int))=1 ; --в пути между ними прямая связь

Выборка 120000 строк.
Скорость поиска в ipath оставляет желать лучшего. Время вполнения 10-15 мин. План выполнения:

Bitmap Heap Scan on tst_good_equivalent_links_total gelt (cost=1091.81..357179.92 rows=419 width=16)
Recheck Cond: ('15770615 & 15827090'::query_int ~~ ipath)
Filter: ((cross_type = 2) AND (abs((idx(ipath, 15770615) - idx(ipath, 15827090))) = 1))
-> Bitmap Index Scan on gelt_ipath_idx (cost=0.00..1091.71 rows=99161 width=0)
Index Cond: ('15770615 & 15827090'::query_int ~~ ipath)

Размер индекса gelt_ipath_idx - 62 GB.

Как мне ускорить выборку строк по сегменту пути int[]?

приводите explain (analyze, buffers, timing, costs) вместо explain
и не забывайте включать track_io_timing
тогда можно будет сказать что то...

explain - только план по нему нельзя сказать обычно плохой он или хороший и в чем проблема может быть.

PS: если у вас на сервере не 128Gb памяти я бы предположил что в работе с диском.

--Maxim Boguk
www.postgresql-consulting.ru

...

Рейтинг:

0 / 0

27.03.2015, 02:23

| Ответить | Цитировать | Написать

2 сообщений из 2, страница 1 из 1

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Быстрая выборка по содержимому поля int[]

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=53&fpage=113&tid=1998088]:	0ms
get settings:	7ms
get forum list:	21ms
check forum access:	3ms
check topic access:	3ms
track hit:	57ms
get topic data:	11ms
get forum data:	3ms
get page messages:	45ms
get tp. blocked users:	1ms
others:	246ms

total:	397ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы