Подскажи по оптимизации индексирования при построении квадродерева / PostgreSQL

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Подскажи по оптимизации индексирования при построении квадродерева

21 сообщений из 21, страница 1 из 1

Подскажи по оптимизации индексирования при построении квадродерева

#39050720

Closius

Гость

Добрый день.

Я хочу сформировать что-то на подобии квадродерева для кластеризации точек геоданных. То есть я разбиваю карту сначало 30х30, а дальше каждый квадрат на 4 и так еще 18 уровней. При записи новой точки (кол-во запросов чтения, конечно больше чем добавления и изменения, но я считаю что примерно одинаково) ей присваиваются все уровни. Таким образом операция выборки проходит довольно легко.

Я реализовал хранение каждого уровня в отдельном поле (small integer). Таким образом у меня 19 полей: L1x, L1y, L2, L3, ...
Я полагаю, что таким образом будет обеспечено лучшее индексирование, чем если бы я хранил одно поле тип : 18190101111...
Я думаю, что одно поле будет индексироваться не совсем правильно, к тому же мне надо делать выборки по определенному уровню, а если у меня будет одно поле, то запрос LIKE будет тормозить всю операцию..

У меня есть два вопроса:

1. Правильно ли я поступил? Либо есть способы лучше, возможно есть более подходящий тип данных для меня.
2. Есть опреация CLUSTER. Но эта операция работает только на один идекс для таблицы. Есть ли способ кластеризовать сразу несколько индексов одной таблицы? Либо есть другие способы?
3. Возможно можно подключить SP-GIST индексы для данной сетуации, но я не очень понимаю как дальше работать с ними..

...

Рейтинг:

0 / 0

14.09.2015, 12:27

| Ответить | Цитировать | Написать

Подскажи по оптимизации индексирования при построении квадродерева

#39050764

Closius

Гость

Для L1x и L1y значения идет в пределах от 0 до 29
А для остальных полей L значения могут быть только такие: 0, 1, 10, 11

Я построил индексы для всех полей. Возможно это я зря сделал для полей кроме L1x и L1y

...

Рейтинг:

0 / 0

14.09.2015, 12:57

| Ответить | Цитировать | Написать

Подскажи по оптимизации индексирования при построении квадродерева

#39050777

Misha Tyurin

Участник

Откуда: Тюмень

Сообщения: 2 279

Рейтинг: 0 / 0

Closius,

запросы то покажите

...

Рейтинг:

0 / 0

14.09.2015, 13:11

| Ответить | Цитировать | Написать

Подскажи по оптимизации индексирования при построении квадродерева

#39050867

Closius

Гость

Misha Tyurin:

С этим сложнее. Работаю через ORM Django.

Запрос на получение маркеров (точек) и уникальных квадратов кластеров такой:

# Получаем маркеры, которые входят в запрашиваемый бокс.
# Исключаем все маркеры, владельцы которых заблокированы, не активны или помечены флагом удален
markers = Marker.objects.filter(point__contained=q_box).filter(owner__is_active=True).filter(owner__is_blocked=False).filter(owner__is_deleted=False)
# Исключаем все маркеры, владельцы которых добавили запрашевающего юзера в черный список
markers = markers.exclude(owner__blocked_users=user)
# Фильтрация
# Возраст запрашивающего юзера
users_age = calculate_age(user.date_of_birth)
markers = markers.filter(Q(max_age__gte=users_age) | Q(max_age=None)).filter(Q(min_age__lte=users_age) | Q(min_age=None))
markers = markers.filter(Q(allowed_gender=user.gender) | Q(allowed_gender=2))
# Прекция из БД по уровню
# Получаем список уровней, которые есть в кверисете маркеров
if level =='markers_only':
pass
elif level == 3:
unic_zones = markers.distinct('L1y','L1x')
else:
# Надо прощитывать все уровни. Иначе два маркера где например
# L11=11 но при этом другие уровни не равны, проекция будет взята по одному
i = 4
q = ['L1y', 'L1x']
while i <= level:
q.append( 'L' + str(i) )
i = i + 1
unic_zones = markers.distinct(*q)

...

Рейтинг:

0 / 0

14.09.2015, 14:29

| Ответить | Цитировать | Написать

Подскажи по оптимизации индексирования при построении квадродерева

#39053431

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

Closius,
это не запросы, нужны структура данных и запросы.

все или торт, который тормозит.

...

Рейтинг:

0 / 0

17.09.2015, 06:53

| Ответить | Цитировать | Написать

Подскажи по оптимизации индексирования при построении квадродерева

#39053622

Closius

Гость

А можно ли отловить запросы которые поступают в БД? Какие есть вредства?

...

Рейтинг:

0 / 0

17.09.2015, 10:56

| Ответить | Цитировать | Написать

Подскажи по оптимизации индексирования при построении квадродерева

#39053830

Lonepsycho

Участник

Откуда: Siauliai, Литва

Сообщения: 593

Рейтинг: 0 / 0

Closius,

SELECT * FROM pg_stat_activity ну и собсно, лог файлы...

...

Рейтинг:

0 / 0

17.09.2015, 13:15

| Ответить | Цитировать | Написать

Подскажи по оптимизации индексирования при построении квадродерева

#39053831

Ivan Durak

Участник

Откуда: Minsk!!!

Сообщения: 2 602

Рейтинг: 0 / 0

ClosiusДобрый день.

Я хочу сформировать что-то на подобии квадродерева для кластеризации точек геоданных. То есть я разбиваю карту сначало 30х30, а дальше каждый квадрат на 4 и так еще 18 уровней. При записи новой точки (кол-во запросов чтения, конечно больше чем добавления и изменения, но я считаю что примерно одинаково) ей присваиваются все уровни. Таким образом операция выборки проходит довольно легко.

Я реализовал хранение каждого уровня в отдельном поле (small integer). Таким образом у меня 19 полей: L1x, L1y, L2, L3, ...
Я полагаю, что таким образом будет обеспечено лучшее индексирование, чем если бы я хранил одно поле тип : 18190101111...
Я думаю, что одно поле будет индексироваться не совсем правильно, к тому же мне надо делать выборки по определенному уровню, а если у меня будет одно поле, то запрос LIKE будет тормозить всю операцию..

У меня есть два вопроса:

1. Правильно ли я поступил? Либо есть способы лучше, возможно есть более подходящий тип данных для меня.
2. Есть опреация CLUSTER. Но эта операция работает только на один идекс для таблицы. Есть ли способ кластеризовать сразу несколько индексов одной таблицы? Либо есть другие способы?
3. Возможно можно подключить SP-GIST индексы для данной сетуации, но я не очень понимаю как дальше работать с ними..
а у вас там сейчас 19 индексов??????
Это жесть.
Как вы ищите? Есть ли поиск по нижним уровням БЕЗ верхних?

...

Рейтинг:

0 / 0

17.09.2015, 13:17

| Ответить | Цитировать | Написать

Подскажи по оптимизации индексирования при построении квадродерева

#39054360

Closius

Гость

Ivan Durakа у вас там сейчас 19 индексов??????
Это жесть.
Как вы ищите? Есть ли поиск по нижним уровням БЕЗ верхних?

Тоже думаю что жесть.. Там один составной индекс и остальные обычные. Вот и думаю может объединить все уровни в одно поле.. Но как тогда потом производить поиск, не будет ли он долгим?

Алгоритм такой:

1. Получаю все маркеры в заданной области клиента
1а. Вычисляю уровень зуммирования при данной областим запроса.
2. Фильтрую по разным фильтрам, которые пришли в запросе от клиента.
3. Делаю distinct по всем полям уровня до рассчитанного уровня зуммирования.
4. (а вот тут хренова) Делаю цикл по всем полученным уникальным уровням после distinct'a.
По каждому уровню делаю запрос на получение колличества всех маркеров (из отфильтрованных) по данному уровню.

Таким образом получается список кластер - кол-во маркеров в кластере. Ну там еще вычисляется координата центра кластера, но это без участия бд, чисто математически по обозначению уровня.

...

Рейтинг:

0 / 0

17.09.2015, 19:35

| Ответить | Цитировать | Написать

Подскажи по оптимизации индексирования при построении квадродерева

#39054361

Closius

Гость

Ivan DurakЕсть ли поиск по нижним уровням БЕЗ верхних?

Нет. В поиске участвует всегда от верхнего уровня до какого-либо. Отдельно по нижним нет.

...

Рейтинг:

0 / 0

17.09.2015, 19:36

| Ответить | Цитировать | Написать

Подскажи по оптимизации индексирования при построении квадродерева

#39054568

Ivan Durak

Участник

Откуда: Minsk!!!

Сообщения: 2 602

Рейтинг: 0 / 0

ClosiusIvan DurakЕсть ли поиск по нижним уровням БЕЗ верхних?

Нет. В поиске участвует всегда от верхнего уровня до какого-либо. Отдельно по нижним нет.
тогда вообще-то будет работать и одно составное поле, Like '12334%' использует поиск по индексу!!
И в принципе так же будет работать составной индекс с правильным порядком полей, от вернего к нижним!

...

Рейтинг:

0 / 0

18.09.2015, 00:15

| Ответить | Цитировать | Написать

Подскажи по оптимизации индексирования при построении квадродерева

#39054612

kealon(Ruslan)

Участник

Откуда: Нижневартовск

Сообщения: 4 020

Рейтинг: 0 / 0

Closius,
в некоторых базах есть встроенные средства индексирования для поддержки таких запросов
например в SQLite есть определённые флаги компиляции которые позволяют добавить поддерживание двумерных индексов для выборок вида (x1<x<x2)and(y1<y<y2) (вроде через регионы реализованы)

...

Рейтинг:

0 / 0

18.09.2015, 06:52

| Ответить | Цитировать | Написать

Подскажи по оптимизации индексирования при построении квадродерева

#39055507

Closius

Гость

Ivan DurakClosiusпропущено...

Нет. В поиске участвует всегда от верхнего уровня до какого-либо. Отдельно по нижним нет.
тогда вообще-то будет работать и одно составное поле, Like '12334%' использует поиск по индексу!!
И в принципе так же будет работать составной индекс с правильным порядком полей, от вернего к нижним!

Составной индекс сделать не получится.. Если только не делать несколько составных индексов типа (L1, L2) (L1,L2,L3) (L1,L2,L3,L4) и тд Но это тоже много индексов..

Я вот думаю стоит ли вообще инексировать нижние уровни, которые могут иметь только 4 значения?

...

Рейтинг:

0 / 0

18.09.2015, 17:40

| Ответить | Цитировать | Написать

Подскажи по оптимизации индексирования при построении квадродерева

#39055510

Closius

Гость

kealon(Ruslan)Closius,
в некоторых базах есть встроенные средства индексирования для поддержки таких запросов
например в SQLite есть определённые флаги компиляции которые позволяют добавить поддерживание двумерных индексов для выборок вида (x1<x<x2)and(y1<y<y2) (вроде через регионы реализованы)

Не очень понял как это мне поможет.

...

Рейтинг:

0 / 0

18.09.2015, 17:43

| Ответить | Цитировать | Написать

Подскажи по оптимизации индексирования при построении квадродерева

#39055537

Ivan Durak

Участник

Откуда: Minsk!!!

Сообщения: 2 602

Рейтинг: 0 / 0

ClosiusIvan Durakпропущено...

тогда вообще-то будет работать и одно составное поле, Like '12334%' использует поиск по индексу!!
И в принципе так же будет работать составной индекс с правильным порядком полей, от вернего к нижним!

Составной индекс сделать не получится.. Если только не делать несколько составных индексов типа (L1, L2) (L1,L2,L3) (L1,L2,L3,L4) и тд Но это тоже много индексов..

Я вот думаю стоит ли вообще инексировать нижние уровни, которые могут иметь только 4 значения?
не нужно много составных индексов!!
Имея индекс (L1,L2,L3,L4) поиск по полям L1 и L2 будет осуществляться по этому индексу!!!!! Так же как и по полю L1 или по полям L1,L2,L3 !! Главное чтобы не было поиска по нижним уровням без верхних

...

Рейтинг:

0 / 0

18.09.2015, 18:01

| Ответить | Цитировать | Написать

Подскажи по оптимизации индексирования при построении квадродерева

#39055585

Closius

Гость

LonepsychoClosius,

SELECT * FROM pg_stat_activity ну и собсно, лог файлы...

Что-то он выводит постоянно только эти строки:

"SELECT setting FROM pg_settings WHERE name IN ('autovacuum', 'track_counts')"
"SELECT c.oid, c.relname , nspname
FROM pg_inherits i
JOIN pg_class c ON c.oid = i.inhparent
JOIN pg_namespace n ON n.oid=c.relnamespace
WHERE i.inhrelid = 18577::oid
ORDER BY inhseqno"
"SELECT "django_migrations"."app", "django_migrations"."name" FROM "django_migrations""
"SELECT * FROM pg_stat_activity;"

Может есть средство как в реальном времени смотреть запросы? Ну с обновлением раз в 10 секунд например

Или может у меня логи не ведутся??

...

Рейтинг:

0 / 0

18.09.2015, 18:29

| Ответить | Цитировать | Написать

Подскажи по оптимизации индексирования при построении квадродерева

#39055600

Closius

Гость

ClosiusIvan Durakпропущено...

тогда вообще-то будет работать и одно составное поле, Like '12334%' использует поиск по индексу!!
И в принципе так же будет работать составной индекс с правильным порядком полей, от вернего к нижним!

Составной индекс сделать не получится.. Если только не делать несколько составных индексов типа (L1, L2) (L1,L2,L3) (L1,L2,L3,L4) и тд Но это тоже много индексов..

Немного не так хотел сказать. Да надо делать составные все. Сделал сейчас вместо отдельных индексов все составные. Вроде производительность увеличилась.. Но всеравно в таблице 22 индекса... незнаю на сколько это плохо.

А вот что быстрее: составной индекс по например 5 полям или дублирование данных (от нижнего до текущего индекса прям в этом поле хранить) в каждом поле и делать индексы отдельно по полю?

...

Рейтинг:

0 / 0

18.09.2015, 18:42

| Ответить | Цитировать | Написать

Подскажи по оптимизации индексирования при построении квадродерева

#39055701

Lonepsycho

Участник

Откуда: Siauliai, Литва

Сообщения: 593

Рейтинг: 0 / 0

Closius,

log_min_duration = 0 в postgresql.conf если не ошибаюсь, будет записывать каждый запрос в лог. можно читать от туда.

...

Рейтинг:

0 / 0

18.09.2015, 21:28

| Ответить | Цитировать | Написать

Подскажи по оптимизации индексирования при построении квадродерева

#39056682

kealon(Ruslan)

Участник

Откуда: Нижневартовск

Сообщения: 4 020

Рейтинг: 0 / 0

Closiuskealon(Ruslan)Closius,
в некоторых базах есть встроенные средства индексирования для поддержки таких запросов
например в SQLite есть определённые флаги компиляции которые позволяют добавить поддерживание двумерных индексов для выборок вида (x1<x<x2)and(y1<y<y2) (вроде через регионы реализованы)

Не очень понял как это мне поможет.
намекаю что вы изобретаете лисапед, который уже есть в большинстве БД

...

Рейтинг:

0 / 0

20.09.2015, 17:12

| Ответить | Цитировать | Написать

Подскажи по оптимизации индексирования при построении квадродерева

#39057843

Closius

Гость

kealon(Ruslan)Closiusпропущено...

Не очень понял как это мне поможет.
намекаю что вы изобретаете лисапед, который уже есть в большинстве БД

И где мне про это почитать?

Вообще мне просто надо хранить квадро дерево. И нужен способ его хранения в БД

...

Рейтинг:

0 / 0

21.09.2015, 22:29

| Ответить | Цитировать | Написать

Подскажи по оптимизации индексирования при построении квадродерева

#39058009

ursido

Гость

Closius,

Посмотрите здесь:
http://pgconf.ru/paper/38
http://www.postgresql.org/docs/9.2/static/indexes-types.html
http://www.postgresql.org/docs/9.2/static/cube.html

...

Рейтинг:

0 / 0

22.09.2015, 09:25

| Ответить | Цитировать | Написать

21 сообщений из 21, страница 1 из 1

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=53&msg=39055600&tid=1997762]:	0ms
get settings:	12ms
get forum list:	14ms
check forum access:	2ms
check topic access:	2ms
track hit:	165ms
get topic data:	8ms
get forum data:	2ms
get page messages:	37ms
get tp. blocked users:	1ms
others:	246ms

total:	489ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы