Индек для NULL значений / PostgreSQL

ReSQL.ru

2.0.61

Планшетная версия Контакт Правила FAQ Помощь

Гость

Войти | Профиль | Очистить

Нов. | Гор. | Избр.

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Действия ...

Доб. в избранное
Игнор. тему
Прикреп. тему
Пометить прочит. / непрочит.
Фильтр:
Сообщения автора темы
Сообщение содержит вложения
Сообщение содержит картинки
Сообщение содержит видеоклипы
Сообщение содержит аудиоклипы
Сообщение содержит картинки или видео 18+

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Индек для NULL значений / 10 сообщений из 10, страница 1 из 1

20.03.2015, 12:00

#38910918

big-trot

Гость

Индек для NULL значений

Добрый день.

Есть таблица в которой 86 млн записей. Из них по одному из полей (назовем это поле - highway) 77 млн записей имеют не NULL значения, а 9 млн записей соответственно NULL.
Запрос на выборку данных содержит выражение highway is not null, это естественно приводит к полному сканированию таблицы.
Вопрос. Есть ли возможность создать индекс, который позволит повысить скорость выполнения запроса?
Или есть еще какие-нибудь рекомендации по этой проблеме

Сам запрос

Код: sql

select way from planet_osm_line where highway is not null

План его выполнения

Код: sql

Seq Scan on planet_osm_line  (cost=0.00..4180162.44 rows=76922688 width=258)

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

20.03.2015, 12:00

#38910922

big-trot

Гость

Индек для NULL значений

Забыл сказать, что тип поля - TEXT

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

20.03.2015, 12:05

#38910938

похер на бред про индекс

Гость

Индек для NULL значений

big-trot,

но куда ты потом засовываешь эти 77 млн, полученные запросом?!!

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

20.03.2015, 12:10

#38910950

Maxim Boguk

Участник

Откуда: Melbourne, Австралия
Сообщения: 5 148
Рейтинг: 0 / 0

Индек для NULL значений

big-trotДобрый день.

Есть таблица в которой 86 млн записей. Из них по одному из полей (назовем это поле - highway) 77 млн записей имеют не NULL значения, а 9 млн записей соответственно NULL.
Запрос на выборку данных содержит выражение highway is not null, это естественно приводит к полному сканированию таблицы.
Вопрос. Есть ли возможность создать индекс, который позволит повысить скорость выполнения запроса?
Или есть еще какие-нибудь рекомендации по этой проблеме

Сам запрос

Код: sql

select way from planet_osm_line where highway is not null

План его выполнения

Код: sql

Seq Scan on planet_osm_line  (cost=0.00..4180162.44 rows=76922688 width=258)

Любой запрос выбирающий больше 10% таблицы всегда быстрее сделать seq scan ном.

--Maxim Boguk
www.postgresql-consulting.ru

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

20.03.2015, 13:03

#38911042

эээээ

Гость

Индек для NULL значений

Maxim Boguk <>

Любой запрос выбирающий больше 10% таблицы всегда быстрее сделать seq scan ном.

--Maxim Boguk
таблица может быть очень широкой, выборка очень узкой, индекс очень актуальным, и покрывающим.

т.е если под 10% загонять и ширину -- то скорее да (даже и 5%, скорее всего), а если только процент от числа записей -- то it depends.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

20.03.2015, 13:54

#38911097

Maxim Boguk

Участник

Откуда: Melbourne, Австралия
Сообщения: 5 148
Рейтинг: 0 / 0

Индек для NULL значений

эээээMaxim Boguk <>

Любой запрос выбирающий больше 10% таблицы всегда быстрее сделать seq scan ном.

--Maxim Boguk
таблица может быть очень широкой, выборка очень узкой, индекс очень актуальным, и покрывающим.

т.е если под 10% загонять и ширину -- то скорее да (даже и 5%, скорее всего), а если только процент от числа записей -- то it depends.

это так вы правы конечно. Но для уровня автора вопроса это будет слишком сложный ответ, тем более что в данном случае тут выбирается больше 90% строк.

Проблема c IOS в том что он читает страницы в порядке индекса и дает random read а не seq scan... и чтобы выборка большей части строк таблицы через IOS была эффективной индекс должен очень узкий и компактный (и хорошо закешированный) по сравнению с таблицей.

--Maxim Boguk
www.postgresql-consulting.ru

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

21.03.2015, 01:41

#38911703

Ivan Durak

Участник

Откуда: Minsk!!!
Сообщения: 2 602
Рейтинг: 0 / 0

Индек для NULL значений

b-tree уже давно индексирует нулы в pg. (с 8.2 чтоли) но тут конечно это бессмыслено. А особенно пихать в индекс TEXT.
Ну и воообще - выбрать быстро 77 млн текстов - это что-то из разряда noSQL

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

21.03.2015, 20:12

#38912092

линейное масштабирование пениса

Гость

Индек для NULL значений

Ivan DurakНу и воообще - выбрать быстро 77 млн текстов - это что-то из разряда noSQLвсе nosql точно так же, как и реляцинные субд будут отдавать простое сканирование со скоростью дисков или кеша. а шардинг помойки можно делать хоть из текстовых файлов, хоть назови их облаками.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

21.03.2015, 20:27

#38912099

этта

Гость

Индек для NULL значений

Ivan Durak<>
Ну и воообще - выбрать быстро 77 млн текстов - это что-то из разряда noSQL
гм, сделайте шардирование пж через plproxy нод эдак на 128 -- будете в параллель сексканить по полляма записей с ноды (без педантичных излишеств в виде координатора распред.-- транзакций).

"быстро" проистекает не из NoSql, а из NoACID, но маркетинг помогает путаться в словах, в нужную ему сторону

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

23.03.2015, 10:38

#38912905

kamakama

Гость

Индек для NULL значений

big-trot,

Ну можете создать условный индекс типа

Код: plsql

1.
2.

CREATE INDEX scheta_neuplocheno ON s cheta ( id ) WHERE uplocheno not null
;

. Пустые просто не попадут в индекс. Хотя как уже сказали, при выборке 77 млн из 90 это не сильно поможет, нужно анализировать запрос в целом. Если клиент получает все 77 млн, то нужно менять архитектуру приложения.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Индек для NULL значений / 10 сообщений из 10, страница 1 из 1

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=53&mobile=1&tid=1998099]:	0ms
get settings:	11ms
get forum list:	20ms
check forum access:	3ms
check topic access:	3ms
track hit:	47ms
get topic data:	11ms
get forum data:	3ms
get page messages:	57ms
get tp. blocked users:	2ms
others:	281ms

total:	438ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы