Индек для NULL значений / PostgreSQL

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Индек для NULL значений

10 сообщений из 10, страница 1 из 1

Индек для NULL значений

#38910918

big-trot

Гость

Добрый день.

Есть таблица в которой 86 млн записей. Из них по одному из полей (назовем это поле - highway) 77 млн записей имеют не NULL значения, а 9 млн записей соответственно NULL.
Запрос на выборку данных содержит выражение highway is not null, это естественно приводит к полному сканированию таблицы.
Вопрос. Есть ли возможность создать индекс, который позволит повысить скорость выполнения запроса?
Или есть еще какие-нибудь рекомендации по этой проблеме

Сам запрос

Код: sql

select way from planet_osm_line where highway is not null

План его выполнения

Код: sql

Seq Scan on planet_osm_line  (cost=0.00..4180162.44 rows=76922688 width=258)

...

Рейтинг:

0 / 0

20.03.2015, 12:00

| Ответить | Цитировать | Написать

Индек для NULL значений

#38910922

big-trot

Гость

Забыл сказать, что тип поля - TEXT

...

Рейтинг:

0 / 0

20.03.2015, 12:00

| Ответить | Цитировать | Написать

Индек для NULL значений

#38910938

похер на бред про индекс

Гость

big-trot,

но куда ты потом засовываешь эти 77 млн, полученные запросом?!!

...

Рейтинг:

0 / 0

20.03.2015, 12:05

| Ответить | Цитировать | Написать

Индек для NULL значений

#38910950

Maxim Boguk

Участник

Откуда: Melbourne, Австралия

Сообщения: 5 148

Рейтинг: 0 / 0

big-trotДобрый день.

Есть таблица в которой 86 млн записей. Из них по одному из полей (назовем это поле - highway) 77 млн записей имеют не NULL значения, а 9 млн записей соответственно NULL.
Запрос на выборку данных содержит выражение highway is not null, это естественно приводит к полному сканированию таблицы.
Вопрос. Есть ли возможность создать индекс, который позволит повысить скорость выполнения запроса?
Или есть еще какие-нибудь рекомендации по этой проблеме

Сам запрос

Код: sql

select way from planet_osm_line where highway is not null

План его выполнения

Код: sql

Seq Scan on planet_osm_line  (cost=0.00..4180162.44 rows=76922688 width=258)

Любой запрос выбирающий больше 10% таблицы всегда быстрее сделать seq scan ном.

--Maxim Boguk
www.postgresql-consulting.ru

...

Рейтинг:

0 / 0

20.03.2015, 12:10

| Ответить | Цитировать | Написать

Индек для NULL значений

#38911042

эээээ

Гость

Maxim Boguk <>

Любой запрос выбирающий больше 10% таблицы всегда быстрее сделать seq scan ном.

--Maxim Boguk
таблица может быть очень широкой, выборка очень узкой, индекс очень актуальным, и покрывающим.

т.е если под 10% загонять и ширину -- то скорее да (даже и 5%, скорее всего), а если только процент от числа записей -- то it depends.

...

Рейтинг:

0 / 0

20.03.2015, 13:03

| Ответить | Цитировать | Написать

Индек для NULL значений

#38911097

Maxim Boguk

Участник

Откуда: Melbourne, Австралия

Сообщения: 5 148

Рейтинг: 0 / 0

эээээMaxim Boguk <>

Любой запрос выбирающий больше 10% таблицы всегда быстрее сделать seq scan ном.

--Maxim Boguk
таблица может быть очень широкой, выборка очень узкой, индекс очень актуальным, и покрывающим.

т.е если под 10% загонять и ширину -- то скорее да (даже и 5%, скорее всего), а если только процент от числа записей -- то it depends.

это так вы правы конечно. Но для уровня автора вопроса это будет слишком сложный ответ, тем более что в данном случае тут выбирается больше 90% строк.

Проблема c IOS в том что он читает страницы в порядке индекса и дает random read а не seq scan... и чтобы выборка большей части строк таблицы через IOS была эффективной индекс должен очень узкий и компактный (и хорошо закешированный) по сравнению с таблицей.

--Maxim Boguk
www.postgresql-consulting.ru

...

Рейтинг:

0 / 0

20.03.2015, 13:54

| Ответить | Цитировать | Написать

Индек для NULL значений

#38911703

Ivan Durak

Участник

Откуда: Minsk!!!

Сообщения: 2 602

Рейтинг: 0 / 0

b-tree уже давно индексирует нулы в pg. (с 8.2 чтоли) но тут конечно это бессмыслено. А особенно пихать в индекс TEXT.
Ну и воообще - выбрать быстро 77 млн текстов - это что-то из разряда noSQL

...

Рейтинг:

0 / 0

21.03.2015, 01:41

| Ответить | Цитировать | Написать

Индек для NULL значений

#38912092

линейное масштабирование пениса

Гость

Ivan DurakНу и воообще - выбрать быстро 77 млн текстов - это что-то из разряда noSQLвсе nosql точно так же, как и реляцинные субд будут отдавать простое сканирование со скоростью дисков или кеша. а шардинг помойки можно делать хоть из текстовых файлов, хоть назови их облаками.

...

Рейтинг:

0 / 0

21.03.2015, 20:12

| Ответить | Цитировать | Написать

Индек для NULL значений

#38912099

этта

Гость

Ivan Durak<>
Ну и воообще - выбрать быстро 77 млн текстов - это что-то из разряда noSQL
гм, сделайте шардирование пж через plproxy нод эдак на 128 -- будете в параллель сексканить по полляма записей с ноды (без педантичных излишеств в виде координатора распред.-- транзакций).

"быстро" проистекает не из NoSql, а из NoACID, но маркетинг помогает путаться в словах, в нужную ему сторону

...

Рейтинг:

0 / 0

21.03.2015, 20:27

| Ответить | Цитировать | Написать

Индек для NULL значений

#38912905

kamakama

Гость

big-trot,

Ну можете создать условный индекс типа

Код: plsql

1.
2.

CREATE INDEX scheta_neuplocheno ON s cheta ( id ) WHERE uplocheno not null
;

. Пустые просто не попадут в индекс. Хотя как уже сказали, при выборке 77 млн из 90 это не сильно поможет, нужно анализировать запрос в целом. Если клиент получает все 77 млн, то нужно менять архитектуру приложения.

...

Рейтинг:

0 / 0

23.03.2015, 10:38

| Ответить | Цитировать | Написать

10 сообщений из 10, страница 1 из 1

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Индек для NULL значений

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=53&fpage=113&tid=1998099]:	0ms
get settings:	10ms
get forum list:	17ms
check forum access:	4ms
check topic access:	4ms
track hit:	80ms
get topic data:	8ms
get forum data:	2ms
get page messages:	31ms
get tp. blocked users:	1ms
others:	286ms

total:	443ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы