Explain and Indexes / PostgreSQL

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Explain and Indexes

17 сообщений из 17, страница 1 из 1

Explain and Indexes

#32477347

aev

Гость

# explain select * from emails where category_id > 2;
QUERY PLAN
------------------------------------------------------------
Seq Scan on emails (cost=0.00..22.50 rows=333 width=154)
Filter: (category_id > 2)
(записей: 2)

# explain select * from emails where category_id = 2;
QUERY PLAN
------------------------------------------------------------------------------
Index Scan using emailsndx1 on emails (cost=0.00..17.07 rows=5 width=154)
Index Cond: (category_id = 2)
(записей: 2)

Если я правильно понимаю эту информацию, то при условии 'category_id = 2' используется индекс, а при условии 'cetegory_id > 2' - нет (т.е. осуществляется полный перебор)

Почему так происходит? Индекс же есть!

...

Рейтинг:

0 / 0

12.04.2004, 12:22:51

| Ответить | Цитировать | Написать

Explain and Indexes

#32477396

LeXa NalBat

Участник

Откуда: Москва

Сообщения: 2 843

Рейтинг: 0 / 0

Попробуйте сделать vacuum analyze emails.

"(записей: 2)" - Это обозначает что в таблице две строки с category_id > 2, и две - с category_id = 2?

...

Рейтинг:

0 / 0

12.04.2004, 12:50:36

| Ответить | Цитировать | Написать

Explain and Indexes

#32477426

aev

Гость

автор"(записей: 2)" - Это обозначает что в таблице две строки с category_id > 2, и две - с category_id = 2?

Нет - записей в таблице 1.000.000. Я её только что создал и не удалял и не редактировал, так что vacuum тут не причём

...

Рейтинг:

0 / 0

12.04.2004, 13:02:40

| Ответить | Цитировать | Написать

Explain and Indexes

#32477459

aev

Гость

А вообще какой тип индексов лучше использовать для внешних ключей?
Я читал что индексы btree лучше использовать для числовых полей и полей типа дата/время. А hash - для текстовых полей.
Также пишут что btree лучше подходит для операций <, > и сортировки, а hash - для = и <>.
Внешний ключ - число, применяется операция сравнения. Что выбрать?

Таблица будет иметь несколько миллионов записей.

И ещё несколько наболевших вопросов:
1) Правда ли что unique индексы быстрее, чем простые индексы?
2) При таких объёмах стоит ли индексировать поле типа boolen (имеется/отсутствует)? Может оно без индекса быстрее будет?
3) Стоит ли индексировать поле типа varchar(255) - наименование. По нему будет производится поиск с помощью оператора like (скорее всего на плное вхождение: '%template%')? Eсли стоит, то каким индексом? Hash?

Очень нужна помощь в этом вопросе! Буду длагодарен любым советам.

...

Рейтинг:

0 / 0

12.04.2004, 13:25:27

| Ответить | Цитировать | Написать

Explain and Indexes

#32477461

LeXa NalBat

Участник

Откуда: Москва

Сообщения: 2 843

Рейтинг: 0 / 0

"Я её только что создал и не удалял и не редактировал, так что vacuum тут не причём"

Повторюсь: попробуйте сделать vacuum analyze emails. С ключом analyze постгрес собирает статистику, кроме выполнения действий с удаленными/измененными строками.

Если это не поможет, то приведите пожалуйста результат работы двух ваших explain запросов с ключом analyze:
explain analyze select * from emails where category_id > 2;
explain analyze select * from emails where category_id = 2;

...

Рейтинг:

0 / 0

12.04.2004, 13:26:51

| Ответить | Цитировать | Написать

Explain and Indexes

#32477463

aev

Гость

авторТаблица будет иметь несколько миллионов записей.
Уточнение: даже несколько десятков миллионов (от 10.000.000 до 100.000.000)

...

Рейтинг:

0 / 0

12.04.2004, 13:27:31

| Ответить | Цитировать | Написать

Explain and Indexes

#32477470

aev

Гость

авторЕсли это не поможет, то приведите пожалуйста результат работы двух ваших explain запросов с ключом analyze:
explain analyze select * from emails where category_id > 2;
explain analyze select * from emails where category_id = 2;

# explain analyze select * from emails where category_id = 2;
QUERY PLAN
--------------------------------------------------------------------------------------------------------------------------------
Index Scan using emailsndx1 on emails (cost=0.00..17.07 rows=5 width=154) (actual time=180.16..41126.74 rows=10130 loops=1)
Index Cond: (category_id = 2)
Total runtime: 41150.82 msec
(записей: 3)

# explain analyze select * from emails where category_id > 2;
QUERY PLAN
-------------------------------------------------------------------------------------------------------------
Seq Scan on emails (cost=0.00..22.50 rows=333 width=154) (actual time=28.41..6218.24 rows=979922 loops=1)
Filter: (category_id > 2)
Total runtime: 6955.11 msec
(записей: 3)

Вот такие результаты.
Вопрос: analyze собирает статистику для последующей оптимизации. Это значит что analyze нужно делать для всех запросов:
analyze select * from emails where category_id = 1;
analyze select * from emails where category_id = 2;
........
analyze select * from emails where category_id > 1;
analyze select * from emails where category_id > 2;
..........
или достаточно analyze select * from emails?

...

Рейтинг:

0 / 0

12.04.2004, 13:35:24

| Ответить | Цитировать | Написать

Explain and Indexes

#32477495

LeXa NalBat

Участник

Откуда: Москва

Сообщения: 2 843

Рейтинг: 0 / 0

Не путайте ключи analyze в командах vacuum и explain - у них разный смысл. В vacuum-е он обозначает сбор статистической инфы о таблице. В explain-е - реальное выполнение запроса и выдачу реальной статистики запроса наряду с предполагаемой. Подробнее смотрите в доках.

"Вопрос: analyze собирает статистику для последующей оптимизации. Это значит что analyze нужно делать для всех запросов"

Надо сделать лишь "vacuum analyze emails" или "vacuum analyze" для сбора статистики по всем таблицам в базе. Подробнее смотрите в доках.

Результаты двух "explain analyze ...", которые вы привели получены после выполнения "vacuum analyze emails"? Вы сделали "vacuum analyze emails"?

...

Рейтинг:

0 / 0

12.04.2004, 13:53:14

| Ответить | Цитировать | Написать

Explain and Indexes

#32477510

aev

Гость

авторРезультаты двух "explain analyze ...", которые вы привели получены после выполнения "vacuum analyze emails"? Вы сделали "vacuum analyze emails"?

После этой процедуры вот что получилось:
# explain analyze select * from emails where category_id = 2;
QUERY PLAN
----------------------------------------------------------------------------------------------------------------
Seq Scan on emails (cost=0.00..20322.01 rows=13333 width=28) (actual time=43.04..8796.18 rows=10130 loops=1)
Filter: (category_id = 2)
Total runtime: 8812.18 msec
(записей: 3)

# explain analyze select * from emails where category_id > 2;
QUERY PLAN
------------------------------------------------------------------------------------------------------------------
Seq Scan on emails (cost=0.00..20322.01 rows=973914 width=28) (actual time=35.24..8336.33 rows=979922 loops=1)
Filter: (category_id > 2)
Total runtime: 9116.29 msec
(записей: 3)

Оптимизатор совсем отказался от индексирования?

...

Рейтинг:

0 / 0

12.04.2004, 14:02:24

| Ответить | Цитировать | Написать

Explain and Indexes

#32477541

LeXa NalBat

Участник

Откуда: Москва

Сообщения: 2 843

Рейтинг: 0 / 0

Как видно, теперь постгрес правильно предсказывает кол-во возвращаемых строк:
(... rows=13333 ...) (actual ... rows=10130 ...)
(... rows=973914 ...) (actual ... rows=979922 ...)

Сделайте теперь пожалуйста:
set enable_seq_scan to off;
explain analyze select * from emails where category_id = 2;
explain analyze select * from emails where category_id > 2;

...

Рейтинг:

0 / 0

12.04.2004, 14:21:24

| Ответить | Цитировать | Написать

Explain and Indexes

#32477561

aev

Гость

авторset enable_seq_scan to off;
explain analyze select * from emails where category_id = 2;
explain analyze select * from emails where category_id > 2;

# explain analyze select * from emails where category_id = 2;
QUERY PLAN
----------------------------------------------------------------------------------------------------------------
Seq Scan on emails (cost=0.00..20322.01 rows=13333 width=28) (actual time=43.04..8796.18 rows=10130 loops=1)
Filter: (category_id = 2)
Total runtime: 8812.18 msec
(записей: 3)

# explain analyze select * from emails where category_id > 2;
QUERY PLAN
------------------------------------------------------------------------------------------------------------------
Seq Scan on emails (cost=0.00..20322.01 rows=973914 width=28) (actual time=35.24..8336.33 rows=979922 loops=1)
Filter: (category_id > 2)
Total runtime: 9116.29 msec
(записей: 3)

...

Рейтинг:

0 / 0

12.04.2004, 14:28:47

| Ответить | Цитировать | Написать

Explain and Indexes

#32477581

LeXa NalBat

Участник

Откуда: Москва

Сообщения: 2 843

Рейтинг: 0 / 0

Сорри за очепятку. Сделайте пожалуйста:
set enable_seqscan to off;
explain analyze select * from emails where category_id = 2;
explain analyze select * from emails where category_id > 2;

...

Рейтинг:

0 / 0

12.04.2004, 14:36:10

| Ответить | Цитировать | Написать

Explain and Indexes

#32477595

aev

Гость

Извиняюсь, наврал: вот правильные результаты:

# explain analyze select * from emails where category_id = 2;
QUERY PLAN
--------------------------------------------------------------------------------------------------------------------------------------
Index Scan using emailsndx1 on emails (cost=0.00..47007.67 rows=13333 width=28) (actual time=158.83..42997.30 rows=10130 loops=1)
Index Cond: (category_id = 2)
Total runtime: 43037.43 msec
(записей: 3)

# explain analyze select * from emails where category_id > 2;
а здесь psql виснет....

...

Рейтинг:

0 / 0

12.04.2004, 14:41:24

| Ответить | Цитировать | Написать

Explain and Indexes

#32477626

LeXa NalBat

Участник

Откуда: Москва

Сообщения: 2 843

Рейтинг: 0 / 0

Сравните результаты запроса category_id = 2:
без использования индекса: actual time=43.04..8796.18
с использованием индекса: actual time=158.83..42997.30

То есть в вашем случае постгрес все делает правильно: выбирает seq_scan, который и реально оказывается быстрее index_scan-а.

"а здесь psql виснет"

Не виснет, а задумывается. :-) Этот запрос отработает, думаю, за час с небольшим.

...

Рейтинг:

0 / 0

12.04.2004, 14:54:32

| Ответить | Цитировать | Написать

Explain and Indexes

#32477636

aev

Гость

Спасибо за помощь.

А что вы можете сказать об этом: авторКакой тип индексов лучше использовать для внешних ключей?
Я читал что индексы btree лучше использовать для числовых полей и полей типа дата/время. А hash - для текстовых полей.
Также пишут что btree лучше подходит для операций <, > и сортировки, а hash - для = и <>.
Внешний ключ - число, применяется операция =. Что выбрать?

Таблица будет иметь несколько миллионов записей.

И ещё несколько наболевших вопросов:
1) Правда ли что unique индексы быстрее, чем простые индексы?
2) При таких объёмах стоит ли индексировать поле типа boolen (имеется/отсутствует)? Может оно без индекса быстрее будет?
3) Стоит ли индексировать поле типа varchar(255) - наименование. По нему будет производится поиск с помощью оператора like (скорее всего на плное вхождение: '%template%')? Eсли стоит, то каким индексом? Hash?

Очень нужна помощь в этом вопросе! Буду длагодарен любым советам.

...

Рейтинг:

0 / 0

12.04.2004, 14:59:59

| Ответить | Цитировать | Написать

Explain and Indexes

#32477737

LeXa NalBat

Участник

Откуда: Москва

Сообщения: 2 843

Рейтинг: 0 / 0

"Какой тип индексов лучше использовать"\r
\r
Я не экспериментировал с hash-индексами. Использую btree, которые создаются по дефолту.\r
\r
"unique индексы быстрее, чем простые индексы?"\r
\r
Не знаю. :-)\r
\r
"При таких объёмах стоит ли индексировать поле типа boolen"\r
\r
Если в таблице не будет "перекоса" по значениям в этом поле, то, думаю, постгрес такой индекс использовать никогда не будет, следовательно он не нужен.\r
\r
\'%template%\'\r
\r
В таком запросе индекс использовать бесполезно. ( В отличие например от \'template%\'. ) Можно или "вручную" разбивать тексты на слова и записывать их в отдельную таблицу, по которой затем искать по индексу запросом \'template%\'. Или попробовать воспользоваться модулем tsearch. ( Я им не пользовался. )\r
/topic/53381&hl=tsearch

...

Рейтинг:

0 / 0

12.04.2004, 15:37:28

| Ответить | Цитировать | Написать

Explain and Indexes

#32477822

Sad Spirit

Участник

Сообщения: 576

Рейтинг: 0 / 0

hash индексы по-моему особо никем не используются и с ними могут быть проблемы. так что надо тестировать.

на наболевшие вопросы:
1) вряд ли. выше шанс, что оптимизатор выберет Index Scan по уникальному индексу, особенно если забыть сделать VACUUM ANALYZE.
2) ни при каких. лучше посмотреть в сторону PARTIAL INDEX.
3) не стоит. для таких поисков нужен полнотекстовый поиск -> contrib/tsearch2

...

Рейтинг:

0 / 0

12.04.2004, 16:14:24

| Ответить | Цитировать | Написать

17 сообщений из 17, страница 1 из 1

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Explain and Indexes

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=53&fpage=358&tid=2007903]:	0ms
get settings:	5ms
get forum list:	13ms
check forum access:	3ms
check topic access:	3ms
track hit:	79ms
get topic data:	8ms
get forum data:	3ms
get page messages:	34ms
get tp. blocked users:	1ms
others:	183ms

total:	332ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы