Перекрестные индексы. Как лучше? / Microsoft SQL Server

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Перекрестные индексы. Как лучше?

25 сообщений из 63, страница 2 из 3

все

Перекрестные индексы. Как лучше?

#39716438

SandalTree

Участник

Откуда: Перехлёсток восьми батог

Сообщения: 28 388

Рейтинг: 0 / 0

Гавриленко Сергей Алексеевич,

Вы наверное очень удивитесь, но если ...

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.

CREATE INDEX IX_testindex ON testindex(a,b)
GO
set statistics IO ON
go
SELECT * FROM testindex WHERE a = 5 and b = 'X'
GO
set statistics IO off
GO
DROP INDEX IX_testindex ON testindex
GO
CREATE INDEX IX_testindex ON testindex(b,a)
GO
set statistics IO ON
go
SELECT * FROM testindex WHERE a = 5 and b = 'X'
GO
set statistics IO off
GO
DROP INDEX IX_testindex ON testindex
GO
--------------------------------------------------------------------------------------------
Table 'testindex'. Scan count 1, logical reads 4, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.
Table 'testindex'. Scan count 1, logical reads 3, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.

Разница в наших показаниях заключается в том что при использовании индекса №1 сервер использует статистики индекса №2.
В вашем случае для построения статистики по полю "b" был сделан FULLSCAN и значение "Х" попало в статистики.
Получается что-б ваш пример работал, вы должны иметь индексы по ВСЕМ полям, либо делать апдейт статистик с опцией FULLSCAN.

Но даже в вашем случае если вы запустите запрос БЕЗ указания индекса, то сервер выберет индекс №2.

...

Рейтинг:

0 / 0

12.10.2018, 04:32

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39716439

SandalTree

Участник

Откуда: Перехлёсток восьми батог

Сообщения: 28 388

Рейтинг: 0 / 0

Mind,

Вообще-то планы разные, так как индекс по полю А "не видит" реального распределения значений по полю "Б" если по полю "Б" нет полной статистики.

...

Рейтинг:

0 / 0

12.10.2018, 04:38

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39716446

SandalTree

Участник

Откуда: Перехлёсток восьми батог

Сообщения: 28 388

Рейтинг: 0 / 0

invmКасаемого вашего теста
У меня получился такой-же результат как и у вас, когда я запустил тест в tempdb.

Обнаружилась интересная закономерность.
В tempdb статистика по полю "b" включает значение "X", а в пользовательской базе нет.

В этом и есть разница в IO.
Если надо, могу дать скриншоты статистик, хотя я уже и давал скриншоты разных планов.

...

Рейтинг:

0 / 0

12.10.2018, 04:51

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39716515

invm

Участник

Откуда: Москва

Сообщения: 9 956

Рейтинг: 0 / 0

SandalTreeОбнаружилась интересная закономерность.
В tempdb статистика по полю "b" включает значение "X", а в пользовательской базе нет.Вы опять фантазируете.
Статистика по (a,b) не может содержать распределение по b, ибо гистограмма хранится только для первого столбца. В любой БД.
Соответственно, статистика по (b,a) будет содержать такое распределение. Опять же в любой БД.
SandalTreeЕсли надо, могу дать скриншоты статистик, хотя я уже и давал скриншоты разных планов.Ваши картинки мало кому интересны в качестве доказательств.
Репро давайте, подтверждающее ваши слова.

...

Рейтинг:

0 / 0

12.10.2018, 10:10

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39716700

SIMPLicity_

Участник

Откуда: (((@)))

Сообщения: 8 932

Рейтинг: 0 / 0

Mindinvmпропущено...
Попробуйте поразмышлять почему рекомендовано именно так.Если честно я вообще не понимаю что именно они рекомендуют. Какие еще варианты могут быть запихать колонку в WHERE кроме как = > < или BETWEEN ? С функциями что-ли? Additional columns это что? Все те что кроме first? Или те что все еще в WHERE но непонятно с какими условиями поиска или те что даже не в WHERE? А зачем они вообще в индексе нужны? А какая тогда разница на их distinctness? И вообще получается что только начиная со второй колонки есть смысл в каком порядке запихивать в индекс, а первую как выбрать если там несколько в WHERE?
Или они хотели сказать "Additionally, columns...". Такое ощущение что эти рекомендации переводили индусы основываясь на доисторических свитках Sybase.
like ?

==================
PS Как вариант like 'АБэЦэ...%' (в идеале должен быть seek вместо scan)....

...

Рейтинг:

0 / 0

12.10.2018, 14:35

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39716982

Mind

Участник

Откуда: Лучший город на Земле

Сообщения: 2 317

Рейтинг: 0 / 0

SandalTreeВообще-то планы разные, так как индекс по полю А "не видит"При чем тут индекс "видит", "не видит"? Чушь какую то развели. Оптимизатор решает на основании статистики. Статистики могут быть как привязанные к индексу так и отдельно. И те и другие статистики могут создаваться/обновляться с FULLSCAN и без. Исключение составляет лишь создание/ребилд индекса потому что в этом случае статистика обновляется с FULLSCAN автоматически.
SandalTreeреального распределения значений по полю "Б" если по полю "Б" нет полной статистики. Так при чем тут индекс то, если все дело в статистике? А особенно при чем тут селективность полей?
SandalTreeЕсли надо, могу дать скриншоты статистик, хотя я уже и давал скриншоты разных планов.Все ваши тесты доказывают лишь то что при потере всех конечностей таракан теряет слух. Связи между селективностью и тем какой индекс сервер выбирает никакой, потому что решение оптимизатора в данном случае целиком и полностью зависит от того насколько дерьмовую статистику вы ему подсовываете.
SandalTreeВы наверное очень удивитесь, но если ...Удивляетесь здесь по-моему только вы... Готовы?
Если в ваш пример добавить селективности по полю A

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.

DROP TABLE testindex 
GO
CREATE TABLE testindex (a INT, b CHAR(1))
GO
;WITH xx AS (SELECT * FROM 
	(VALUES (5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A')) AS x(a,b)
) 
INSERT INTO testindex(a,b) SELECT x1.*
FROM xx AS x1,xx AS x2,xx AS x3,xx AS x4,xx AS x5,xx AS x6,xx AS x7;
GO
INSERT INTO testindex(a,b) VALUES (1,'A')
INSERT INTO testindex(a,b) VALUES (2,'A')
INSERT INTO testindex(a,b) VALUES (3,'A')
INSERT INTO testindex(a,b) VALUES (4,'A')
INSERT INTO testindex(a,b) VALUES (5,'X')
GO

то сервер все равно продолжит выбирать индекс (b,a)!
SandalTreeПостройте 2 разных индекса и посмотрите что сервер предпочтёт тот по которуму выше селективность в первой колонке. О ужас! Ваша псевдо-теория развалилась.

Можно построить оба индекса одновременно, чтобы исключить безлапых тараканов неполноценную статистику из нашего эксперимента.

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

DROP INDEX IX_testindex ON testindex;
CREATE INDEX IX_testindex_1 ON testindex(a,b)
CREATE INDEX IX_testindex_2 ON testindex(b,a)
go
set statistics profile on;
go
SELECT a, b FROM testindex WHERE a = 5 and b = 'X'
go
set statistics profile off;
go

Но сервер упорно продолжает выбирать индекс с меньшей селективностью!

Код: plaintext

|--Index Seek(OBJECT:([TEST].[dbo].[testindex].[ IX_testindex_2 ]), SEEK:([TEST].[dbo].[testindex].[b]='X' AND [TEST].[dbo].[testindex].[a]=(5)) ORDERED FORWARD)

...

Рейтинг:

0 / 0

13.10.2018, 00:48

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39717250

SIMPLicity_

Участник

Откуда: (((@)))

Сообщения: 8 932

Рейтинг: 0 / 0

MindSandalTreeВообще-то планы разные, так как индекс по полю А "не видит"При чем тут индекс "видит", "не видит"? Чушь какую то развели. Оптимизатор решает на основании статистики. Статистики могут быть как привязанные к индексу так и отдельно. И те и другие статистики могут создаваться/обновляться с FULLSCAN и без. Исключение составляет лишь создание/ребилд индекса потому что в этом случае статистика обновляется с FULLSCAN автоматически.
SandalTreeреального распределения значений по полю "Б" если по полю "Б" нет полной статистики. Так при чем тут индекс то, если все дело в статистике? А особенно при чем тут селективность полей?
SandalTreeЕсли надо, могу дать скриншоты статистик, хотя я уже и давал скриншоты разных планов.Все ваши тесты доказывают лишь то что при потере всех конечностей таракан теряет слух. Связи между селективностью и тем какой индекс сервер выбирает никакой, потому что решение оптимизатора в данном случае целиком и полностью зависит от того насколько дерьмовую статистику вы ему подсовываете.
SandalTreeВы наверное очень удивитесь, но если ...Удивляетесь здесь по-моему только вы... Готовы?
Если в ваш пример добавить селективности по полю A

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.

DROP TABLE testindex 
GO
CREATE TABLE testindex (a INT, b CHAR(1))
GO
;WITH xx AS (SELECT * FROM 
	(VALUES (5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A')) AS x(a,b)
) 
INSERT INTO testindex(a,b) SELECT x1.*
FROM xx AS x1,xx AS x2,xx AS x3,xx AS x4,xx AS x5,xx AS x6,xx AS x7;
GO
INSERT INTO testindex(a,b) VALUES (1,'A')
INSERT INTO testindex(a,b) VALUES (2,'A')
INSERT INTO testindex(a,b) VALUES (3,'A')
INSERT INTO testindex(a,b) VALUES (4,'A')
INSERT INTO testindex(a,b) VALUES (5,'X')
GO

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

DROP INDEX IX_testindex ON testindex;
CREATE INDEX IX_testindex_1 ON testindex(a,b)
CREATE INDEX IX_testindex_2 ON testindex(b,a)
go
set statistics profile on;
go
SELECT a, b FROM testindex WHERE a = 5 and b = 'X'
go
set statistics profile off;
go

Но сервер упорно продолжает выбирать индекс с меньшей селективностью!

Код: plaintext

|--Index Seek(OBJECT:([TEST].[dbo].[testindex].[ IX_testindex_2 ]), SEEK:([TEST].[dbo].[testindex].[b]='X' AND [TEST].[dbo].[testindex].[a]=(5)) ORDERED FORWARD)

чуть меняем условие :

set statistics profile on;
go
SELECT a, b FROM testindex WHERE a =5 and b ! = 'X'
go
set statistics profile off;
go

Получаем картину:

StmtText:

Код: sql

  |--Index Seek(OBJECT:([tempdb].[dbo].[testindex].[IX_testindex_1]), SEEK:([tempdb].[dbo].[testindex].[a]=(5) AND [tempdb].[dbo].[testindex].[b] < 'X' OR [tempdb].[dbo].[testindex].[a]=(5) AND [tempdb].[dbo].[testindex].[b] > 'X') ORDERED FORWARD)

при
Argument:

Код: sql

OBJECT:([tempdb].[dbo].[testindex].[IX_testindex_1]), SEEK:([tempdb].[dbo].[testindex].[a]=(5) AND [tempdb].[dbo].[testindex].[b] < 'X' OR [tempdb].[dbo].[testindex].[a]=(5) AND [tempdb].[dbo].[testindex].[b] > 'X') ORDERED FORWARD

Выбор в пользу другого индекса при НЕочевидном (для меня, по крайней мере) преобразовании...

...

Рейтинг:

0 / 0

14.10.2018, 14:10

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39717252

SIMPLicity_

Участник

Откуда: (((@)))

Сообщения: 8 932

Рейтинг: 0 / 0

PS Вообще, вы куда-то слишком в дебри углубились...
PPS Мне так кажется....

...

Рейтинг:

0 / 0

14.10.2018, 14:18

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39717287

Mr. X

Гость

SIMPLicity_,

Да какие уж там дебри, все крутится (в основном) вокруг статистики. Из которой тут упоминали только селективность (selectivity), хотя в статистике присутствуют плотность (density), мощьность (cardinality) и гистограмма (histogram). Которые SQL так же использует для оценок.

...

Рейтинг:

0 / 0

14.10.2018, 18:13

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39717365

SandalTree

Участник

Откуда: Перехлёсток восьми батог

Сообщения: 28 388

Рейтинг: 0 / 0

invmSandalTreeОбнаружилась интересная закономерность.
В tempdb статистика по полю "b" включает значение "X", а в пользовательской базе нет.Вы опять фантазируете.
Статистика по (a,b) не может содержать распределение по b, ибо гистограмма хранится только для первого столбца. В любой БД.
Соответственно, статистика по (b,a) будет содержать такое распределение. Опять же в любой БД.
SandalTreeЕсли надо, могу дать скриншоты статистик, хотя я уже и давал скриншоты разных планов.Ваши картинки мало кому интересны в качестве доказательств.
Репро давайте, подтверждающее ваши слова.

Во первых: есть 2 статистики по обоим полям и когда скуль строит план, то он смотрит на обе. (закрыли этот вопрос?)

Во вторых: при запуске одного и того-же кода в разных базах происходит различная обработка алгоритма выборки сэмла. В одной базе последняя страница входит в сэмпл, а в другой нет, от этого различные статистики и планы. (какого рода репо вам предоставить? Потестируйте в разных базах и посмотрите на сэмплы и статистики.)

В третьих: При двух индексах a-b и b-a скуль почему-то выбирает второй индекс. Сможете ответить на вопрос "почему?"?

...

Рейтинг:

0 / 0

15.10.2018, 06:02

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39717374

SandalTree

Участник

Откуда: Перехлёсток восьми батог

Сообщения: 28 388

Рейтинг: 0 / 0

Mindдивляетесь здесь по-моему только вы... Готовы?
Если в ваш пример добавить селективности по полю A
то сервер все равно продолжит выбирать индекс (b,a)!
Да, вы правы. В случае выбора между двумя этими индексами скуль не видит разницы так как планы у них с одинаковой стоимостью.

...

Рейтинг:

0 / 0

15.10.2018, 07:33

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39717616

invm

Участник

Откуда: Москва

Сообщения: 9 956

Рейтинг: 0 / 0

SandalTreeВо первых: есть 2 статистики по обоим полям и когда скуль строит план, то он смотрит на обе. (закрыли этот вопрос?)Еще раз - для уровня оптимизации TRIVIAL статистика не используется для выбора плана. Только для оценки количества строк.
SandalTreeВо вторых: при запуске одного и того-же кода в разных базах происходит различная обработка алгоритма выборки сэмла. В одной базе последняя страница входит в сэмпл, а в другой нет, от этого различные статистики и планы.Да? Вам был даден пример, из которого понятно из-за чего планы разные. Может для вас станет понятнее, когда отключите автосоздание статистики.
Но вы продолжаете фантазировать... Особо порадовала зависимость IO запроса от статистики...
SandalTreeВ третьих: При двух индексах a-b и b-a скуль почему-то выбирает второй индекс. Сможете ответить на вопрос "почему?"?Неужто из-за селективности?
Попробуйте поменять порядок создания индексов.

Ну и напоследок вопрос - каким образом для индексов (a, b) и (b, a), при предикате a = ... and b = ..., селективность столбцов индекса будет влиять на операцию поиска в нем?

...

Рейтинг:

0 / 0

15.10.2018, 13:43

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39717781

SandalTree

Участник

Откуда: Перехлёсток восьми батог

Сообщения: 28 388

Рейтинг: 0 / 0

invmSandalTreeВо вторых: при запуске одного и того-же кода в разных базах происходит различная обработка алгоритма выборки сэмла. В одной базе последняя страница входит в сэмпл, а в другой нет, от этого различные статистики и планы.Да? Вам был даден пример, из которого понятно из-за чего планы разные. Может для вас станет понятнее, когда отключите автосоздание статистики.
Вы мне не верите, но сами проверить не желаете. Вот вам скриншот.

...

Рейтинг:

0 / 0

15.10.2018, 17:34

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39717782

SandalTree

Участник

Откуда: Перехлёсток восьми батог

Сообщения: 28 388

Рейтинг: 0 / 0

invm,

Разница в IO обусловлена тем что статистики не захватили FULLSAMPLE.
Прочитано только 7% всех записей и значения с последней страницы остались неучтёнными.

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.

DECLARE @SQL VARCHAR(1000);

SELECT @SQL = 'DBCC SHOW_STATISTICS (''dbo.testindex'',''' + name + ''');' FROM sys.stats as s
INNER JOIN sys.stats_columns AS c
	ON c.object_id = s.object_id AND s.stats_id = c.stats_id
WHERE s.object_id = OBJECT_ID('testindex') AND c.column_id = 1
EXEC (@SQL)
SELECT @SQL = 'DBCC SHOW_STATISTICS (''dbo.testindex'',''' + name + ''');' FROM sys.stats as s
INNER JOIN sys.stats_columns AS c
	ON c.object_id = s.object_id AND s.stats_id = c.stats_id
WHERE s.object_id = OBJECT_ID('testindex') AND c.column_id = 2
EXEC (@SQL)

...

Рейтинг:

0 / 0

15.10.2018, 17:39

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39717783

SandalTree

Участник

Откуда: Перехлёсток восьми батог

Сообщения: 28 388

Рейтинг: 0 / 0

invm,

Как только мы перестроим статистики с полным сканированием то получим результат, который нам продемонстрировал Сергей Гавриленко.

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.

DECLARE @SQL VARCHAR(1000);
SELECT @SQL = 'UPDATE STATISTICS dbo.testindex ' + name + ' WITH FULLSCAN;' FROM sys.stats as s
INNER JOIN sys.stats_columns AS c
	ON c.object_id = s.object_id AND s.stats_id = c.stats_id
WHERE s.object_id = OBJECT_ID('testindex') AND c.column_id = 1
EXEC (@SQL)
SELECT @SQL = 'UPDATE STATISTICS dbo.testindex ' + name + ' WITH FULLSCAN;' FROM sys.stats as s
INNER JOIN sys.stats_columns AS c
	ON c.object_id = s.object_id AND s.stats_id = c.stats_id
WHERE s.object_id = OBJECT_ID('testindex') AND c.column_id = 2
EXEC (@SQL)

...

Рейтинг:

0 / 0

15.10.2018, 17:44

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39717785

Гавриленко Сергей Алексеевич

Участник

Откуда: Moscow

Сообщения: 37 171

Рейтинг: 0 / 0

Откуда появляется четвертое логическое чтение -- не понятно. (Не факт, что оно есть на самом деле и не врет statistics io.) Опять же, если выключить автосоздание статистик на базе, то чтений будет 4 в обоих вариантах, а если индекс прибить руками, то 3 в обоих вариантах.

Однако при глубине индекса в три уровня, четвертое чтение не может быть из дерева индекса -- в индексе просто читать больше нечего.

Короче, тут не в структуре индекса дело, а в каких-то сайд-эффектах от статистики.

...

Рейтинг:

0 / 0

15.10.2018, 17:47

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39717787

invm

Участник

Откуда: Москва

Сообщения: 9 956

Рейтинг: 0 / 0

SandalTreeВы мне не верите, но сами проверить не желаете. Вот вам скриншот.Зачем мне ваш скриншот? В моем примере ровно то же самое.
Видимо вы так не удосожились хотя бы его результаты посмотреть.
SandalTreeРазница в IO обусловлена тем что статистики не захватили FULLSAMPLE.
Прочитано только 7% всех записей и значения с последней страницы остались неучтёнными.И каким же образом "неучтенность значений" при компиляции повлияла на статистику IO при выполнении?

...

Рейтинг:

0 / 0

15.10.2018, 17:57

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39717837

Mind

Участник

Откуда: Лучший город на Земле

Сообщения: 2 317

Рейтинг: 0 / 0

Гавриленко Сергей АлексеевичОпять же, если выключить автосоздание статистик на базе, то чтений будет 4 в обоих вариантах, а если индекс прибить руками, то 3 в обоих вариантах.А если обновить все статистики с FULLSCAN, то тоже становится 3 чтения вместо 4х.

...

Рейтинг:

0 / 0

15.10.2018, 21:12

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39717839

invm

Участник

Откуда: Москва

Сообщения: 9 956

Рейтинг: 0 / 0

Тайна 4-й страницы

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.

use master;
create database DBTest001;
alter database DBTest001 set auto_create_statistics off;
go

declare @sql nvarchar(max) = N'create event session DBTest001_TrackLatches on server 
add event sqlserver.latch_acquired
(
  action (sqlserver.session_id, sqlserver.sql_text)
  where ([database_id] = {dbid} and session_id = {spid})
)
add target package0.ring_buffer (set max_memory = 1000)
with (event_retention_mode=allow_single_event_loss, max_dispatch_latency = 3 seconds, track_causality=on, startup_state=off);';

if exists(select 1 from sys.server_event_sessions where name = N'DBTest001_TrackLatches')
 drop event session DBTest001_TrackLatches on server;

select
 @sql = replace(replace(@sql, N'{dbid}', cast(db_id('DBTest001') as nvarchar(10))), N'{spid}', cast(@@spid as nvarchar(10)));

exec(@sql);
go

use DBTest001;
go

CREATE TABLE testindex (a INT, b CHAR(1))
GO
;WITH xx AS (SELECT * FROM 
	(VALUES (5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A')) AS x(a,b)
) 
INSERT INTO testindex(a,b) SELECT x1.*
FROM xx AS x1,xx AS x2,xx AS x3,xx AS x4,xx AS x5,xx AS x6,xx AS x7;
GO
INSERT INTO testindex(a,b) VALUES (5,'X')
GO

create statistics ST_testindex__a on testindex (a) --with fullscan;
create statistics ST_testindex__b on testindex (b) --with fullscan;
go

create index IX_testindex on testindex (a, b);
go

create procedure spGetPagesRead
 @UpdateStatisticsMode varchar(10) = null

as
begin
 set nocount on;

 if @UpdateStatisticsMode = 'fullscan'
  begin
   update statistics testindex(ST_testindex__a) with fullscan;
   update statistics testindex(ST_testindex__b) with fullscan;
  end
 else
  begin
   update statistics testindex(ST_testindex__a);
   update statistics testindex(ST_testindex__b);
  end;

 alter event session DBTest001_TrackLatches on server state = start;
 set statistics io on; SELECT a, b FROM testindex WHERE a = 5 and b = 'X'  option (recompile); set statistics io off;

 declare @x xml;

 select
  @x = cast(t.target_data as xml)
 from
  sys.dm_xe_sessions s join
  sys.dm_xe_session_targets t on t.event_session_address = s.address
 where
  s.name = N'DBTest001_TrackLatches';

 alter event session DBTest001_TrackLatches on server state = stop;

 select distinct
  object_name(pa.object_id) as object, pi.file_id, pi.page_id, pa.index_id, pa.page_type_desc
 from
  @x.nodes('/RingBufferTarget/event[@name = "latch_acquired"][data[@name = "mode"][text = "SH"]]') t(n) cross apply
  (select t.n.value('(data[@name = "file_id"]/value)[1]', 'smallint'), t.n.value('(data[@name = "page_id"]/value)[1]', 'int')) pi(file_id, page_id) join
  sys.dm_db_database_page_allocations(db_id(), null, null, null, 'detailed') pa on pa.allocated_page_file_id = pi.file_id and pa.allocated_page_page_id = pi.page_id

end;
go

exec dbo.spGetPagesRead 'fullscan';
exec dbo.spGetPagesRead;
go

drop event session DBTest001_TrackLatches on server;
go

use master;
drop database DBTest001;
go

С fullscan
objectfile_idpage_idindex_idpage_type_descsysobjvalues1431INDEX_PAGEsysobjvalues11281DATA_PAGEsysobjvalues11321DATA_PAGEsyssingleobjrefs1971DATA_PAGEtestindex12904INDEX_PAGEtestindex1380974INDEX_PAGEtestindex1412504INDEX_PAGE

Без fullscan
objectfile_idpage_idindex_idpage_type_desc sysmultiobjrefs 11052INDEX_PAGEsysobjvalues1431INDEX_PAGEsysobjvalues11281DATA_PAGEsysobjvalues11811DATA_PAGEsyssingleobjrefs1971DATA_PAGEtestindex12904INDEX_PAGEtestindex1380974INDEX_PAGEtestindex1412504INDEX_PAGE
Осталось понять какого лешего это попадает в статистику IO.

...

Рейтинг:

0 / 0

15.10.2018, 21:23

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39717859

invm

Участник

Откуда: Москва

Сообщения: 9 956

Рейтинг: 0 / 0

В предыдущем примере накосячено.

Исправлено

Код: sql

use master;
create database DBTest001;
alter database DBTest001 set auto_create_statistics off;
go

declare @sql nvarchar(max) = N'create event session DBTest001_TrackLatches on server 
add event sqlserver.latch_acquired
(
  action (sqlserver.session_id, sqlserver.sql_text)
  where ([database_id] = {dbid} and session_id = {spid})
)
add target package0.ring_buffer (set max_memory = 1000)
with (event_retention_mode=allow_single_event_loss, max_dispatch_latency = 3 seconds, track_causality=on, startup_state=off);';

if exists(select 1 from sys.server_event_sessions where name = N'DBTest001_TrackLatches')
 drop event session DBTest001_TrackLatches on server;

select
 @sql = replace(replace(@sql, N'{dbid}', cast(db_id('DBTest001') as nvarchar(10))), N'{spid}', cast(@@spid as nvarchar(10)));

exec(@sql);
go

use DBTest001;
go

CREATE TABLE testindex (a INT, b CHAR(1))
GO
;WITH xx AS (SELECT * FROM 
	(VALUES (5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A')) AS x(a,b)
) 
INSERT INTO testindex(a,b) SELECT x1.*
FROM xx AS x1,xx AS x2,xx AS x3,xx AS x4,xx AS x5,xx AS x6,xx AS x7;
GO
INSERT INTO testindex(a,b) VALUES (5,'X')
GO

create statistics ST_testindex__a on testindex (a) --with fullscan;
create statistics ST_testindex__b on testindex (b) --with fullscan;
go

create index IX_testindex on testindex (a, b);
go

create procedure spGetPagesRead
 @UpdateStatisticsMode varchar(10) = null

as
begin
 set nocount on;

 if @UpdateStatisticsMode = 'fullscan'
  begin
   update statistics testindex(ST_testindex__a) with fullscan;
   update statistics testindex(ST_testindex__b) with fullscan;
  end
 else
  begin
   update statistics testindex(ST_testindex__a);
   update statistics testindex(ST_testindex__b);
  end;

 alter event session DBTest001_TrackLatches on server state = start;
 set statistics io on; SELECT a, b FROM testindex WHERE a = 5 and b = 'X'  option (recompile); set statistics io off;

 declare @x xml;

 select
  @x = cast(t.target_data as xml)
 from
  sys.dm_xe_sessions s join
  sys.dm_xe_session_targets t on t.event_session_address = s.address
 where
  s.name = N'DBTest001_TrackLatches';

 alter event session DBTest001_TrackLatches on server state = stop;

 select
  pi.file_id, pi.page_id, pa.index_id, pa.page_type_desc
 from
  @x.nodes('/RingBufferTarget/event[@name = "latch_acquired"][data[@name = "mode"][text = "SH"]]') t(n) cross apply
  (select t.n.value('(data[@name = "file_id"]/value)[1]', 'smallint'), t.n.value('(data[@name = "page_id"]/value)[1]', 'int')) pi(file_id, page_id) join
  sys.dm_db_database_page_allocations(db_id(), null, null, null, 'detailed') pa on pa.allocated_page_file_id = pi.file_id and pa.allocated_page_page_id = pi.page_id
 where
  pa.object_id = object_id('testindex');

end;
go

exec dbo.spGetPagesRead 'fullscan';
exec dbo.spGetPagesRead;
go

drop event session DBTest001_TrackLatches on server;
go

use master;
drop database DBTest001;
go

С fullscan
file_idpage_idindex_idpage_type_desc12904INDEX_PAGE1380974INDEX_PAGE1412504INDEX_PAGE

Без fullscan
file_idpage_idindex_idpage_type_desc12904INDEX_PAGE1380974INDEX_PAGE1380974INDEX_PAGE1412504INDEX_PAGE

...

Рейтинг:

0 / 0

15.10.2018, 22:35

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39717863

SandalTree

Участник

Откуда: Перехлёсток восьми батог

Сообщения: 28 388

Рейтинг: 0 / 0

invm,

Ну и зачем оно 2 раза читает нижнюю страничку индекса?

...

Рейтинг:

0 / 0

15.10.2018, 23:25

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39717893

SandalTree

Участник

Откуда: Перехлёсток восьми батог

Сообщения: 28 388

Рейтинг: 0 / 0

Mind,

Вот нашёл более приближённый пример того что индекс с большей селективностью лучше работает:

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.

CREATE TABLE dbo.testindex2(ID INT IDENTITY (0,5), i INT, a CHAR(1))
GO
CREATE INDEX ix_testindex1 ON dbo.testindex2(id,i)
GO
CREATE INDEX ix_testindex2 ON dbo.testindex2(i,id)
GO
DECLARE @l INT = 2010;
DECLARE @m INT = @l;
WHILE @m > 0
BEGIN
	INSERT INTO dbo.testindex2(i,a)
	SELECT TOP (@m) @l-@m, 'a' FROM sys.messages
	SET @m -= 5;
END
GO
SET STATISTICS IO ON
GO
SELECT * FROM dbo.testindex2 WITH (INDEX = ix_testindex1)
WHERE i BETWEEN 0 AND 1000 AND id BETWEEN 0 AND 1000
OPTION (RECOMPILE)
GO
SELECT * FROM dbo.testindex2 WITH (INDEX = ix_testindex2)
WHERE i BETWEEN 0 AND 1000 AND id BETWEEN 0 AND 1000
OPTION (RECOMPILE)
GO
SET STATISTICS IO OFF

...

Рейтинг:

0 / 0

16.10.2018, 03:36

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39717954

Гавриленко Сергей Алексеевич

Участник

Откуда: Moscow

Сообщения: 37 171

Рейтинг: 0 / 0

SandalTree,

Ясен пень, что здесь будут разные seek-предикаты, в отличие от запроса с равенством.

...

Рейтинг:

0 / 0

16.10.2018, 10:18

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39717991

invm

Участник

Откуда: Москва

Сообщения: 9 956

Рейтинг: 0 / 0

SandalTreeНу и зачем оно 2 раза читает нижнюю страничку индекса?Нижнюю? Уверены? :)
А зачем - это вам объяснять. Это же ваша теория "О влиянии неучтенных значений в статистике на количество чтений во время выполнения запроса при идентичных планах выполнения".
SandalTreeВот нашёл более приближённый пример того что индекс с большей селективностью лучше работаетЛед тронулся.
Не хотите переформулировать ваше "общее правило"?

...

Рейтинг:

0 / 0

16.10.2018, 11:11

| Ответить | Цитировать | Написать

Перекрестные индексы. Как лучше?

#39718154

msLex

Участник

Сообщения: 8 523

Рейтинг: 0 / 0

SandalTreeMind,

Вот нашёл более приближённый пример того что индекс с большей селективностью лучше работает:

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.

CREATE TABLE dbo.testindex2(ID INT IDENTITY (0,5), i INT, a CHAR(1))
GO
CREATE INDEX ix_testindex1 ON dbo.testindex2(id,i)
GO
CREATE INDEX ix_testindex2 ON dbo.testindex2(i,id)
GO
DECLARE @l INT = 2010;
DECLARE @m INT = @l;
WHILE @m > 0
BEGIN
	INSERT INTO dbo.testindex2(i,a)
	SELECT TOP (@m) @l-@m, 'a' FROM sys.messages
	SET @m -= 5;
END
GO
SET STATISTICS IO ON
GO
SELECT * FROM dbo.testindex2 WITH (INDEX = ix_testindex1)
WHERE i BETWEEN 0 AND 1000 AND id BETWEEN 0 AND 1000
OPTION (RECOMPILE)
GO
SELECT * FROM dbo.testindex2 WITH (INDEX = ix_testindex2)
WHERE i BETWEEN 0 AND 1000 AND id BETWEEN 0 AND 1000
OPTION (RECOMPILE)
GO
SET STATISTICS IO OFF

авторTable 'testindex2'. Scan count 1, logical reads 204, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.
Table 'testindex2'. Scan count 1, logical reads 1035, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.
Распределение данных надумано и не реалистично, но это просто пример селективности.
В реальной жизни скорее всего могут быть более серьёзные случаи.

Ваше различие в чтениях вызвано не селективностью индекса, а количеством записей, попадающим в диапазон between по одному и по второму полю

вот вам чуть измененных скрипт, в котором я просто "размазал" значение поля i, домножив его на 100, но не менял селективность ни одного из полей, и получил противоположный вашему результат

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.

if object_id('dbo.testindex2')  is not null
	drop table dbo.testindex2

CREATE TABLE dbo.testindex2(ID INT IDENTITY (0,5), i INT, a CHAR(1))
GO
DECLARE @l INT = 2010;
DECLARE @m INT = @l;
WHILE @m > 0
BEGIN
	INSERT INTO dbo.testindex2(i,a)
	SELECT TOP (@m) @l-@m * 100, 'a' FROM sys.messages
	SET @m -= 5;
END
GO
CREATE INDEX ix_testindex1 ON dbo.testindex2(id,i)
GO
CREATE INDEX ix_testindex2 ON dbo.testindex2(i,id)
GO
SET STATISTICS IO ON
GO
SELECT * FROM dbo.testindex2 WITH (INDEX = ix_testindex1)
WHERE i BETWEEN 1 AND 100000 AND id BETWEEN 1 AND 100000
OPTION (RECOMPILE)
GO
SELECT * FROM dbo.testindex2 WITH (INDEX = ix_testindex2)
WHERE i BETWEEN 1 AND 100000 AND id BETWEEN 1 AND 100000
OPTION (RECOMPILE)
GO
SET STATISTICS IO OFF

STATISTICS IOTable 'Worktable'. Scan count 0, logical reads 0, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.
Table 'testindex2'. Scan count 1, logical reads 58 , physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.

(0 rows affected)
Table 'Worktable'. Scan count 0, logical reads 0, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.
Table 'testindex2'. Scan count 1, logical reads 5 , physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.

...

Рейтинг:

0 / 0

16.10.2018, 13:58

| Ответить | Цитировать | Написать

25 сообщений из 63, страница 2 из 3

все

Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Перекрестные индексы. Как лучше?

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=46&msg=39717365&tid=1688955]:	0ms
get settings:	7ms
get forum list:	17ms
check forum access:	2ms
check topic access:	2ms
track hit:	168ms
get topic data:	9ms
get forum data:	3ms
get page messages:	66ms
get tp. blocked users:	1ms
others:	203ms

total:	478ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы