powered by simpleCommunicator - 2.0.60     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Перекрестные индексы. Как лучше?
25 сообщений из 63, страница 2 из 3
Перекрестные индексы. Как лучше?
    #39716438
Фотография SandalTree
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Гавриленко Сергей Алексеевич,

Вы наверное очень удивитесь, но если ...
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
CREATE INDEX IX_testindex ON testindex(a,b)
GO
set statistics IO ON
go
SELECT * FROM testindex WHERE a = 5 and b = 'X'
GO
set statistics IO off
GO
DROP INDEX IX_testindex ON testindex
GO
CREATE INDEX IX_testindex ON testindex(b,a)
GO
set statistics IO ON
go
SELECT * FROM testindex WHERE a = 5 and b = 'X'
GO
set statistics IO off
GO
DROP INDEX IX_testindex ON testindex
GO
--------------------------------------------------------------------------------------------
Table 'testindex'. Scan count 1, logical reads 4, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.
Table 'testindex'. Scan count 1, logical reads 3, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.


Разница в наших показаниях заключается в том что при использовании индекса №1 сервер использует статистики индекса №2.
В вашем случае для построения статистики по полю "b" был сделан FULLSCAN и значение "Х" попало в статистики.
Получается что-б ваш пример работал, вы должны иметь индексы по ВСЕМ полям, либо делать апдейт статистик с опцией FULLSCAN.

Но даже в вашем случае если вы запустите запрос БЕЗ указания индекса, то сервер выберет индекс №2.
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39716439
Фотография SandalTree
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Mind,

Вообще-то планы разные, так как индекс по полю А "не видит" реального распределения значений по полю "Б" если по полю "Б" нет полной статистики.
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39716446
Фотография SandalTree
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
invmКасаемого вашего теста
У меня получился такой-же результат как и у вас, когда я запустил тест в tempdb.

Обнаружилась интересная закономерность.
В tempdb статистика по полю "b" включает значение "X", а в пользовательской базе нет.

В этом и есть разница в IO.
Если надо, могу дать скриншоты статистик, хотя я уже и давал скриншоты разных планов.
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39716515
invm
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
SandalTreeОбнаружилась интересная закономерность.
В tempdb статистика по полю "b" включает значение "X", а в пользовательской базе нет.Вы опять фантазируете.
Статистика по (a,b) не может содержать распределение по b, ибо гистограмма хранится только для первого столбца. В любой БД.
Соответственно, статистика по (b,a) будет содержать такое распределение. Опять же в любой БД.
SandalTreeЕсли надо, могу дать скриншоты статистик, хотя я уже и давал скриншоты разных планов.Ваши картинки мало кому интересны в качестве доказательств.
Репро давайте, подтверждающее ваши слова.
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39716700
Фотография SIMPLicity_
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Mindinvmпропущено...
Попробуйте поразмышлять почему рекомендовано именно так.Если честно я вообще не понимаю что именно они рекомендуют. Какие еще варианты могут быть запихать колонку в WHERE кроме как = > < или BETWEEN ? С функциями что-ли? Additional columns это что? Все те что кроме first? Или те что все еще в WHERE но непонятно с какими условиями поиска или те что даже не в WHERE? А зачем они вообще в индексе нужны? А какая тогда разница на их distinctness? И вообще получается что только начиная со второй колонки есть смысл в каком порядке запихивать в индекс, а первую как выбрать если там несколько в WHERE?
Или они хотели сказать "Additionally, columns...". Такое ощущение что эти рекомендации переводили индусы основываясь на доисторических свитках Sybase.
like ?

==================
PS Как вариант like 'АБэЦэ...%' (в идеале должен быть seek вместо scan)....
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39716982
Фотография Mind
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
SandalTreeВообще-то планы разные, так как индекс по полю А "не видит"При чем тут индекс "видит", "не видит"? Чушь какую то развели. Оптимизатор решает на основании статистики. Статистики могут быть как привязанные к индексу так и отдельно. И те и другие статистики могут создаваться/обновляться с FULLSCAN и без. Исключение составляет лишь создание/ребилд индекса потому что в этом случае статистика обновляется с FULLSCAN автоматически.
SandalTreeреального распределения значений по полю "Б" если по полю "Б" нет полной статистики. Так при чем тут индекс то, если все дело в статистике? А особенно при чем тут селективность полей?
SandalTreeЕсли надо, могу дать скриншоты статистик, хотя я уже и давал скриншоты разных планов.Все ваши тесты доказывают лишь то что при потере всех конечностей таракан теряет слух. Связи между селективностью и тем какой индекс сервер выбирает никакой, потому что решение оптимизатора в данном случае целиком и полностью зависит от того насколько дерьмовую статистику вы ему подсовываете.
SandalTreeВы наверное очень удивитесь, но если ...Удивляетесь здесь по-моему только вы... Готовы?
Если в ваш пример добавить селективности по полю A
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
DROP TABLE testindex 
GO
CREATE TABLE testindex (a INT, b CHAR(1))
GO
;WITH xx AS (SELECT * FROM 
	(VALUES (5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A')) AS x(a,b)
) 
INSERT INTO testindex(a,b) SELECT x1.*
FROM xx AS x1,xx AS x2,xx AS x3,xx AS x4,xx AS x5,xx AS x6,xx AS x7;
GO
INSERT INTO testindex(a,b) VALUES (1,'A')
INSERT INTO testindex(a,b) VALUES (2,'A')
INSERT INTO testindex(a,b) VALUES (3,'A')
INSERT INTO testindex(a,b) VALUES (4,'A')
INSERT INTO testindex(a,b) VALUES (5,'X')
GO


то сервер все равно продолжит выбирать индекс (b,a)!
SandalTreeПостройте 2 разных индекса и посмотрите что сервер предпочтёт тот по которуму выше селективность в первой колонке. О ужас! Ваша псевдо-теория развалилась.


Можно построить оба индекса одновременно, чтобы исключить безлапых тараканов неполноценную статистику из нашего эксперимента.
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
DROP INDEX IX_testindex ON testindex;
CREATE INDEX IX_testindex_1 ON testindex(a,b)
CREATE INDEX IX_testindex_2 ON testindex(b,a)
go
set statistics profile on;
go
SELECT a, b FROM testindex WHERE a = 5 and b = 'X'
go
set statistics profile off;
go

Но сервер упорно продолжает выбирать индекс с меньшей селективностью!
Код: plaintext
1.
|--Index Seek(OBJECT:([TEST].[dbo].[testindex].[ IX_testindex_2 ]), SEEK:([TEST].[dbo].[testindex].[b]='X' AND [TEST].[dbo].[testindex].[a]=(5)) ORDERED FORWARD)
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39717250
Фотография SIMPLicity_
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
MindSandalTreeВообще-то планы разные, так как индекс по полю А "не видит"При чем тут индекс "видит", "не видит"? Чушь какую то развели. Оптимизатор решает на основании статистики. Статистики могут быть как привязанные к индексу так и отдельно. И те и другие статистики могут создаваться/обновляться с FULLSCAN и без. Исключение составляет лишь создание/ребилд индекса потому что в этом случае статистика обновляется с FULLSCAN автоматически.
SandalTreeреального распределения значений по полю "Б" если по полю "Б" нет полной статистики. Так при чем тут индекс то, если все дело в статистике? А особенно при чем тут селективность полей?
SandalTreeЕсли надо, могу дать скриншоты статистик, хотя я уже и давал скриншоты разных планов.Все ваши тесты доказывают лишь то что при потере всех конечностей таракан теряет слух. Связи между селективностью и тем какой индекс сервер выбирает никакой, потому что решение оптимизатора в данном случае целиком и полностью зависит от того насколько дерьмовую статистику вы ему подсовываете.
SandalTreeВы наверное очень удивитесь, но если ...Удивляетесь здесь по-моему только вы... Готовы?
Если в ваш пример добавить селективности по полю A
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
DROP TABLE testindex 
GO
CREATE TABLE testindex (a INT, b CHAR(1))
GO
;WITH xx AS (SELECT * FROM 
	(VALUES (5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A')) AS x(a,b)
) 
INSERT INTO testindex(a,b) SELECT x1.*
FROM xx AS x1,xx AS x2,xx AS x3,xx AS x4,xx AS x5,xx AS x6,xx AS x7;
GO
INSERT INTO testindex(a,b) VALUES (1,'A')
INSERT INTO testindex(a,b) VALUES (2,'A')
INSERT INTO testindex(a,b) VALUES (3,'A')
INSERT INTO testindex(a,b) VALUES (4,'A')
INSERT INTO testindex(a,b) VALUES (5,'X')
GO


то сервер все равно продолжит выбирать индекс (b,a)!
SandalTreeПостройте 2 разных индекса и посмотрите что сервер предпочтёт тот по которуму выше селективность в первой колонке. О ужас! Ваша псевдо-теория развалилась.


Можно построить оба индекса одновременно, чтобы исключить безлапых тараканов неполноценную статистику из нашего эксперимента.
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
DROP INDEX IX_testindex ON testindex;
CREATE INDEX IX_testindex_1 ON testindex(a,b)
CREATE INDEX IX_testindex_2 ON testindex(b,a)
go
set statistics profile on;
go
SELECT a, b FROM testindex WHERE a = 5 and b = 'X'
go
set statistics profile off;
go

Но сервер упорно продолжает выбирать индекс с меньшей селективностью!
Код: plaintext
1.
|--Index Seek(OBJECT:([TEST].[dbo].[testindex].[ IX_testindex_2 ]), SEEK:([TEST].[dbo].[testindex].[b]='X' AND [TEST].[dbo].[testindex].[a]=(5)) ORDERED FORWARD)


чуть меняем условие :

set statistics profile on;
go
SELECT a, b FROM testindex WHERE a =5 and b ! = 'X'
go
set statistics profile off;
go

Получаем картину:

StmtText:
Код: sql
1.
  |--Index Seek(OBJECT:([tempdb].[dbo].[testindex].[IX_testindex_1]), SEEK:([tempdb].[dbo].[testindex].[a]=(5) AND [tempdb].[dbo].[testindex].[b] < 'X' OR [tempdb].[dbo].[testindex].[a]=(5) AND [tempdb].[dbo].[testindex].[b] > 'X') ORDERED FORWARD)


при
Argument:
Код: sql
1.
OBJECT:([tempdb].[dbo].[testindex].[IX_testindex_1]), SEEK:([tempdb].[dbo].[testindex].[a]=(5) AND [tempdb].[dbo].[testindex].[b] < 'X' OR [tempdb].[dbo].[testindex].[a]=(5) AND [tempdb].[dbo].[testindex].[b] > 'X') ORDERED FORWARD



Выбор в пользу другого индекса при НЕочевидном (для меня, по крайней мере) преобразовании...
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39717252
Фотография SIMPLicity_
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
PS Вообще, вы куда-то слишком в дебри углубились...
PPS Мне
так кажется....
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39717287
Mr. X
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
SIMPLicity_,

Да какие уж там дебри, все крутится (в основном) вокруг статистики. Из которой тут упоминали только селективность (selectivity), хотя в статистике присутствуют плотность (density), мощьность (cardinality) и гистограмма (histogram). Которые SQL так же использует для оценок.
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39717365
Фотография SandalTree
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
invmSandalTreeОбнаружилась интересная закономерность.
В tempdb статистика по полю "b" включает значение "X", а в пользовательской базе нет.Вы опять фантазируете.
Статистика по (a,b) не может содержать распределение по b, ибо гистограмма хранится только для первого столбца. В любой БД.
Соответственно, статистика по (b,a) будет содержать такое распределение. Опять же в любой БД.
SandalTreeЕсли надо, могу дать скриншоты статистик, хотя я уже и давал скриншоты разных планов.Ваши картинки мало кому интересны в качестве доказательств.
Репро давайте, подтверждающее ваши слова.

Во первых: есть 2 статистики по обоим полям и когда скуль строит план, то он смотрит на обе. (закрыли этот вопрос?)

Во вторых: при запуске одного и того-же кода в разных базах происходит различная обработка алгоритма выборки сэмла. В одной базе последняя страница входит в сэмпл, а в другой нет, от этого различные статистики и планы. (какого рода репо вам предоставить? Потестируйте в разных базах и посмотрите на сэмплы и статистики.)

В третьих: При двух индексах a-b и b-a скуль почему-то выбирает второй индекс. Сможете ответить на вопрос "почему?"?
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39717374
Фотография SandalTree
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Mindдивляетесь здесь по-моему только вы... Готовы?
Если в ваш пример добавить селективности по полю A
то сервер все равно продолжит выбирать индекс (b,a)!
Да, вы правы. В случае выбора между двумя этими индексами скуль не видит разницы так как планы у них с одинаковой стоимостью.
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39717616
invm
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
SandalTreeВо первых: есть 2 статистики по обоим полям и когда скуль строит план, то он смотрит на обе. (закрыли этот вопрос?)Еще раз - для уровня оптимизации TRIVIAL статистика не используется для выбора плана. Только для оценки количества строк.
SandalTreeВо вторых: при запуске одного и того-же кода в разных базах происходит различная обработка алгоритма выборки сэмла. В одной базе последняя страница входит в сэмпл, а в другой нет, от этого различные статистики и планы.Да? Вам был даден пример, из которого понятно из-за чего планы разные. Может для вас станет понятнее, когда отключите автосоздание статистики.
Но вы продолжаете фантазировать... Особо порадовала зависимость IO запроса от статистики...
SandalTreeВ третьих: При двух индексах a-b и b-a скуль почему-то выбирает второй индекс. Сможете ответить на вопрос "почему?"?Неужто из-за селективности?
Попробуйте поменять порядок создания индексов.

Ну и напоследок вопрос - каким образом для индексов (a, b) и (b, a), при предикате a = ... and b = ..., селективность столбцов индекса будет влиять на операцию поиска в нем?
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39717781
Фотография SandalTree
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
invmSandalTreeВо вторых: при запуске одного и того-же кода в разных базах происходит различная обработка алгоритма выборки сэмла. В одной базе последняя страница входит в сэмпл, а в другой нет, от этого различные статистики и планы.Да? Вам был даден пример, из которого понятно из-за чего планы разные. Может для вас станет понятнее, когда отключите автосоздание статистики.
Вы мне не верите, но сами проверить не желаете. Вот вам скриншот.
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39717782
Фотография SandalTree
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
invm,

Разница в IO обусловлена тем что статистики не захватили FULLSAMPLE.
Прочитано только 7% всех записей и значения с последней страницы остались неучтёнными.

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
DECLARE @SQL VARCHAR(1000);

SELECT @SQL = 'DBCC SHOW_STATISTICS (''dbo.testindex'',''' + name + ''');' FROM sys.stats as s
INNER JOIN sys.stats_columns AS c
	ON c.object_id = s.object_id AND s.stats_id = c.stats_id
WHERE s.object_id = OBJECT_ID('testindex') AND c.column_id = 1
EXEC (@SQL)
SELECT @SQL = 'DBCC SHOW_STATISTICS (''dbo.testindex'',''' + name + ''');' FROM sys.stats as s
INNER JOIN sys.stats_columns AS c
	ON c.object_id = s.object_id AND s.stats_id = c.stats_id
WHERE s.object_id = OBJECT_ID('testindex') AND c.column_id = 2
EXEC (@SQL)
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39717783
Фотография SandalTree
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
invm,

Как только мы перестроим статистики с полным сканированием то получим результат, который нам продемонстрировал Сергей Гавриленко.
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
DECLARE @SQL VARCHAR(1000);
SELECT @SQL = 'UPDATE STATISTICS dbo.testindex ' + name + ' WITH FULLSCAN;' FROM sys.stats as s
INNER JOIN sys.stats_columns AS c
	ON c.object_id = s.object_id AND s.stats_id = c.stats_id
WHERE s.object_id = OBJECT_ID('testindex') AND c.column_id = 1
EXEC (@SQL)
SELECT @SQL = 'UPDATE STATISTICS dbo.testindex ' + name + ' WITH FULLSCAN;' FROM sys.stats as s
INNER JOIN sys.stats_columns AS c
	ON c.object_id = s.object_id AND s.stats_id = c.stats_id
WHERE s.object_id = OBJECT_ID('testindex') AND c.column_id = 2
EXEC (@SQL)
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39717785
Гавриленко Сергей Алексеевич
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Откуда появляется четвертое логическое чтение -- не понятно. (Не факт, что оно есть на самом деле и не врет statistics io.) Опять же, если выключить автосоздание статистик на базе, то чтений будет 4 в обоих вариантах, а если индекс прибить руками, то 3 в обоих вариантах.

Однако при глубине индекса в три уровня, четвертое чтение не может быть из дерева индекса -- в индексе просто читать больше нечего.

Короче, тут не в структуре индекса дело, а в каких-то сайд-эффектах от статистики.
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39717787
invm
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
SandalTreeВы мне не верите, но сами проверить не желаете. Вот вам скриншот.Зачем мне ваш скриншот? В моем примере ровно то же самое.
Видимо вы так не удосожились хотя бы его результаты посмотреть.
SandalTreeРазница в IO обусловлена тем что статистики не захватили FULLSAMPLE.
Прочитано только 7% всех записей и значения с последней страницы остались неучтёнными.И каким же образом "неучтенность значений" при компиляции повлияла на статистику IO при выполнении?
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39717837
Фотография Mind
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Гавриленко Сергей АлексеевичОпять же, если выключить автосоздание статистик на базе, то чтений будет 4 в обоих вариантах, а если индекс прибить руками, то 3 в обоих вариантах.А если обновить все статистики с FULLSCAN, то тоже становится 3 чтения вместо 4х.
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39717839
invm
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Тайна 4-й страницы
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
use master;
create database DBTest001;
alter database DBTest001 set auto_create_statistics off;
go

declare @sql nvarchar(max) = N'create event session DBTest001_TrackLatches on server 
add event sqlserver.latch_acquired
(
  action (sqlserver.session_id, sqlserver.sql_text)
  where ([database_id] = {dbid} and session_id = {spid})
)
add target package0.ring_buffer (set max_memory = 1000)
with (event_retention_mode=allow_single_event_loss, max_dispatch_latency = 3 seconds, track_causality=on, startup_state=off);';

if exists(select 1 from sys.server_event_sessions where name = N'DBTest001_TrackLatches')
 drop event session DBTest001_TrackLatches on server;

select
 @sql = replace(replace(@sql, N'{dbid}', cast(db_id('DBTest001') as nvarchar(10))), N'{spid}', cast(@@spid as nvarchar(10)));

exec(@sql);
go

use DBTest001;
go

CREATE TABLE testindex (a INT, b CHAR(1))
GO
;WITH xx AS (SELECT * FROM 
	(VALUES (5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A')) AS x(a,b)
) 
INSERT INTO testindex(a,b) SELECT x1.*
FROM xx AS x1,xx AS x2,xx AS x3,xx AS x4,xx AS x5,xx AS x6,xx AS x7;
GO
INSERT INTO testindex(a,b) VALUES (5,'X')
GO

create statistics ST_testindex__a on testindex (a) --with fullscan;
create statistics ST_testindex__b on testindex (b) --with fullscan;
go

create index IX_testindex on testindex (a, b);
go

create procedure spGetPagesRead
 @UpdateStatisticsMode varchar(10) = null

as
begin
 set nocount on;

 if @UpdateStatisticsMode = 'fullscan'
  begin
   update statistics testindex(ST_testindex__a) with fullscan;
   update statistics testindex(ST_testindex__b) with fullscan;
  end
 else
  begin
   update statistics testindex(ST_testindex__a);
   update statistics testindex(ST_testindex__b);
  end;

 alter event session DBTest001_TrackLatches on server state = start;
 set statistics io on; SELECT a, b FROM testindex WHERE a = 5 and b = 'X'  option (recompile); set statistics io off;

 declare @x xml;

 select
  @x = cast(t.target_data as xml)
 from
  sys.dm_xe_sessions s join
  sys.dm_xe_session_targets t on t.event_session_address = s.address
 where
  s.name = N'DBTest001_TrackLatches';

 alter event session DBTest001_TrackLatches on server state = stop;

 select distinct
  object_name(pa.object_id) as object, pi.file_id, pi.page_id, pa.index_id, pa.page_type_desc
 from
  @x.nodes('/RingBufferTarget/event[@name = "latch_acquired"][data[@name = "mode"][text = "SH"]]') t(n) cross apply
  (select t.n.value('(data[@name = "file_id"]/value)[1]', 'smallint'), t.n.value('(data[@name = "page_id"]/value)[1]', 'int')) pi(file_id, page_id) join
  sys.dm_db_database_page_allocations(db_id(), null, null, null, 'detailed') pa on pa.allocated_page_file_id = pi.file_id and pa.allocated_page_page_id = pi.page_id

end;
go

exec dbo.spGetPagesRead 'fullscan';
exec dbo.spGetPagesRead;
go

drop event session DBTest001_TrackLatches on server;
go

use master;
drop database DBTest001;
go


С fullscan
objectfile_idpage_idindex_idpage_type_descsysobjvalues1431INDEX_PAGEsysobjvalues11281DATA_PAGEsysobjvalues11321DATA_PAGEsyssingleobjrefs1971DATA_PAGEtestindex12904INDEX_PAGEtestindex1380974INDEX_PAGEtestindex1412504INDEX_PAGE

Без fullscan
objectfile_idpage_idindex_idpage_type_desc sysmultiobjrefs 11052INDEX_PAGEsysobjvalues1431INDEX_PAGEsysobjvalues11281DATA_PAGEsysobjvalues11811DATA_PAGEsyssingleobjrefs1971DATA_PAGEtestindex12904INDEX_PAGEtestindex1380974INDEX_PAGEtestindex1412504INDEX_PAGE
Осталось понять какого лешего это попадает в статистику IO.
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39717859
invm
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
В предыдущем примере накосячено.
Исправлено
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
use master;
create database DBTest001;
alter database DBTest001 set auto_create_statistics off;
go

declare @sql nvarchar(max) = N'create event session DBTest001_TrackLatches on server 
add event sqlserver.latch_acquired
(
  action (sqlserver.session_id, sqlserver.sql_text)
  where ([database_id] = {dbid} and session_id = {spid})
)
add target package0.ring_buffer (set max_memory = 1000)
with (event_retention_mode=allow_single_event_loss, max_dispatch_latency = 3 seconds, track_causality=on, startup_state=off);';

if exists(select 1 from sys.server_event_sessions where name = N'DBTest001_TrackLatches')
 drop event session DBTest001_TrackLatches on server;

select
 @sql = replace(replace(@sql, N'{dbid}', cast(db_id('DBTest001') as nvarchar(10))), N'{spid}', cast(@@spid as nvarchar(10)));

exec(@sql);
go

use DBTest001;
go

CREATE TABLE testindex (a INT, b CHAR(1))
GO
;WITH xx AS (SELECT * FROM 
	(VALUES (5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A'),(5,'A')) AS x(a,b)
) 
INSERT INTO testindex(a,b) SELECT x1.*
FROM xx AS x1,xx AS x2,xx AS x3,xx AS x4,xx AS x5,xx AS x6,xx AS x7;
GO
INSERT INTO testindex(a,b) VALUES (5,'X')
GO

create statistics ST_testindex__a on testindex (a) --with fullscan;
create statistics ST_testindex__b on testindex (b) --with fullscan;
go

create index IX_testindex on testindex (a, b);
go

create procedure spGetPagesRead
 @UpdateStatisticsMode varchar(10) = null

as
begin
 set nocount on;

 if @UpdateStatisticsMode = 'fullscan'
  begin
   update statistics testindex(ST_testindex__a) with fullscan;
   update statistics testindex(ST_testindex__b) with fullscan;
  end
 else
  begin
   update statistics testindex(ST_testindex__a);
   update statistics testindex(ST_testindex__b);
  end;

 alter event session DBTest001_TrackLatches on server state = start;
 set statistics io on; SELECT a, b FROM testindex WHERE a = 5 and b = 'X'  option (recompile); set statistics io off;

 declare @x xml;

 select
  @x = cast(t.target_data as xml)
 from
  sys.dm_xe_sessions s join
  sys.dm_xe_session_targets t on t.event_session_address = s.address
 where
  s.name = N'DBTest001_TrackLatches';

 alter event session DBTest001_TrackLatches on server state = stop;

 select
  pi.file_id, pi.page_id, pa.index_id, pa.page_type_desc
 from
  @x.nodes('/RingBufferTarget/event[@name = "latch_acquired"][data[@name = "mode"][text = "SH"]]') t(n) cross apply
  (select t.n.value('(data[@name = "file_id"]/value)[1]', 'smallint'), t.n.value('(data[@name = "page_id"]/value)[1]', 'int')) pi(file_id, page_id) join
  sys.dm_db_database_page_allocations(db_id(), null, null, null, 'detailed') pa on pa.allocated_page_file_id = pi.file_id and pa.allocated_page_page_id = pi.page_id
 where
  pa.object_id = object_id('testindex');

end;
go

exec dbo.spGetPagesRead 'fullscan';
exec dbo.spGetPagesRead;
go

drop event session DBTest001_TrackLatches on server;
go

use master;
drop database DBTest001;
go


С fullscan
file_idpage_idindex_idpage_type_desc12904INDEX_PAGE1380974INDEX_PAGE1412504INDEX_PAGE

Без fullscan
file_idpage_idindex_idpage_type_desc12904INDEX_PAGE1380974INDEX_PAGE1380974INDEX_PAGE1412504INDEX_PAGE
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39717863
Фотография SandalTree
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
invm,

Ну и зачем оно 2 раза читает нижнюю страничку индекса?
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39717893
Фотография SandalTree
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Mind,

Вот нашёл более приближённый пример того что индекс с большей селективностью лучше работает:
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
CREATE TABLE dbo.testindex2(ID INT IDENTITY (0,5), i INT, a CHAR(1))
GO
CREATE INDEX ix_testindex1 ON dbo.testindex2(id,i)
GO
CREATE INDEX ix_testindex2 ON dbo.testindex2(i,id)
GO
DECLARE @l INT = 2010;
DECLARE @m INT = @l;
WHILE @m > 0
BEGIN
	INSERT INTO dbo.testindex2(i,a)
	SELECT TOP (@m) @l-@m, 'a' FROM sys.messages
	SET @m -= 5;
END
GO
SET STATISTICS IO ON
GO
SELECT * FROM dbo.testindex2 WITH (INDEX = ix_testindex1)
WHERE i BETWEEN 0 AND 1000 AND id BETWEEN 0 AND 1000
OPTION (RECOMPILE)
GO
SELECT * FROM dbo.testindex2 WITH (INDEX = ix_testindex2)
WHERE i BETWEEN 0 AND 1000 AND id BETWEEN 0 AND 1000
OPTION (RECOMPILE)
GO
SET STATISTICS IO OFF

авторTable 'testindex2'. Scan count 1, logical reads 204, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.
Table 'testindex2'. Scan count 1, logical reads 1035, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.
Распределение данных надумано и не реалистично, но это просто пример селективности.
В реальной жизни скорее всего могут быть более серьёзные случаи.
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39717954
Гавриленко Сергей Алексеевич
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
SandalTree,

Ясен пень, что здесь будут разные seek-предикаты, в отличие от запроса с равенством.
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39717991
invm
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
SandalTreeНу и зачем оно 2 раза читает нижнюю страничку индекса?Нижнюю? Уверены? :)
А зачем - это вам объяснять. Это же ваша теория "О влиянии неучтенных значений в статистике на количество чтений во время выполнения запроса при идентичных планах выполнения".
SandalTreeВот нашёл более приближённый пример того что индекс с большей селективностью лучше работаетЛед тронулся.
Не хотите переформулировать ваше "общее правило"?
...
Рейтинг: 0 / 0
Перекрестные индексы. Как лучше?
    #39718154
msLex
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
SandalTreeMind,

Вот нашёл более приближённый пример того что индекс с большей селективностью лучше работает:
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
CREATE TABLE dbo.testindex2(ID INT IDENTITY (0,5), i INT, a CHAR(1))
GO
CREATE INDEX ix_testindex1 ON dbo.testindex2(id,i)
GO
CREATE INDEX ix_testindex2 ON dbo.testindex2(i,id)
GO
DECLARE @l INT = 2010;
DECLARE @m INT = @l;
WHILE @m > 0
BEGIN
	INSERT INTO dbo.testindex2(i,a)
	SELECT TOP (@m) @l-@m, 'a' FROM sys.messages
	SET @m -= 5;
END
GO
SET STATISTICS IO ON
GO
SELECT * FROM dbo.testindex2 WITH (INDEX = ix_testindex1)
WHERE i BETWEEN 0 AND 1000 AND id BETWEEN 0 AND 1000
OPTION (RECOMPILE)
GO
SELECT * FROM dbo.testindex2 WITH (INDEX = ix_testindex2)
WHERE i BETWEEN 0 AND 1000 AND id BETWEEN 0 AND 1000
OPTION (RECOMPILE)
GO
SET STATISTICS IO OFF


авторTable 'testindex2'. Scan count 1, logical reads 204, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.
Table 'testindex2'. Scan count 1, logical reads 1035, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.
Распределение данных надумано и не реалистично, но это просто пример селективности.
В реальной жизни скорее всего могут быть более серьёзные случаи.


Ваше различие в чтениях вызвано не селективностью индекса, а количеством записей, попадающим в диапазон between по одному и по второму полю


вот вам чуть измененных скрипт, в котором я просто "размазал" значение поля i, домножив его на 100, но не менял селективность ни одного из полей, и получил противоположный вашему результат


Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
if object_id('dbo.testindex2')  is not null
	drop table dbo.testindex2

CREATE TABLE dbo.testindex2(ID INT IDENTITY (0,5), i INT, a CHAR(1))
GO
DECLARE @l INT = 2010;
DECLARE @m INT = @l;
WHILE @m > 0
BEGIN
	INSERT INTO dbo.testindex2(i,a)
	SELECT TOP (@m) @l-@m * 100, 'a' FROM sys.messages
	SET @m -= 5;
END
GO
CREATE INDEX ix_testindex1 ON dbo.testindex2(id,i)
GO
CREATE INDEX ix_testindex2 ON dbo.testindex2(i,id)
GO
SET STATISTICS IO ON
GO
SELECT * FROM dbo.testindex2 WITH (INDEX = ix_testindex1)
WHERE i BETWEEN 1 AND 100000 AND id BETWEEN 1 AND 100000
OPTION (RECOMPILE)
GO
SELECT * FROM dbo.testindex2 WITH (INDEX = ix_testindex2)
WHERE i BETWEEN 1 AND 100000 AND id BETWEEN 1 AND 100000
OPTION (RECOMPILE)
GO
SET STATISTICS IO OFF




STATISTICS IOTable 'Worktable'. Scan count 0, logical reads 0, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.
Table 'testindex2'. Scan count 1, logical reads 58 , physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.

(0 rows affected)
Table 'Worktable'. Scan count 0, logical reads 0, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.
Table 'testindex2'. Scan count 1, logical reads 5 , physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.
...
Рейтинг: 0 / 0
25 сообщений из 63, страница 2 из 3
Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Перекрестные индексы. Как лучше?
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]