Key lookup vs RID Lookup / Microsoft SQL Server

ReSQL.ru

2.0.61

Планшетная версия Контакт Правила FAQ Помощь

Гость

Войти | Профиль | Очистить

Нов. | Гор. | Избр.

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Действия ...

Доб. в избранное
Игнор. тему
Прикреп. тему
Пометить прочит. / непрочит.
Фильтр:
Сообщения автора темы
Сообщение содержит вложения
Сообщение содержит картинки
Сообщение содержит видеоклипы
Сообщение содержит аудиоклипы
Сообщение содержит картинки или видео 18+

Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Key lookup vs RID Lookup / 17 сообщений из 17, страница 1 из 1

14.05.2019, 16:44

#39813121

Cristiano_Rivaldo

Гость

Key lookup vs RID Lookup

Всем привет.
На текущем проекте абсолютно все таблицы - кластеризованные.
Меня, как бывшего ораклиста, мучает вопрос- почему никто не использует кучи или используют очень редко?
Оракловый аналог RID Lookup - это table access by index rowid и это там чуть ли не основной оператор для доступа к данным.
Решил замерить производительность оператора select на кучу и на кластеризованную таблицу:

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.

-- кластеризованная таблица
CREATE TABLE dbo.t_sample_clustered 
(
	[ID] INT IDENTITY(1,1) NOT NULL,
	A INT NOT NULL,
	B INT NOT NULL 
	CONSTRAINT [PK_t_sample_clustered] PRIMARY KEY CLUSTERED([ID] )
)

INSERT INTO dbo.t_sample_clustered  (a,b)
SELECT	TOP 1000000 
		ABS(CONVERT(INT, (CONVERT(BINARY(4), (NEWID()))))) % 1000 AS a,
		ABS(CONVERT(INT, (CONVERT(BINARY(4), (NEWID()))))) % 1000 AS b
FROM sysobjects A
CROSS JOIN sysobjects B
CREATE NONCLUSTERED INDEX [IDX_t_sample_clustered_a] ON dbo.t_sample_clustered (a)

UPDATE STATISTICS dbo.t_sample_clustered  WITH FULLSCAN

-- куча
CREATE TABLE dbo.t_sample 
(
	[ID] INT IDENTITY(1,1) NOT NULL,
	A INT NOT NULL,
	B INT NOT NULL 
	CONSTRAINT [PK_t_sample] PRIMARY KEY NONCLUSTERED([ID] )
)
-- заполнение
INSERT INTO dbo.t_sample  (a,b)
SELECT	A,B
FROM dbo.t_sample_clustered 
-- 
CREATE NONCLUSTERED INDEX [IDX_t_sample_a] ON dbo.t_sample (a)


UPDATE STATISTICS dbo.t_sample  WITH FULLSCAN

SELECT t.b
FROM dbo.t_sample_clustered t
WHERE t.a = 45

SELECT t.b
FROM dbo.t_sample t
WHERE t.a = 45

Результаты :
Для кластерной таблицы : Duration = 20,CPU Cost = 31, Reads = 3036
Для кучи : Duration = 8,CPU Cost = 0, Reads = 993

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

14.05.2019, 17:03

#39813127

Гавриленко Сергей Алексеевич

Участник

Откуда: Moscow
Сообщения: 37 171
Рейтинг: 0 / 0

Key lookup vs RID Lookup

А теперь сравните скорость выборки по полю id на вашей структуре.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

14.05.2019, 17:05

#39813128

Slava_Nik

Участник

Откуда: из России
Сообщения: 848
Рейтинг: 0 / 0

Key lookup vs RID Lookup

результаты ожидаемы, поэтому вставку делают обычно в кучи или стедж таблицы.
Для каких-то задач используются кучи, для каких-то кластеризованные таблицы.
Вы попробуйте пожить с вашей кучей, удалить, вставить данные, перестроить и объем хороший сделать.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

14.05.2019, 17:10

#39813133

Cristiano_Rivaldo

Гость

Key lookup vs RID Lookup

Гавриленко Сергей Алексеевич,

Для кластерной таблицы : Duration = 1,CPU Cost = 16, Reads = 3
Для кучи : Duration = 1,CPU Cost = 0, Reads = 4

Запросы по id ,в общем случае, редкое явление при условии что таблица не является справочником.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

14.05.2019, 17:12

#39813134

msLex

Участник

Сообщения: 8 523
Рейтинг: 0 / 0

Key lookup vs RID Lookup

Cristiano_Rivaldo

1. RID Lookup в MSSQL это доступ по физическому расположению (file_id + page_id + slot_id) записи в куче.
2. Вы сравниваете неэквивалентные случае, в первом у вас два индекса (один из них кластерный) и поиск можно осуществлять по любому из них. Сделайте и там и там по одному индексу и сравните.
3. При любых перемещении исходных данных в кластерном индексе не требуется обновлять некластерный.
4. В MSSQL у куч есть некоторое количество неприятных особенностей.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

14.05.2019, 17:23

#39813141

Cristiano_Rivaldo

Гость

Key lookup vs RID Lookup

msLex,

В обоих случаях по два индекса.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

14.05.2019, 17:23

#39813142

Гавриленко Сергей Алексеевич

Участник

Откуда: Moscow
Сообщения: 37 171
Рейтинг: 0 / 0

Key lookup vs RID Lookup

Cristiano_RivaldoГавриленко Сергей Алексеевич,

Для кластерной таблицы : Duration = 1,CPU Cost = 16, Reads = 3
Для кучи : Duration = 1,CPU Cost = 0, Reads = 4Т.е. ровно на 25% хуже в вашем случе. Для деревьев глубиной 5-6 будет 10-15% ухудшения. Весьма существенно.

Cristiano_RivaldoЗапросы по id ,в общем случае, редкое явление при условии что таблица не является справочником.Открою секрет -- кластерный индекс можно делать не только по полю id.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

14.05.2019, 17:24

#39813145

msLex

Участник

Сообщения: 8 523
Рейтинг: 0 / 0

Key lookup vs RID Lookup

Cristiano_RivaldomsLex,

В обоих случаях по два индекса.
да не заметил

тогда у вас в случае кучи оверхед на хранение.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

14.05.2019, 17:25

#39813146

Cristiano_Rivaldo

Гость

Key lookup vs RID Lookup

Гавриленко Сергей Алексеевич]Открою секрет -- кластерный индекс можно делать не только по полю id.
Я в курсе :)

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

14.05.2019, 18:01

#39813160

TaPaK

Участник

Откуда: Kiev
Сообщения: 6 809
Рейтинг: 0 / 0

Key lookup vs RID Lookup

авторМеня, как бывшего ораклиста, мучает вопрос- почему никто не использует кучи или используют очень редко?
если все задачи с бд сводятся к выбору a = 45, то и ms sql и скорее всего oracle проиграют наверное большиству nosql dbms

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

14.05.2019, 21:00

#39813219

Mind

Участник

Откуда: Лучший город на Земле
Сообщения: 2 317
Рейтинг: 0 / 0

Key lookup vs RID Lookup

Гавриленко Сергей АлексеевичCristiano_RivaldoГавриленко Сергей Алексеевич,

Для кластерной таблицы : Duration = 1,CPU Cost = 16, Reads = 3
Для кучи : Duration = 1,CPU Cost = 0, Reads = 4Т.е. ровно на 25% хуже в вашем случе. Для деревьев глубиной 5-6 будет 10-15% ухудшения. Весьма существенно.При поиске по некластерному индексу, куча будет работать быстрее на те же несколько чтений, так что я бы не сказал что у кластерного индекса прям существенное преимущество. Обсуждалось это уже много-много раз.
Основная проблема с кучей это её обслуживание. Не знаю как в Оракле, а в SQL Server все плохо.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

14.05.2019, 21:12

#39813222

alexeyvg

Участник

Откуда: Moscow
Сообщения: 26 926
Рейтинг: 0 / 0

Key lookup vs RID Lookup

Cristiano_RivaldoЗапросы по id ,в общем случае, редкое явление при условии что таблица не является справочникомЗапросы по RID ещё более редкое явление, даже если таблица является справочником.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

14.05.2019, 21:18

#39813226

invm

Участник

Откуда: Москва
Сообщения: 9 956
Рейтинг: 0 / 0

Key lookup vs RID Lookup

Cristiano_Rivaldo,

https://www.red-gate.com/simple-talk/sql/t-sql-programming/delete-operation-sql-server-heaps/

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

16.05.2019, 17:14

#39814192

-- KAB --

Участник

Откуда: Москва
Сообщения: 20
Рейтинг: 0 / 0

Key lookup vs RID Lookup

MindГавриленко Сергей Алексеевичпропущено...
Т.е. ровно на 25% хуже в вашем случе. Для деревьев глубиной 5-6 будет 10-15% ухудшения. Весьма существенно.При поиске по некластерному индексу, куча будет работать быстрее на те же несколько чтений, так что я бы не сказал что у кластерного индекса прям существенное преимущество. Обсуждалось это уже много-много раз.
Основная проблема с кучей это её обслуживание. Не знаю как в Оракле, а в SQL Server все плохо.

Не всегда, в куче возможен Forwarding Pointers

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

16.05.2019, 22:55

#39814322

Mind

Участник

Откуда: Лучший город на Земле
Сообщения: 2 317
Рейтинг: 0 / 0

Key lookup vs RID Lookup

-- KAB --Mindпропущено...
При поиске по некластерному индексу, куча будет работать быстрее на те же несколько чтений, так что я бы не сказал что у кластерного индекса прям существенное преимущество. Обсуждалось это уже много-много раз.
Основная проблема с кучей это её обслуживание. Не знаю как в Оракле, а в SQL Server все плохо.

Не всегда, в куче возможен Forwarding Pointers+1 чтение, а индекс это как минимум 3-4 уровня.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

17.05.2019, 14:20

#39814613

-- KAB --

Участник

Откуда: Москва
Сообщения: 20
Рейтинг: 0 / 0

Key lookup vs RID Lookup

Mind-- KAB --пропущено...

Не всегда, в куче возможен Forwarding Pointers+1 чтение, а индекс это как минимум 3-4 уровня.

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.

--drop table #tn, #tc
create table #tn (id int identity primary key nonclustered, name varchar(900))
create table #tc (id int identity primary key clustered, name varchar(900))

;with cte as (
    select 1 i union all
    select i+1 from cte
)
insert #tn
    output inserted.name into #tc
    select top(20000) 'a'
    from cte option(maxrecursion 0)

set statistics io on
select max(name) from #tn
select max(name) from #tc
set statistics io off

update #tn set name = 'ab'
update #tc set name = 'ab'

update #tn set name = 'abc'
update #tc set name = 'abc'

update #tn set name = 'abcd'
update #tc set name = 'abcd'

set statistics io on
select max(name) from #tn
select max(name) from #tc
set statistics io off

Посмотрите результат скрипта на вкладке messages в SSMS - статистика ввода вывода таблица tn - nonclustered и tc - clustered

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

17.05.2019, 19:16

#39814782

Mind

Участник

Откуда: Лучший город на Земле
Сообщения: 2 317
Рейтинг: 0 / 0

Key lookup vs RID Lookup

-- KAB --Посмотрите результат скрипта на вкладке messages в SSMS - статистика ввода вывода таблица tn - nonclustered и tc - clusteredДа, согласен. Этого момента я не учел.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Key lookup vs RID Lookup / 17 сообщений из 17, страница 1 из 1

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=46&mobile=1&tid=1687825]:	0ms
get settings:	9ms
get forum list:	16ms
check forum access:	3ms
check topic access:	3ms
track hit:	158ms
get topic data:	9ms
get forum data:	2ms
get page messages:	49ms
get tp. blocked users:	1ms
others:	217ms

total:	467ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы