Key lookup vs RID Lookup / Microsoft SQL Server

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Key lookup vs RID Lookup

17 сообщений из 17, страница 1 из 1

Key lookup vs RID Lookup

#39813121

Cristiano_Rivaldo

Гость

Всем привет.
На текущем проекте абсолютно все таблицы - кластеризованные.
Меня, как бывшего ораклиста, мучает вопрос- почему никто не использует кучи или используют очень редко?
Оракловый аналог RID Lookup - это table access by index rowid и это там чуть ли не основной оператор для доступа к данным.
Решил замерить производительность оператора select на кучу и на кластеризованную таблицу:

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.

-- кластеризованная таблица
CREATE TABLE dbo.t_sample_clustered 
(
	[ID] INT IDENTITY(1,1) NOT NULL,
	A INT NOT NULL,
	B INT NOT NULL 
	CONSTRAINT [PK_t_sample_clustered] PRIMARY KEY CLUSTERED([ID] )
)

INSERT INTO dbo.t_sample_clustered  (a,b)
SELECT	TOP 1000000 
		ABS(CONVERT(INT, (CONVERT(BINARY(4), (NEWID()))))) % 1000 AS a,
		ABS(CONVERT(INT, (CONVERT(BINARY(4), (NEWID()))))) % 1000 AS b
FROM sysobjects A
CROSS JOIN sysobjects B
CREATE NONCLUSTERED INDEX [IDX_t_sample_clustered_a] ON dbo.t_sample_clustered (a)

UPDATE STATISTICS dbo.t_sample_clustered  WITH FULLSCAN

-- куча
CREATE TABLE dbo.t_sample 
(
	[ID] INT IDENTITY(1,1) NOT NULL,
	A INT NOT NULL,
	B INT NOT NULL 
	CONSTRAINT [PK_t_sample] PRIMARY KEY NONCLUSTERED([ID] )
)
-- заполнение
INSERT INTO dbo.t_sample  (a,b)
SELECT	A,B
FROM dbo.t_sample_clustered 
-- 
CREATE NONCLUSTERED INDEX [IDX_t_sample_a] ON dbo.t_sample (a)


UPDATE STATISTICS dbo.t_sample  WITH FULLSCAN

SELECT t.b
FROM dbo.t_sample_clustered t
WHERE t.a = 45

SELECT t.b
FROM dbo.t_sample t
WHERE t.a = 45

Результаты :
Для кластерной таблицы : Duration = 20,CPU Cost = 31, Reads = 3036
Для кучи : Duration = 8,CPU Cost = 0, Reads = 993

...

Рейтинг:

0 / 0

14.05.2019, 16:44

| Ответить | Цитировать | Написать

Key lookup vs RID Lookup

#39813127

Гавриленко Сергей Алексеевич

Участник

Откуда: Moscow

Сообщения: 37 171

Рейтинг: 0 / 0

А теперь сравните скорость выборки по полю id на вашей структуре.

...

Рейтинг:

0 / 0

14.05.2019, 17:03

| Ответить | Цитировать | Написать

Key lookup vs RID Lookup

#39813128

Slava_Nik

Участник

Откуда: из России

Сообщения: 848

Рейтинг: 0 / 0

результаты ожидаемы, поэтому вставку делают обычно в кучи или стедж таблицы.
Для каких-то задач используются кучи, для каких-то кластеризованные таблицы.
Вы попробуйте пожить с вашей кучей, удалить, вставить данные, перестроить и объем хороший сделать.

...

Рейтинг:

0 / 0

14.05.2019, 17:05

| Ответить | Цитировать | Написать

Key lookup vs RID Lookup

#39813133

Cristiano_Rivaldo

Гость

Гавриленко Сергей Алексеевич,

Для кластерной таблицы : Duration = 1,CPU Cost = 16, Reads = 3
Для кучи : Duration = 1,CPU Cost = 0, Reads = 4

Запросы по id ,в общем случае, редкое явление при условии что таблица не является справочником.

...

Рейтинг:

0 / 0

14.05.2019, 17:10

| Ответить | Цитировать | Написать

Key lookup vs RID Lookup

#39813134

msLex

Участник

Сообщения: 8 523

Рейтинг: 0 / 0

Cristiano_Rivaldo

1. RID Lookup в MSSQL это доступ по физическому расположению (file_id + page_id + slot_id) записи в куче.
2. Вы сравниваете неэквивалентные случае, в первом у вас два индекса (один из них кластерный) и поиск можно осуществлять по любому из них. Сделайте и там и там по одному индексу и сравните.
3. При любых перемещении исходных данных в кластерном индексе не требуется обновлять некластерный.
4. В MSSQL у куч есть некоторое количество неприятных особенностей.

...

Рейтинг:

0 / 0

14.05.2019, 17:12

| Ответить | Цитировать | Написать

Key lookup vs RID Lookup

#39813141

Cristiano_Rivaldo

Гость

msLex,

В обоих случаях по два индекса.

...

Рейтинг:

0 / 0

14.05.2019, 17:23

| Ответить | Цитировать | Написать

Key lookup vs RID Lookup

#39813142

Гавриленко Сергей Алексеевич

Участник

Откуда: Moscow

Сообщения: 37 171

Рейтинг: 0 / 0

Cristiano_RivaldoГавриленко Сергей Алексеевич,

Для кластерной таблицы : Duration = 1,CPU Cost = 16, Reads = 3
Для кучи : Duration = 1,CPU Cost = 0, Reads = 4Т.е. ровно на 25% хуже в вашем случе. Для деревьев глубиной 5-6 будет 10-15% ухудшения. Весьма существенно.

Cristiano_RivaldoЗапросы по id ,в общем случае, редкое явление при условии что таблица не является справочником.Открою секрет -- кластерный индекс можно делать не только по полю id.

...

Рейтинг:

0 / 0

14.05.2019, 17:23

| Ответить | Цитировать | Написать

Key lookup vs RID Lookup

#39813145

msLex

Участник

Сообщения: 8 523

Рейтинг: 0 / 0

Cristiano_RivaldomsLex,

В обоих случаях по два индекса.
да не заметил

тогда у вас в случае кучи оверхед на хранение.

...

Рейтинг:

0 / 0

14.05.2019, 17:24

| Ответить | Цитировать | Написать

Key lookup vs RID Lookup

#39813146

Cristiano_Rivaldo

Гость

Гавриленко Сергей Алексеевич]Открою секрет -- кластерный индекс можно делать не только по полю id.
Я в курсе :)

...

Рейтинг:

0 / 0

14.05.2019, 17:25

| Ответить | Цитировать | Написать

Key lookup vs RID Lookup

#39813160

TaPaK

Участник

Откуда: Kiev

Сообщения: 6 809

Рейтинг: 0 / 0

авторМеня, как бывшего ораклиста, мучает вопрос- почему никто не использует кучи или используют очень редко?
если все задачи с бд сводятся к выбору a = 45, то и ms sql и скорее всего oracle проиграют наверное большиству nosql dbms

...

Рейтинг:

0 / 0

14.05.2019, 18:01

| Ответить | Цитировать | Написать

Key lookup vs RID Lookup

#39813219

Mind

Участник

Откуда: Лучший город на Земле

Сообщения: 2 317

Рейтинг: 0 / 0

Гавриленко Сергей АлексеевичCristiano_RivaldoГавриленко Сергей Алексеевич,

Для кластерной таблицы : Duration = 1,CPU Cost = 16, Reads = 3
Для кучи : Duration = 1,CPU Cost = 0, Reads = 4Т.е. ровно на 25% хуже в вашем случе. Для деревьев глубиной 5-6 будет 10-15% ухудшения. Весьма существенно.При поиске по некластерному индексу, куча будет работать быстрее на те же несколько чтений, так что я бы не сказал что у кластерного индекса прям существенное преимущество. Обсуждалось это уже много-много раз.
Основная проблема с кучей это её обслуживание. Не знаю как в Оракле, а в SQL Server все плохо.

...

Рейтинг:

0 / 0

14.05.2019, 21:00

| Ответить | Цитировать | Написать

Key lookup vs RID Lookup

#39813222

alexeyvg

Участник

Откуда: Moscow

Сообщения: 26 926

Рейтинг: 0 / 0

Cristiano_RivaldoЗапросы по id ,в общем случае, редкое явление при условии что таблица не является справочникомЗапросы по RID ещё более редкое явление, даже если таблица является справочником.

...

Рейтинг:

0 / 0

14.05.2019, 21:12

| Ответить | Цитировать | Написать

Key lookup vs RID Lookup

#39813226

invm

Участник

Откуда: Москва

Сообщения: 9 956

Рейтинг: 0 / 0

Cristiano_Rivaldo,

https://www.red-gate.com/simple-talk/sql/t-sql-programming/delete-operation-sql-server-heaps/

...

Рейтинг:

0 / 0

14.05.2019, 21:18

| Ответить | Цитировать | Написать

Key lookup vs RID Lookup

#39814192

-- KAB --

Участник

Откуда: Москва

Сообщения: 20

Рейтинг: 0 / 0

MindГавриленко Сергей Алексеевичпропущено...
Т.е. ровно на 25% хуже в вашем случе. Для деревьев глубиной 5-6 будет 10-15% ухудшения. Весьма существенно.При поиске по некластерному индексу, куча будет работать быстрее на те же несколько чтений, так что я бы не сказал что у кластерного индекса прям существенное преимущество. Обсуждалось это уже много-много раз.
Основная проблема с кучей это её обслуживание. Не знаю как в Оракле, а в SQL Server все плохо.

Не всегда, в куче возможен Forwarding Pointers

...

Рейтинг:

0 / 0

16.05.2019, 17:14

| Ответить | Цитировать | Написать

Key lookup vs RID Lookup

#39814322

Mind

Участник

Откуда: Лучший город на Земле

Сообщения: 2 317

Рейтинг: 0 / 0

-- KAB --Mindпропущено...
При поиске по некластерному индексу, куча будет работать быстрее на те же несколько чтений, так что я бы не сказал что у кластерного индекса прям существенное преимущество. Обсуждалось это уже много-много раз.
Основная проблема с кучей это её обслуживание. Не знаю как в Оракле, а в SQL Server все плохо.

Не всегда, в куче возможен Forwarding Pointers+1 чтение, а индекс это как минимум 3-4 уровня.

...

Рейтинг:

0 / 0

16.05.2019, 22:55

| Ответить | Цитировать | Написать

Key lookup vs RID Lookup

#39814613

-- KAB --

Участник

Откуда: Москва

Сообщения: 20

Рейтинг: 0 / 0

Mind-- KAB --пропущено...

Не всегда, в куче возможен Forwarding Pointers+1 чтение, а индекс это как минимум 3-4 уровня.

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.

--drop table #tn, #tc
create table #tn (id int identity primary key nonclustered, name varchar(900))
create table #tc (id int identity primary key clustered, name varchar(900))

;with cte as (
    select 1 i union all
    select i+1 from cte
)
insert #tn
    output inserted.name into #tc
    select top(20000) 'a'
    from cte option(maxrecursion 0)

set statistics io on
select max(name) from #tn
select max(name) from #tc
set statistics io off

update #tn set name = 'ab'
update #tc set name = 'ab'

update #tn set name = 'abc'
update #tc set name = 'abc'

update #tn set name = 'abcd'
update #tc set name = 'abcd'

set statistics io on
select max(name) from #tn
select max(name) from #tc
set statistics io off

Посмотрите результат скрипта на вкладке messages в SSMS - статистика ввода вывода таблица tn - nonclustered и tc - clustered

...

Рейтинг:

0 / 0

17.05.2019, 14:20

| Ответить | Цитировать | Написать

Key lookup vs RID Lookup

#39814782

Mind

Участник

Откуда: Лучший город на Земле

Сообщения: 2 317

Рейтинг: 0 / 0

-- KAB --Посмотрите результат скрипта на вкладке messages в SSMS - статистика ввода вывода таблица tn - nonclustered и tc - clusteredДа, согласен. Этого момента я не учел.

...

Рейтинг:

0 / 0

17.05.2019, 19:16

| Ответить | Цитировать | Написать

17 сообщений из 17, страница 1 из 1

Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Key lookup vs RID Lookup

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=46&tid=1687825]:	0ms
get settings:	9ms
get forum list:	16ms
check forum access:	3ms
check topic access:	3ms
track hit:	178ms
get topic data:	9ms
get forum data:	2ms
get page messages:	50ms
get tp. blocked users:	1ms
others:	258ms

total:	529ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы