Вопрос на собеседовании / Microsoft SQL Server

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Вопрос на собеседовании

25 сообщений из 122, страница 1 из 5

все

Вопрос на собеседовании

#38467449

SandalTree

Участник

Откуда: Перехлёсток восьми батог

Сообщения: 28 388

Рейтинг: 0 / 0

Чем отличается PRIMARY KEY от UNIQUE CONSTRAINT?

...

Рейтинг:

0 / 0

16.11.2013, 20:15

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467450

iap

Участник

Откуда: Москва

Сообщения: 47 364

Рейтинг: 0 / 0

PRIMARY KEY не допускает NULL в своих полях,
а UNIQUE - допускает.

...

Рейтинг:

0 / 0

16.11.2013, 20:18

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467461

Exproment

Участник

Сообщения: 379

Рейтинг: 0 / 0

iap, ну не только :) Концептуально это различные вещи - primary key есть первичный ключ, а unique constrain просто ограничение. primary key для sql server является уникальным идентификатором записи. Если нет primary key на таблице, сервер не может не может знать, какое поле на таблице идентифицирует запись.

*конечно на логическом, а не физическом уровнях. Вспомним про применение change trcking, который требует обязательного наличия primary key.

...

Рейтинг:

0 / 0

16.11.2013, 20:42

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467528

SandalTree

Участник

Откуда: Перехлёсток восьми батог

Сообщения: 28 388

Рейтинг: 0 / 0

Expromentiap, ну не только :) Концептуально это различные вещи - primary key есть первичный ключ, а unique constrain просто ограничение. primary key для sql server является уникальным идентификатором записи. Если нет primary key на таблице, сервер не может не может знать, какое поле на таблице идентифицирует запись.

*конечно на логическом, а не физическом уровнях. Вспомним про применение change trcking, который требует обязательного наличия primary key.А если у нас есть кластерный индекс, но нет primary key то сервер тоже не может уникально идентифицировать запись?

...

Рейтинг:

0 / 0

16.11.2013, 23:46

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467531

Exproment

Участник

Сообщения: 379

Рейтинг: 0 / 0

SandalTree, мне себя цитировать ?
Exproment *конечно на логическом, а не физическом уровнях.
на физическом уровне database engine всегда может однозначно идентифицировать записать. Не зависимо от наличия кластеризованного индекса и независимо от каких либо ограничений уникальности(всегда есть RID). А вот на логическом - вы совершенно правы. О чем и говорит пример с change tracking.

...

Рейтинг:

0 / 0

16.11.2013, 23:55

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467533

SandalTree

Участник

Откуда: Перехлёсток восьми батог

Сообщения: 28 388

Рейтинг: 0 / 0

ExpromentSandalTree, мне себя цитировать ?
Exproment *конечно на логическом, а не физическом уровнях.
на физическом уровне database engine всегда может однозначно идентифицировать записать. Не зависимо от наличия кластеризованного индекса и независимо от каких либо ограничений уникальности( всегда есть RID ). А вот на логическом - вы совершенно правы. О чем и говорит пример с change tracking.

1. Не всегда. RID создаётся только на неуникальном кластерном индексе и только в случае повторяющихся значений.

2. У меня вопрос непро уникальный кластерный индекс, а про Primary Key, который с ним различается.

...

Рейтинг:

0 / 0

17.11.2013, 00:04

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467544

Exproment

Участник

Сообщения: 379

Рейтинг: 0 / 0

SandalTree,

1) Не придерайтесь к письму. :) Я дико сожалею что не написал "всегда есть возможность прописать RID у database engine"
2) Про кластерный индекс и физику говорить начали вы.

А свой вариант ответа на ваш вопрос я уже привел :) На мой взгляд различаются они чисто концептуально и сравнивать их нельзя.

...

Рейтинг:

0 / 0

17.11.2013, 00:25

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467560

SomewhereSomehow

Участник

Откуда: Moscow

Сообщения: 2 471

Рейтинг: 0 / 0

SandalTree1. Не всегда. RID создаётся только на неуникальном кластерном индексе и только в случае повторяющихся значений.

2. У меня вопрос непро уникальный кластерный индекс, а про Primary Key, который с ним различается.

Всегда.
Storage Engine (SE) всегда может однозначно идентифицировать запись.

А вопрос, имхо, сильно зависит... от спрашивающего.

Если такой вопрос вас спрашивает знающий человек - возможно он хочет чтобы вы порассуждали на тему, чтобы в дальнейшем углубиться по спирали - такой метод использует известный в сообществе человек Thomas LaRock или Grant Fritchy . Это годный способ. Человек начинает отвечать на этот воппрос, например, что-то про индексы которые обеспечивают констрейнты, задается вопрос по индексам и далее по индукции/дедукции - раскручивают, это дает понимание собеседующему.

Если такой вопрос спрашивает "выскочка" - который нашел в справке определение того и другого и ждет от вас что вы обнаружите энциклопедические знания документации, и по пунктам перечислите отличия - то, имхо, можно смело разворачиваться и уходить. Лично я бы, вежливо, так и сделал - т.к. это указание на способы оценки специалистов не отражающие реальную ценность специалиста, как ее вижу я. А значит работать в таком коллективе я не смогу в любом случае, даже если выучу весь синтаксис XQuery =)

Как понять, кто перед тобой, если ты заранее не знаешь? Это можно сделать по реакции на свой ответ.
Если видно:
- высокомерие граничащее с тыканьем в грязь (обусловленное только тем, что собеседующий 10 минут назад прочитал раздел справки по которому тебя спрашивает, а-ля "в какой последовательности передаются параметры в функцию datediff")
- отсутствие наводящих и уточняющих вопросов с целью понять какой ты специалист
- ощущение что больше не тебя хотят спросить, а показать свою крутость
и прочие схожие мысли.

В целом, имхо, вопрос сродни "чем отличается болт от шурупа" - вроде примерно похожи, но есть разница.
Ответ может лежать как в семантической (смысловой) области, так и в физической. Если это вопрос не для того чтобы завязать диалог, а "анкетный" вопрос - то он откровенно глупый, по крайней мере в такой формулировке. Т.к. "анкетный" вопрос все-таки, должен понимать "анкетный" ответ в той же плоскости. Например, можно было бы спросить "Для чего используется PK, а для чего UQ" - смысловой. Или "Как сервер реализует PK и как UQ" - физика.

Это вам задали на собеседовании или вы сами такие вопросы спрашиваете?

...

Рейтинг:

0 / 0

17.11.2013, 01:08

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467601

SandalTree

Участник

Откуда: Перехлёсток восьми батог

Сообщения: 28 388

Рейтинг: 0 / 0

SomewhereSomehowЭто вам задали на собеседовании или вы сами такие вопросы спрашиваете?

Не спрашивали и сам не спрашиваю.

Просто думаю. Мне показалось что они очень похожи и знание различий может показать уровень специалиста.
Поэтому думаю что это неплохой вопрос для интрервью.

И я полностью согласен с вами. Иногда задают такие вопросы.... сразу понимаешь что ты слишком крут для этой позиции.
Думаю может подкрутить крутизну в обратную сторону.

...

Рейтинг:

0 / 0

17.11.2013, 03:50

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467603

SandalTree

Участник

Откуда: Перехлёсток восьми батог

Сообщения: 28 388

Рейтинг: 0 / 0

ExpromentSandalTree,

1) Не придерайтесь к письму. :) Я дико сожалею что не написал "всегда есть возможность прописать RID у database engine"
2) Про кластерный индекс и физику говорить начали вы.

А свой вариант ответа на ваш вопрос я уже привел :) На мой взгляд различаются они чисто концептуально и сравнивать их нельзя.
Как понять кластерный индекс не зная "физики"?
Вы заговорили про RID, а я сказал что он вовсе не обязателен.

Код: sql

1.
2.
3.
4.

CREATE TABLE A(F1 Char(1) );
GO
INSERT INTO A(F1) VALUES ('A'), ('A')
GO

В этом примере RIDa нет и SE никак не сможет отличить одну запись от другой.

Код: sql

1.
2.
3.
4.
5.
6.

CREATE TABLE B(F1 Char(1) );
GO
CREATE CLUSTERED INDEX CLIX_B ON B(F1)
GO
INSERT INTO B(F1) VALUES ('A'), ('B')
GO

В этом примере RIDa тоже нет!

Код: sql

1.
2.
3.
4.

CREATE CLUSTERED INDEX CLIX_A ON A(F1)
GO
UPDATE  B SET F1 = 'A'  WHERE F1 = 'B'
GO

А вот тут RID ы появляются в обеих таблицах.

...

Рейтинг:

0 / 0

17.11.2013, 04:19

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467604

SandalTree

Участник

Откуда: Перехлёсток восьми батог

Сообщения: 28 388

Рейтинг: 0 / 0

Кстати, ещё не все отличия перечислены.

Как миниму знаю вижу ещё два.

...

Рейтинг:

0 / 0

17.11.2013, 04:20

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467616

Ruuu

Участник

Откуда: Иркутск

Сообщения: 4 270

Рейтинг: 0 / 0

SandalTree1. Не всегда. RID создаётся только на неуникальном кластерном индексе и только в случае повторяющихся значений.Откуда сделан такой вывод?
В документации ведь написано:
http://technet.microsoft.com/en-us/library/hh213609.aspx When a table is stored as a heap, individual rows are identified by reference to a row identifier (RID) consisting of the file number, data page number, and slot on the page.Вы наверное путаете RID и uniqueifier.
http://msdn.microsoft.com/en-us/library/ms177484.aspx If the clustered index is not a unique index, SQL Server makes any duplicate keys unique by adding an internally generated value called a uniqueifier. This four-byte value is not visible to users. It is only added when required to make the clustered key unique for use in nonclustered indexes.

...

Рейтинг:

0 / 0

17.11.2013, 07:51

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467635

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

SandalTreeExpromentSandalTree, мне себя цитировать ?
пропущено...

на физическом уровне database engine всегда может однозначно идентифицировать записать. Не зависимо от наличия кластеризованного индекса и независимо от каких либо ограничений уникальности( всегда есть RID ). А вот на логическом - вы совершенно правы. О чем и говорит пример с change tracking.

1. Не всегда. RID создаётся только на неуникальном кластерном индексе и только в случае повторяющихся значений.

2. У меня вопрос непро уникальный кластерный индекс, а про Primary Key, который с ним различается.

Нет, RID есть всегда, он просто не всегда используется.

...

Рейтинг:

0 / 0

17.11.2013, 09:52

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467711

SomewhereSomehow

Участник

Откуда: Moscow

Сообщения: 2 471

Рейтинг: 0 / 0

Storage Engine всегда может однозначно идентифицировать запись, даже если таблица куча и все значения в ней одинаковые или неуникальный кластерный индекс и все ключи одинаковые. "Только люди видят дубликаты" (c) Paul Randal выше на скриншоте. Я думаю достаточно авторитетный источник =)

Что касается механизма поддержки уникальности. Есть понятие - закладка. Закладка - это логический указатель на строку. Физически закладка может реализовываться по-разному.

Например:
Таблица-куча - FileID:PageID:SlotID (то, что общепринято называть RID)

Таблица-кластеризованная RowStore - Clustered Index Key : [Uniqueifier] (унификатор, добавляется если кластерный индекс не уникален)

Таблица-кластеризованная ColumnStore - RowgroupID:TypleID (для кластерных колоночных индексов в 2014, идентификатор группы строк + порядковый номер строки, нигде не хранится - вычисляется)

Таблица-кластеризованная ColumnStore часть Delta Store - CSILOCATOR (для кластерных колоночных индексов в 2014, для внутренней структуры Delta Store , которая поддерживает изменения добавляется псевдо колонка CSILOCATOR суррогатный ключ, по сути просто порядковый номер)

Закладки нужны серверу для того, чтобы поддерживать изменения. Даже если никаких других индексов нет, простое написание запроса delete from t, происходит следующим образом.

Создать БД

Код: sql

1.
2.
3.
4.
5.

--Create DB
create database bmtest;
go
use bmtest;
go

Куча

Куча

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.

--Heap
CREATE TABLE A(F1 Char(1) );
GO
INSERT INTO A(F1) VALUES ('A'), ('B');
GO
select *, sys.fn_PhysLocFormatter(%%physloc%%) as PhysicalLocationFormatted , %%physloc%% as PhysicalLocation from A;
go
set showplan_xml on;
go
delete from a;
go
set showplan_xml off;
go

-- Ckeck leaf level nonclustered index
create nonclustered index ix_f1 on a(f1);
go
select *, sys.fn_PhysLocFormatter(%%physloc%%) as PhysicalLocation from A with(index(ix_f1));
go
dbcc page('bmtest',1,94,3) with tableresults;

Любой запрос на изменение имеет две части, так называемые read cursor и write cursor. В части read cursor сервер определяет, какие строки нужно изменить, для этих строк он собирает закладки, эти закладки после передаются в часть write cursor. Которая выполняет изменения на основных данных и дополнительных (если есть другие индексы которые затрагивает модификация).

Обратите внимание в плане на вывод псевдо колонки Bmk1000. Это как раз и есть закладка.
В данном случае, таблица куча, а потому закладка это просто физическое расположение строки.

Можно создать не кластерный индекс и посмотреть, что лежит на его листовых страницах, в качестве закладки (вторая часть скрипта, подставьте свои номера страниц если будете пробовать сами).

Видно, что используется HEAP RID key, который совпадает с физическим положением строки в кластерном индексе (предыдущий рисунок).

Неуникальный кластерный индекс
Тот же набор экспериментов для неуникального кластерного индекса.

Неуникальный кластерный индекс

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.

 --Clustered Index
CREATE CLUSTERED INDEX CLIX_B ON A(F1);
go
set showplan_xml on;
go
delete from a;
go
set showplan_xml off;
go

-- Ckeck leaf level nonclustered index
select *, sys.fn_PhysLocFormatter(%%physloc%%) as PhysicalLocation from A with(index(ix_f1));
go
dbcc page('bmtest',1,121,3) with tableresults;

Обратите внимание, теперь, в качестве закладки в write cursor передается ключ кластерного индекса + унификатор (т.к. мы сделали неуникальный кластреный индекс). Второй интересный момент, поскольку на предыдущем шаге мы создали некластреный индекс, то для поиска строк оптимизатор решил использовать его, и значение закладки взял именно из некластерного индекса.

Можно посмотреть, что хранится на листовом уровне некластерного индекса теперь:

Видно, что теперь нет RID-а, но добавился унификатор, причем, что интересно, поскольку значения A,B у нас фактически разные, унификатор один и тот же.

Уникальный кластерный индекс

Уникальный кластерный индекс

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.

--Unique Clustered Index
CREATE UNIQUE CLUSTERED INDEX CLIX_B ON A(F1) WITH (DROP_EXISTING = ON);
go
set showplan_xml on;
go
delete from a;
go
set showplan_xml off;
go

-- Ckeck leaf level nonclustered index
select *, sys.fn_PhysLocFormatter(%%physloc%%) as PhysicalLocation from A with(index(ix_f1));
go
dbcc page('bmtest',1,144,3) with tableresults;

Теперь, поскольку индекс уникальный, в качестве закладки, используется просто ключ кластерного индекса:

Для колоночных индексов уже не буду расписывать, в докладе есть на видео, кому интересно могут посмотреть.
Таким образом, с помощью закладок, сервер всегда точно знает, с какой именно строкой он работает.

Удалим БД

Код: sql

1.
2.
3.
4.
5.

-- Drop DB
use master;
go
drop database bmtest;
go

...

Рейтинг:

0 / 0

17.11.2013, 13:33

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467752

Glory

Участник

Сообщения: 105 723

Рейтинг: 0 / 0

PK - всегда один единственный
UQ - может быть сколько угодно

...

Рейтинг:

0 / 0

17.11.2013, 15:01

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467753

iap

Участник

Откуда: Москва

Сообщения: 47 364

Рейтинг: 0 / 0

GloryPK - всегда один единственныйНе всегда. Его вообще может не быть. Увы.

...

Рейтинг:

0 / 0

17.11.2013, 15:03

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467754

Glory

Участник

Сообщения: 105 723

Рейтинг: 0 / 0

iapGloryPK - всегда один единственныйНе всегда. Его вообще может не быть. Увы.
В смысле ? Вы можете создать больше одного ПК ?

...

Рейтинг:

0 / 0

17.11.2013, 15:05

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467755

iap

Участник

Откуда: Москва

Сообщения: 47 364

Рейтинг: 0 / 0

Gloryiapпропущено...
Не всегда. Его вообще может не быть. Увы.
В смысле ? Вы можете создать больше одного ПК ?Могу вообще не создавать.
И не будет "одного-единственного"...

...

Рейтинг:

0 / 0

17.11.2013, 15:07

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467758

Glory

Участник

Сообщения: 105 723

Рейтинг: 0 / 0

iapGloryпропущено...

В смысле ? Вы можете создать больше одного ПК ?Могу вообще не создавать.
И не будет "одного-единственного"...
Словосочетание "один единственный" означает, что создать его можно в единственном экземпляре.
В отличии от уникальных.

...

Рейтинг:

0 / 0

17.11.2013, 15:10

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467763

iap

Участник

Откуда: Москва

Сообщения: 47 364

Рейтинг: 0 / 0

В общем, я предполагал, что точнее сказать
"можно создать не более одного PK и сколько угодно UQ".
Ничего, кроме этого.

...

Рейтинг:

0 / 0

17.11.2013, 15:14

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467884

SandalTree

Участник

Откуда: Перехлёсток восьми батог

Сообщения: 28 388

Рейтинг: 0 / 0

RuuuSandalTree1. Не всегда. RID создаётся только на неуникальном кластерном индексе и только в случае повторяющихся значений.Откуда сделан такой вывод?
В документации ведь написано:
http://technet.microsoft.com/en-us/library/hh213609.aspx When a table is stored as a heap, individual rows are identified by reference to a row identifier (RID) consisting of the file number, data page number, and slot on the page.Вы наверное путаете RID и uniqueifier.
http://msdn.microsoft.com/en-us/library/ms177484.aspx If the clustered index is not a unique index, SQL Server makes any duplicate keys unique by adding an internally generated value called a uniqueifier. This four-byte value is not visible to users. It is only added when required to make the clustered key unique for use in nonclustered indexes.Вы правы. Я их попутал.

В любом случае RID это как домашний адрес, он нигде не хранится, а по нему вас найти можно, но если ты его не знаешь...

Спасибо за поправку.

...

Рейтинг:

0 / 0

17.11.2013, 19:08

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467900

SandalTree

Участник

Откуда: Перехлёсток восьми батог

Сообщения: 28 388

Рейтинг: 0 / 0

SomewhereSomehowМожно создать не кластерный индекс и посмотреть, что лежит на его листовых страницах, в качестве закладки (вторая часть скрипта, подставьте свои номера страниц если будете пробовать сами).

Видно, что используется HEAP RID key, который совпадает с физическим положением строки в кластерном индексе (предыдущий рисунок).

HEAP RID key используется индексом, но в реальности-то он не хранится.
Нету его на странице данных.

...

Рейтинг:

0 / 0

17.11.2013, 19:47

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467902

SandalTree

Участник

Откуда: Перехлёсток восьми батог

Сообщения: 28 388

Рейтинг: 0 / 0

iapGloryPK - всегда один единственныйНе всегда. Его вообще может не быть. Увы.Полагаю Гаря хотел сказать так:
авторUQ - может быть сколько угодно
PK - может быть только один
Вот уже три отличия нашли.
Добавлю от себя четвёртое:
авторПри создании PK по дефолту создаётся кластерный индекс, а при создании UQ нет.Всего 4 отличия. Кто-то знает/видит ещё?

...

Рейтинг:

0 / 0

17.11.2013, 19:51

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467903

SandalTree

Участник

Откуда: Перехлёсток восьми батог

Сообщения: 28 388

Рейтинг: 0 / 0

iapВ общем, я предполагал, что точнее сказать
"можно создать не более одного PK и сколько угодно UQ".
Ничего, кроме этого.Все правильно поняли

...

Рейтинг:

0 / 0

17.11.2013, 19:52

| Ответить | Цитировать | Написать

Вопрос на собеседовании

#38467912

Сон Веры Павловны

Участник

Сообщения: 6 318

Рейтинг: 0 / 0

SandalTreeДобавлю от себя четвёртое:
авторПри создании PK по дефолту создаётся кластерный индекс, а при создании UQ нет.
Только если ранее не был объявлен/создан другой кластерный индекс:

Код: sql

1.
2.
3.
4.
5.
6.
7.

use tempdb
go
create table dbo.T (
  n int unique clustered,
  k int primary key
)
select type_desc from sys.indexes where object_id=OBJECT_ID(N'dbo.T') and is_primary_key=1

Код: plaintext

1.
2.
3.

type_desc
-------------------
NONCLUSTERED

...

Рейтинг:

0 / 0

17.11.2013, 20:10

| Ответить | Цитировать | Написать

25 сообщений из 122, страница 1 из 5

все

Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Вопрос на собеседовании

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=46&msg=38467903&tid=1704299]:	0ms
get settings:	10ms
get forum list:	13ms
check forum access:	3ms
check topic access:	3ms
track hit:	131ms
get topic data:	11ms
get forum data:	3ms
get page messages:	56ms
get tp. blocked users:	1ms
others:	239ms

total:	470ms