Вопрос относительно хранения данных при clustered index / Microsoft SQL Server

ReSQL.ru

2.0.61

Полная версия Контакт Правила FAQ Помощь

Гость

Войти | Профиль | Очистить

Нов. | Гор. | Избр.

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Действия ...

Доб. в избранное
Игнор. тему
Прикреп. тему
Пометить прочит. / непрочит.
Фильтр:
Сообщения автора темы
Сообщение содержит вложения
Сообщение содержит картинки
Сообщение содержит видеоклипы
Сообщение содержит аудиоклипы
Сообщение содержит картинки или видео 18+

Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Вопрос относительно хранения данных при clustered index / 7 сообщений из 7, страница 1 из 1

25.10.2001, 12:41

#32016010

Osya

Гость

Вопрос относительно хранения данных при clustered index

Во всех виденных мною местах (и в Book Online тоже) написано, что
"При наличии кластерного индекса, страницы в базе данных и строки внутри них размещаются в ключевой последовательности кластерного индекса. Все вставки выполняются по ключевому значению с сохранением последовательности ключей."
Я это трактую, как последовательное расположение данных таблицы в файле. Возникает вопрос. Я добавляю в таблицу n записей, согласно установленному кластерному индексу они должны находиться в начале таблицы. Сервер что, раздвигает остальные страницы с данными и запиивает новую страницу(цы) в середину? Если да, то как он справляется с такой нагрузкой -двигать сотни гигабайт? Если нет, то как на самом деле?
Приветствуются ссылки на документацию.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

25.10.2001, 13:18

#32016015

alexeyvg

Участник

Откуда: Moscow
Сообщения: 26 926
Рейтинг: 0 / 0

Вопрос относительно хранения данных при clustered index

Документация - BOL:
\SQL Server Architecture\Database Architecture\Physical Database Architecture\Table and Index Architecture\Clustered Indexes
Кратко - речь идёт о логических блоках (страницах). При вставке в начало записи вставляются в дырки, если их нет, добавляется страница, если нет - экстент.
Наверное, так.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

25.10.2001, 13:33

#32016017

Genady

Участник

Откуда: Москва
Сообщения: 1 724
Рейтинг: 0 / 0

Вопрос относительно хранения данных при clustered index

Сотни гигабайт не двигаются, сколько данных приходится перемещать зависит от заполненности страниц, см. в BOL - Clustered indexes -> fill factor

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

25.10.2001, 13:40

#32016018

Glory

Участник

Сообщения: 105 723
Рейтинг: 0 / 0

Вопрос относительно хранения данных при clustered index

>Если да, то как он справляется с такой нагрузкой - двигать сотни гигабайт

Не знаю как насчет сотен гигабайт и как там что двигается, но вот личные наблюдения.

База ~100 000 000 записей, ~30Gb
добавление 10 000 000 записей
- при наличии "непраильного" кластерного индекса - 6-7 часов(~100 000 записей должны попасть в середину таблиц)
- при наличии "правильного" кластерного индекса - 1-1.5 часов

Transaction log при наличии кластерного индекса то же растет до 8-10Gb.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

25.10.2001, 18:09

#32016038

Garya

Участник

Откуда: Москва
Сообщения: 33 630
Рейтинг: 156 / 1

Вопрос относительно хранения данных при clustered index

Данные в базе данных хранятся в виде B-дерева. Структура B-дерева как раз расчитана на то, чтобы при логической упорядоченности данных физические их передвижки свести к минимуму. В общем и целом наличие кластерного индекса приводит к дополнительным потерям на перемещение данных, однако их бОльшая часть происходит лишь в пределах одной страницы данных.
Наличие индексов вообще (и некластерных в том числе) замедляет выполнение команд Update и Insert, хотя ускоряет выполнение команды select (да и то не всегда). На то и голова программистам, чтобы думать...

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

26.10.2001, 04:41

#32016049

Osya

Гость

Вопрос относительно хранения данных при clustered index

Насчет сотен гигабайт это я конечно прогорячился, на 3 порядка.

Сотни мегабайт конечно же. И еще добавлю, что интересует mssql 6.5.
Вставка в "дырки" внутри страниц это понятно, а вот нет дырок - добавляем страницу. Где физически будет расположена эта страница?

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

26.10.2001, 05:54

#32016051

Barbar

Гость

Вопрос относительно хранения данных при clustered index

Если нет "дырок" то выполняется операция, назывемая page split, т.е. создается еще одна страница половина данных остается на старой, а вторая половина переносится на новую. В образовавшуюся "дырку" будут занесены данные. Если размер вставляемых данных больше полученной "дырки", то page split повторяется. Физически новая страница будет в другом месте, а логически в соответствии с clustered index. Получается фрагментация данных. Потому Microsoft рекомендует время от времени перестраивать clustered index'ы для дефрагментации. Более того при update, если размер новых данных не помещается в место используемое записью (например при использоании varchar), то в реальности происходит delete и insert с page split. Самый плохой случай, когда используется неуникальный Clustered Index. Clustered Index существенно замедляет скорость модификации данных.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=46&tablet=1&tid=1825190]:	0ms
get settings:	9ms
get forum list:	20ms
check forum access:	4ms
check topic access:	4ms
track hit:	41ms
get topic data:	9ms
get forum data:	2ms
get page messages:	38ms
get tp. blocked users:	1ms
others:	232ms

total:	360ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы