AlwaysOn, нода для чтения и ребилд индекса / Microsoft SQL Server

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / AlwaysOn, нода для чтения и ребилд индекса

11 сообщений из 36, страница 2 из 2

все

AlwaysOn, нода для чтения и ребилд индекса

#40009808

msLex

Участник

Сообщения: 8 523

Рейтинг: 0 / 0

0wl

1. Дерево индекса сбалансировано сразу после перестроения (ну или создания). А потом мы начинаем в это дерево вставлять данные и оказывается, что в какие-то промежутки вставляем чаще, чем в другие. Эти популярные промежутки начинают чаще делиться, создавать дополнительные ветки под собой - и баланс дерева нарушается. Именно это я имел в виду под "разбалансированным" деревом - и в этом случае мы получаем, что пусть к "листьям" по одной ветке оказывается длиннее, чем по другой, куда данные добавляют реже.

Еще раз, в SQL Server деревья индексов всегда сбалансированы, до любого листового элемента дерева индекса одинаковое количество уровней.

0wl

2. read-ahead в SSD, по идее, никак не пострадает. Листовая страница знает, номера страниц до и после нее. В случае HDD мы бы долго ждали, пока он доберётся до следующей страницы, а с SSD у нас никакой разницы нет

Ридахед упреждающе читает последующие страницы файла базы данных. Если в них лежат нужные данные, то они заранее окажутся в памяти. При логической фрагментации эффективность ридахед падает.

0wl

3. Про последний пример вообще не понял. Если на странице недостаточно места для вставки данных, она делится на 2 новые страницы, данные между ними делятся пополам. Единственный вариант, где я могу представить себе "1 строку на 1 странице" - это "хвостовая" страница, которую добавили в самом конце индекса. Ну и это, по идее, не надолго - со временем ей добавят соседей

Сделайте индекс по дате, навставляйте в него данных на несколько страниц, а потом всем кроме 1-й записи из самой первой станицы обновите дату на максимальную из тех, что есть в таблице. На первой странице останется ровно 1 запись.

Этот эффект хорошо наблюдается в индексах по last_something_date

...

Рейтинг:

0 / 0

19.10.2020, 13:01

| Ответить | Цитировать | Написать

AlwaysOn, нода для чтения и ребилд индекса

#40009838

Гавриленко Сергей Алексеевич

Участник

Откуда: Moscow

Сообщения: 37 171

Рейтинг: 0 / 0

0wlДерево индекса сбалансировано сразу после перестроения (ну или создания). А потом мы начинаем в это дерево вставлять данные и оказывается, что в какие-то промежутки вставляем чаще, чем в другие. Эти популярные промежутки начинают чаще делиться, создавать дополнительные ветки под собой - и баланс дерева нарушается. Именно это я имел в виду под "разбалансированным" деревом - и в этом случае мы получаем, что пусть к "листьям" по одной ветке оказывается длиннее, чем по другой, куда данные добавляют реже.Ровно наоборот. Split страницы создает 1 дполнительную страницу на том же уровне. Далее модифицируется страница предыдущего уровня, чтобы добавить ссылку на новую страницу. Если в ней нет места, она так же сплитится. И так далее. Если в итоге надо сплитить корневую страницу, то она так же разделяется на две, и добавлятся новая корневая страница. Поэтому дерево во-первых, растет не "вниз", а "вверх", а во-вторых, всегда остается сбалансированным, т.е. глубина дерева для любого ключа всегда одинакова.

...

Рейтинг:

0 / 0

19.10.2020, 14:05

| Ответить | Цитировать | Написать

AlwaysOn, нода для чтения и ребилд индекса

#40009953

SERG1257

Участник

Сообщения: 2 932

Рейтинг: 0 / 0

Александр и какой будет совет (рекомендации лучших sqlводов) :
1 Отключить джоб по ребилду индексов совсем. Делать перестройку примерно как шринк - когда необходимо
2 задрать avg_fragmentation_in_percent (которая считается для внешней фрагментации) с 5%-30% на 80-80
3 править джоб для использования avg_page_space_used_in_percent

...

Рейтинг:

0 / 0

19.10.2020, 18:08

| Ответить | Цитировать | Написать

AlwaysOn, нода для чтения и ребилд индекса

#40009972

Владислав Колосов

Участник

Сообщения: 9 447

Рейтинг: 0 / 0

0wl,

авторприведение индекса к сбалансированному состоянию

нет, не то, при перестроении индекса плотность его заполнения приводится к дефолтному значению. Т.е. если для вставки выгодно заранее выполнить расщепление страниц с заданной плотностью, то без перестроения не обойтись. Само дерево индексов всегда сбалансировано после выполнения операции, об этом заботится математика сервера.

Что касается перестроения в целях дефрагментации (очевидно, при настройке 100% заполнении страниц), то Александр утверждает, что это бессмысленная операция и даже вредная при условии использования SSD носителя. За исключением необходимости перестроения с целью скорейшего удаления фантомных записей.

...

Рейтинг:

0 / 0

19.10.2020, 18:39

| Ответить | Цитировать | Написать

AlwaysOn, нода для чтения и ребилд индекса

#40010022

Александр Гладченко

Участник

Сообщения: 8 776

Рейтинг: 0 / 0

SERG1257,

1.совсем
2 не следить
3. Удалить джоб

Мир изменился. Реагируете только на реальные проблемы и автоматизируйте это, если нужно. А если припрёт, вначале подумайте об REORGANISE

...

Рейтинг:

0 / 0

19.10.2020, 22:55

| Ответить | Цитировать | Написать

AlwaysOn, нода для чтения и ребилд индекса

#40010032

alexeyvg

Участник

Откуда: Moscow

Сообщения: 26 926

Рейтинг: 0 / 0

Александр Гладченко

Вообще совет "Реагируете только на реальные проблемы" был актуален и 10 лет назад, до SSD.
Если, грубо, очередь к диску не поднимается больше 1, то ответы на вопросы SERG1257 очевидны, они именно такие - "забить, ибо затраты будут выше профита". Независимо от используемой технологии долговременной памяти.

На мой взгляд, пока все твои исследования систем хранения всё так же актуальны, только с некоторыми количественными изменениями, в том числе с изменёнными выводами в части "когда надо начинать беспокоиться".
А сейчас ты даёшь оценочный анализ ("Т.е. последовательная запись превращается в случайную"), разве можно его сравнивать измерениями в повторяемых тестах?

...

Рейтинг:

0 / 0

20.10.2020, 00:38

| Ответить | Цитировать | Написать

AlwaysOn, нода для чтения и ребилд индекса

#40010151

Александр Гладченко

Участник

Сообщения: 8 776

Рейтинг: 0 / 0

alexeyvg,

...не только запись превращается в случайную, но и чтение. Кроме того, ситуация сильно зависит от реализации алгоритма рассеивания записи, многоие не дорогие диски в этом халтурят. Также, большое влияние могут оказывать разные кеши на пути ввода-вывода. За счёт того, что производительность операций у SSD на порядки выше, не только мы, но и разработчики дисков и контроллеров пренебрегают потерями на фргментации. Давно уже никого не смущает, что оерационка не дефрагментирует диск. Раньше это рекомендовали повсеместно. По аналогии и внешняя фрагментация. Не будет в реальности скана последовательно расположенных на диске страниц.
Алгоритмы размещения страниц в буферном пуле, их там удерживания и сброса на диск не такие тупые, как может показаться после продчтения высказываний апонентов. Каждому процессу выдаётся конечный и отнюдь не большой объём ресурсов. Если их нехватает, используется промежуточная материализация. В сухом остатке влияние незаполненных страниц и лишних страниц подхваченных упреждающим чтением будет сильно невелированно. Основные потери времени здесь и раньше и теперь были именно на физических операциях ввода-вывода, а они теперь на пару порядков быстрее.
Кстати, нормальная очередь к диску уже лет десять 250 ;)

...

Рейтинг:

0 / 0

20.10.2020, 13:58

| Ответить | Цитировать | Написать

AlwaysOn, нода для чтения и ребилд индекса

#40010171

Владислав Колосов

Участник

Сообщения: 9 447

Рейтинг: 0 / 0

Александр, если на виртуалке очередь кратковременно увеличивается до 5-10 тыс, это нормальное явление? При этом статистика по IO особенно не страдает. Или что-то где-то маскируется?

...

Рейтинг:

0 / 0

20.10.2020, 15:29

| Ответить | Цитировать | Написать

AlwaysOn, нода для чтения и ребилд индекса

#40010183

Александр Гладченко

Участник

Сообщения: 8 776

Рейтинг: 0 / 0

Владислав Колосов,

Простите, я не работаю с виртуалками.

...

Рейтинг:

0 / 0

20.10.2020, 15:56

| Ответить | Цитировать | Написать

AlwaysOn, нода для чтения и ребилд индекса

#40010364

alexeyvg

Участник

Откуда: Moscow

Сообщения: 26 926

Рейтинг: 0 / 0

Александр Гладченко

...не только запись превращается в случайную, но и чтение. Кроме того, ситуация сильно зависит от реализации алгоритма рассеивания записи, многоие не дорогие диски в этом халтурят.
...
По аналогии и внешняя фрагментация. Не будет в реальности скана последовательно расположенных на диске страниц.

Я же писал не про влияние фрагментации как таковой (я понимаю, что в микросхеме флешки нет "головок"), я писал про проблемы увеличение количества операций со стороны сиквела.
Не будет ли это влиять на производительность?

Вот, я смотрю на любой тест SSD, и вижу, что при чтении со случайным доступом небольшими блоками поток падает в 3-10 раз.
Почему?
Не из за головок, понятно, а из за того, что есть латентность операции, затраты времени на обращение к драйверу, латентность физического интерфейса и т.д.
Потому что код, который читает эту жалкую страницу, жалкие 8 кб, должен попасть в кэш процессора, вытеснив что нибудь, и только потом начать выполняться. А перед этим нужно переключить контекст, перезаписав TLB, переопределив области адресного пространства.
Вот отсюда и получаются эти 3-10 раз.

Упреждающее чтение, и филфактор тоже что то значат, об этом упоминали.

Вот это всё мне говорит, что хоть сейчас беспокоиться о каком то уходе за индексами нужно намного позже, чем раньше, всё таки вообще про это не думать (и этого не понимать) нельзя.

Александр Гладченко

Давно уже никого не смущает, что оерационка не дефрагментирует диск. Раньше это рекомендовали повсеместно

Это не из за SSD, это из за совершенствования операционок. Винды с NTFS эффективно хранят данные, и дефрагментация не так страшна, если иметь на диске некоторый свободный объём.
Ну и второй фактор - ненжужность, ибо "производительности достаточно".
Не потому, что дефрагментация не полезная вещь, а потому, что она невыгодна, не имеет смысл заморачиваться.

Как ты написал для БД:

Александр Гладченко

За счёт того, что производительность операций у SSD на порядки выше, не только мы, но и разработчики дисков и контроллеров пренебрегают потерями на фргментации.

Тут ты поёшь гимн "незаморачиванию" :-)
Не "бесполезна", не "вредна" большими красными буквами, а именно "производительность на порядки выше", то есть труд админов стоит дороже пары лишних SSD.

...

Рейтинг:

0 / 0

20.10.2020, 23:19

| Ответить | Цитировать | Написать

AlwaysOn, нода для чтения и ребилд индекса

#40010430

Александр Гладченко

Участник

Сообщения: 8 776

Рейтинг: 0 / 0

alexeyvg,

Влияния на производительность не замечал, мы уже давно от ребилда отказались и ничего, всё и так прекрасно работает. Обновление статистики делайте, где надо, этого в большинстве случаев достаточно. Если много удаляете и велико число расщиплений, вполне можно использовать REORGANISE, он лечит внутреннюю фрагментацию.
Зато уменьшение числа операций налицо, как раз засчёт отказа от дефрагментации, которая бъёт по всем чувствительым местам SQL Server. Но самая главная боль дефрагментации, это то, что она убивает SSD. И не так что бы они чуть меньше прослужили. Вы рассчитываете, что новый массив SSD у вас прослужит положенные 5 лет. А на практике, только из-за дефрагментации, срок сократиться до 2-х, а я своими глазами видел прецеденты, когда и года не служили. Причём, отказ дисков будет не такой "плавый", как у HDD, массив сломается весь сразу и менять его придётся целиком. Что бы этого избежать, вы сделаете AlwaysON кластер, а он не будет работать, потому что из-за очереди на REDO (а это самое узкое место этой технологии) реплика у вас не будет синхронизироваться, будет всё больше отставать. И виной этому будет (угадайте какая операция)?
Я не говорю сейчас о маленьких приложениях, речь о системах с нагрузкой. Понятно, что мизерная нагрузка не будет пораждать проблем.

alexeyvgВот, я смотрю на любой тест SSD, и вижу, что при чтении со случайным доступом небольшими блоками поток падает в 3-10 раз.
Почему?
Не из за головок, понятно, а из за того, что есть латентность операции, затраты времени на обращение к драйверу, латентность физического интерфейса и т.д.
Потому что код, который читает эту жалкую страницу, жалкие 8 кб, должен попасть в кэш процессора, вытеснив что нибудь, и только потом начать выполняться. А перед этим нужно переключить контекст, перезаписав TLB, переопределив области адресного пространства.
Вот отсюда и получаются эти 3-10 раз.

Маленький блок был проблемой всегда и не только при чтении. Мало того, операции REDO очень чувствительны к величине страйпа, для них оптимално 64Kb. На SSD рамер ячейки существенно большье. Понятно что это не будет эффективно. Но это влияние не зависит от фрагментации. Задержки, кстати, будут не плохими, они как раз растут при увеличении размера блока. Причём, эти самые 3-10 раз будут в разы быстрее, чем то же самое на дефрагментированных жёстких дисках.

alexeyvgЭто не из за SSD, это из за совершенствования операционок. Винды с NTFS эффективно хранят данные, и дефрагментация не так страшна, если иметь на диске некоторый свободный объём.
Ну и второй фактор - ненжужность, ибо "производительности достаточно".
Не потому, что дефрагментация не полезная вещь, а потому, что она невыгодна, не имеет смысл заморачиваться.

Операционка тут не при чём. Это проблема NTFS, а он не изменился. Дефрагменацию не делают по уверениям Майкрософт именно потому, что она убивает диск. Есть тонны частных утилит, которые не только дефрагментацию отключают, но и ещё много ненужных телодвижений операционки с файлами, типа прописывание коротких имён, изменение атрибут архивности, простановка последнего времени доступа и т.п. Это всё реально продлевает жизнь дискам.

...

Рейтинг:

0 / 0

21.10.2020, 11:23

| Ответить | Цитировать | Написать

11 сообщений из 36, страница 2 из 2

все

Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / AlwaysOn, нода для чтения и ребилд индекса

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=46&startmsg=40009808&tid=1685513]:	0ms
get settings:	4ms
get forum list:	9ms
check forum access:	2ms
check topic access:	2ms
track hit:	143ms
get topic data:	6ms
get forum data:	2ms
get page messages:	28ms
get tp. blocked users:	1ms
others:	203ms

total:	400ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы