Вступление в партицирование / Microsoft SQL Server

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Вступление в партицирование

11 сообщений из 36, страница 2 из 2

все

Вступление в партицирование

#39783199

alexeyvg

Участник

Откуда: Moscow

Сообщения: 26 926

Рейтинг: 0 / 0

Yasha123Владислав Колосовfelix_ff,

у меня как раз ситуация с большим количеством ad hoc запросов и достаточно широкой таблицей, по которой все наборы индексов строить не оптимально. Разделение на секции дало многократный рост производительности, поскольку запросы обращаются к относительно небольшим интервалам временнЫх меток данных. Теперь мне интересно проверить - как изменится план и производительность, если я уберу секции и оставлю тот же кластерный индекс.
так если вам "помогло" секционирование, то ключ секционирования присутствовал во всех where. значит, дата есть во всех этих таблицах и кластерный по дате вам обеспечил бы ровно такой же выборочный просмотр диапазонаУгу, тут нужно не "оставлю тот же кластерный индекс", а "сделаю вместо партицирования такой кластерный индекс, который обеспечсит работу в той же области диска, как и партицирование".

Как в примере invm на самом деле показано не увеличение производительности при секционировании, наоборот, показано уменьшение производительности без секционирования, в случае, когда столбец не первый в индексе:invmНо в реальности увеличение производительности при секционировании вполне возможно. Например, когда столбец секционирования не первый в индексе.
Но зачем его делать не первым?

Если таблица секционируется по дате, дата, разумеется, всегда включена в запросы (иначе секционирование не будет работать), тогда достаточно вместо секционирования просто сделвать дату первым полем в кластерном индексе, и запросы с и без секционирования будут выполняться одинаково по скорости.

А то странное сравнение - давайте сравним запрос к секции, с запросом к таблице без индексов - ооо, секционирование рулит!!!

...

Рейтинг:

0 / 0

06.03.2019, 19:35

| Ответить | Цитировать | Написать

Вступление в партицирование

#39783210

Гавриленко Сергей Алексеевич

Участник

Откуда: Moscow

Сообщения: 37 171

Рейтинг: 0 / 0

alexeyvgЕсли таблица секционируется по дате, дата, разумеется, всегда включена в запросы (иначе секционирование не будет работать)Не должна. Секционирование работать будет, а вот partition elimination -- нет. Просто придется лазить во все партиции: при скане и так понятно, при поиске по индексу -- будет seek в каждую партицию.

...

Рейтинг:

0 / 0

06.03.2019, 19:56

| Ответить | Цитировать | Написать

Вступление в партицирование

#39783244

alexeyvg

Участник

Откуда: Moscow

Сообщения: 26 926

Рейтинг: 0 / 0

Гавриленко Сергей АлексеевичalexeyvgЕсли таблица секционируется по дате, дата, разумеется, всегда включена в запросы (иначе секционирование не будет работать)Не должна. Секционирование работать будет, а вот partition elimination -- нет. Просто придется лазить во все партиции: при скане и так понятно, при поиске по индексу -- будет seek в каждую партицию.Мы стравниваем затраты на доступ к данным в секционированной таблице, и в несекционированной. А не тонкости работы секционирования.
"секционирование не будет работать" - я имел в виду, что не будет выполняться исходная цель - с помощью секционирования уменьшить расходы на выполнение запроса.

То есть рассматриваем такую ситуацию:

В 2х таблицах есть поле [Год]

В первой таблице оно используется для разделения на секции
Во второй таблице оно включено в кластерный индекс первым полем.

В этих двух вариантах в запросах WHERE [Год] = nnn AND <другие условия> сервер будет читать данные из одной области диска, в первом случае, определённой секционированием, во втором случае диапазонм кластерного индекса.

Т.е. разницы в производительности такого запроса не будет.

...

Рейтинг:

0 / 0

06.03.2019, 21:36

| Ответить | Цитировать | Написать

Вступление в партицирование

#39783682

ShIgor

Участник

Откуда: Нижний Новгород

Сообщения: 2 585

Рейтинг: 1 / 0

invm,

хочу парировать на тему "секционирование - средство администрирования"
т.к. сам пользуюсь именно для ускорения обсчета кубов, а не для удобства управления.
но никогда тесты не проводил, а теперь вдруг захотелось.

имеем базу и 2 аналогичные таблицы на ~300млн строк,
одна (t1) с кластерным индексом по полю типа datetime (со временем), вторая (t2) секционирована по полю типа int в формате YYYYMM (т.е. месяц года) в каждой секции примерно 11млн записей

и на том же сервере, но на другом диске куб с тремя измерениями:
dates - с 09/2016 по 03/2019, ключ типа int в формате YYYYMMDD
clients - примерно 4млн записей, ключ типа bigint
sales_orders - ключ типа инт - тупая нумерация продаж в некоем разрезе, не больше 1000 записей
и 4 группы мер у которых:
1. из t1 в группу мер sales_1_1 c одной секцией
2. из t1 в группу мер sales_1_N c ежемесячными секциями по условию (пример) sale_date between '20181201' and '20181231 23:59:59'
3. из t2 в группу мер sales_N_1 c одной секцией
4. из t2 в группу мер sales_N_N c ежемесячными секциями по условию (пример) sale_month = 201812

в каждой, 2 меры, сумма по полю sales_fact и distinct_count по полю order_number (связь с измерением sales_order) что накладывает требование по дополнительной сортировке данных.

обработка измерений сделана заранее.
обработка групп мер - full process. причем, для каждого случая предварительно рестарт SQL и SSAS, и две последовательные обработки, на графиках, каждый раз вторая.

дальше графики, единственное пояснение для них всех - гафики начинаются с момента старта процессинга. до начала получения данных (розовый толстый) это как раз и есть работа SQL по сортировке (эту оптимизацию не делал нигде, никак).
(модераторов прошу простить за широкие графики и пустые места, которые можно было бы сократить, но сделано это только для удобства сравнения)
смотрим:

...

Рейтинг:

0 / 0

07.03.2019, 17:07

| Ответить | Цитировать | Написать

Вступление в партицирование

#39783683

ShIgor

Участник

Откуда: Нижний Новгород

Сообщения: 2 585

Рейтинг: 1 / 0

sales_1_1

...

Рейтинг:

0 / 0

07.03.2019, 17:08

| Ответить | Цитировать | Написать

Вступление в партицирование

#39783684

ShIgor

Участник

Откуда: Нижний Новгород

Сообщения: 2 585

Рейтинг: 1 / 0

sales_1_N

...

Рейтинг:

0 / 0

07.03.2019, 17:09

| Ответить | Цитировать | Написать

Вступление в партицирование

#39783685

ShIgor

Участник

Откуда: Нижний Новгород

Сообщения: 2 585

Рейтинг: 1 / 0

sales_N_1

...

Рейтинг:

0 / 0

07.03.2019, 17:09

| Ответить | Цитировать | Написать

Вступление в партицирование

#39783686

ShIgor

Участник

Откуда: Нижний Новгород

Сообщения: 2 585

Рейтинг: 1 / 0

sales_N_N

...

Рейтинг:

0 / 0

07.03.2019, 17:10

| Ответить | Цитировать | Написать

Вступление в партицирование

#39783687

ShIgor

Участник

Откуда: Нижний Новгород

Сообщения: 2 585

Рейтинг: 1 / 0

да, забыл, в настройках процессинга 20 соединений максимум, т.е. одновременно не более 20 секций

...

Рейтинг:

0 / 0

07.03.2019, 17:12

| Ответить | Цитировать | Написать

Вступление в партицирование

#39783695

Владислав Колосов

Участник

Сообщения: 9 447

Рейтинг: 0 / 0

Столбец секционирования действительно у меня не первый в индексе, мне он и не нужен первым. Например ID (уникальный) + DATE (секции). Я выбираю в этом случае одну строку поиском по ID или выбираю просмотр секции запросом диапазона дат или использую дополнительные фильтры. Для AdHoc запросов по нагруженной таблице это отличный вариант, т.к. избавляет меня от хранения и поддержания многочисленных индексов.

Я к тому, что утверждение "секционирование только для администрирования" не является истинным.

...

Рейтинг:

0 / 0

07.03.2019, 17:29

| Ответить | Цитировать | Написать

Вступление в партицирование

#39783700

Владислав Колосов

Участник

Сообщения: 9 447

Рейтинг: 0 / 0

Гипотетически. Мне требуется ежемесячно выполнять сложный расчет для накопленных данных в одной таблице. Я создаю 20 секций, создаю сиквенс, который разбрасывает данные по секциям.
У меня 100500 ядер и я запускаю в параллель 20 расчетов, каждый из которых съедает 4-6 ядер. Вот и профит от секционирования.
Если не ошибаюсь, сейчас придумали эскалацию до секции, так что удержаний таблицы не будет.

...

Рейтинг:

0 / 0

07.03.2019, 17:38

| Ответить | Цитировать | Написать

11 сообщений из 36, страница 2 из 2

все

Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Вступление в партицирование

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=46&startmsg=39783199&tid=1688161]:	0ms
get settings:	9ms
get forum list:	14ms
check forum access:	4ms
check topic access:	4ms
track hit:	190ms
get topic data:	10ms
get forum data:	2ms
get page messages:	48ms
get tp. blocked users:	1ms
others:	237ms

total:	519ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы