powered by simpleCommunicator - 2.0.60     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Вступление в партицирование
11 сообщений из 36, страница 2 из 2
Вступление в партицирование
    #39783199
Фотография alexeyvg
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Yasha123Владислав Колосовfelix_ff,

у меня как раз ситуация с большим количеством ad hoc запросов и достаточно широкой таблицей, по которой все наборы индексов строить не оптимально. Разделение на секции дало многократный рост производительности, поскольку запросы обращаются к относительно небольшим интервалам временнЫх меток данных. Теперь мне интересно проверить - как изменится план и производительность, если я уберу секции и оставлю тот же кластерный индекс.
так если вам "помогло" секционирование, то ключ секционирования присутствовал во всех where. значит, дата есть во всех этих таблицах и кластерный по дате вам обеспечил бы ровно такой же выборочный просмотр диапазонаУгу, тут нужно не "оставлю тот же кластерный индекс", а "сделаю вместо партицирования такой кластерный индекс, который обеспечсит работу в той же области диска, как и партицирование".

Как в примере invm на самом деле показано не увеличение производительности при секционировании, наоборот, показано уменьшение производительности без секционирования, в случае, когда столбец не первый в индексе:invmНо в реальности увеличение производительности при секционировании вполне возможно. Например, когда столбец секционирования не первый в индексе.
Но зачем его делать не первым?

Если таблица секционируется по дате, дата, разумеется, всегда включена в запросы (иначе секционирование не будет работать), тогда достаточно вместо секционирования просто сделвать дату первым полем в кластерном индексе, и запросы с и без секционирования будут выполняться одинаково по скорости.


А то странное сравнение - давайте сравним запрос к секции, с запросом к таблице без индексов - ооо, секционирование рулит!!!
...
Рейтинг: 0 / 0
Вступление в партицирование
    #39783210
Гавриленко Сергей Алексеевич
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
alexeyvgЕсли таблица секционируется по дате, дата, разумеется, всегда включена в запросы (иначе секционирование не будет работать)Не должна. Секционирование работать будет, а вот partition elimination -- нет. Просто придется лазить во все партиции: при скане и так понятно, при поиске по индексу -- будет seek в каждую партицию.
...
Рейтинг: 0 / 0
Вступление в партицирование
    #39783244
Фотография alexeyvg
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Гавриленко Сергей АлексеевичalexeyvgЕсли таблица секционируется по дате, дата, разумеется, всегда включена в запросы (иначе секционирование не будет работать)Не должна. Секционирование работать будет, а вот partition elimination -- нет. Просто придется лазить во все партиции: при скане и так понятно, при поиске по индексу -- будет seek в каждую партицию.Мы стравниваем затраты на доступ к данным в секционированной таблице, и в несекционированной. А не тонкости работы секционирования.
"секционирование не будет работать" - я имел в виду, что не будет выполняться исходная цель - с помощью секционирования уменьшить расходы на выполнение запроса.

То есть рассматриваем такую ситуацию:

В 2х таблицах есть поле [Год]

В первой таблице оно используется для разделения на секции
Во второй таблице оно включено в кластерный индекс первым полем.

В этих двух вариантах в запросах WHERE [Год] = nnn AND <другие условия> сервер будет читать данные из одной области диска, в первом случае, определённой секционированием, во втором случае диапазонм кластерного индекса.

Т.е. разницы в производительности такого запроса не будет.
...
Рейтинг: 0 / 0
Вступление в партицирование
    #39783682
ShIgor
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
invm,

хочу парировать на тему "секционирование - средство администрирования"
т.к. сам пользуюсь именно для ускорения обсчета кубов, а не для удобства управления.
но никогда тесты не проводил, а теперь вдруг захотелось.

имеем базу и 2 аналогичные таблицы на ~300млн строк,
одна (t1) с кластерным индексом по полю типа datetime (со временем), вторая (t2) секционирована по полю типа int в формате YYYYMM (т.е. месяц года) в каждой секции примерно 11млн записей

и на том же сервере, но на другом диске куб с тремя измерениями:
dates - с 09/2016 по 03/2019, ключ типа int в формате YYYYMMDD
clients - примерно 4млн записей, ключ типа bigint
sales_orders - ключ типа инт - тупая нумерация продаж в некоем разрезе, не больше 1000 записей
и 4 группы мер у которых:
1. из t1 в группу мер sales_1_1 c одной секцией
2. из t1 в группу мер sales_1_N c ежемесячными секциями по условию (пример) sale_date between '20181201' and '20181231 23:59:59'
3. из t2 в группу мер sales_N_1 c одной секцией
4. из t2 в группу мер sales_N_N c ежемесячными секциями по условию (пример) sale_month = 201812

в каждой, 2 меры, сумма по полю sales_fact и distinct_count по полю order_number (связь с измерением sales_order) что накладывает требование по дополнительной сортировке данных.

обработка измерений сделана заранее.
обработка групп мер - full process. причем, для каждого случая предварительно рестарт SQL и SSAS, и две последовательные обработки, на графиках, каждый раз вторая.

дальше графики, единственное пояснение для них всех - гафики начинаются с момента старта процессинга. до начала получения данных (розовый толстый) это как раз и есть работа SQL по сортировке (эту оптимизацию не делал нигде, никак).
(модераторов прошу простить за широкие графики и пустые места, которые можно было бы сократить, но сделано это только для удобства сравнения)
смотрим:
...
Рейтинг: 0 / 0
Вступление в партицирование
    #39783683
ShIgor
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
sales_1_1
...
Рейтинг: 0 / 0
Вступление в партицирование
    #39783684
ShIgor
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
sales_1_N
...
Рейтинг: 0 / 0
Вступление в партицирование
    #39783685
ShIgor
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
sales_N_1
...
Рейтинг: 0 / 0
Вступление в партицирование
    #39783686
ShIgor
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
sales_N_N
...
Рейтинг: 0 / 0
Вступление в партицирование
    #39783687
ShIgor
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
да, забыл, в настройках процессинга 20 соединений максимум, т.е. одновременно не более 20 секций
...
Рейтинг: 0 / 0
Вступление в партицирование
    #39783695
Владислав Колосов
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Столбец секционирования действительно у меня не первый в индексе, мне он и не нужен первым. Например ID (уникальный) + DATE (секции). Я выбираю в этом случае одну строку поиском по ID или выбираю просмотр секции запросом диапазона дат или использую дополнительные фильтры. Для AdHoc запросов по нагруженной таблице это отличный вариант, т.к. избавляет меня от хранения и поддержания многочисленных индексов.

Я к тому, что утверждение "секционирование только для администрирования" не является истинным.
...
Рейтинг: 0 / 0
Вступление в партицирование
    #39783700
Владислав Колосов
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Гипотетически. Мне требуется ежемесячно выполнять сложный расчет для накопленных данных в одной таблице. Я создаю 20 секций, создаю сиквенс, который разбрасывает данные по секциям.
У меня 100500 ядер и я запускаю в параллель 20 расчетов, каждый из которых съедает 4-6 ядер. Вот и профит от секционирования.
Если не ошибаюсь, сейчас придумали эскалацию до секции, так что удержаний таблицы не будет.
...
Рейтинг: 0 / 0
11 сообщений из 36, страница 2 из 2
Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Вступление в партицирование
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]