Помогите ускорить выборки из последовательного списка / Microsoft SQL Server

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Помогите ускорить выборки из последовательного списка

23 сообщений из 23, страница 1 из 1

Помогите ускорить выборки из последовательного списка

#39617358

uaggster

Гость

Коллеги приветствую!
Помогите советом.

Имеется большая таблица (до миллиарда записей не дотягивает, но плюс-минус поллаптя где то так), которая содержит последовательности записей в разрезе неких ID:
ID, N (по порядку), Дата, + доп. критерии.

Типичной является задача: Найти строки с максимальной N в разрезе ID, соответствующие определенным критериям.
Например:

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.

CREATE TABLE #t (
	GRP INT
	,ID BIGINT
	,N INT
	,DTA DATE
	,isAсtive BIT
	,isInvalid BIT
	,isOverlapped BIT
	)

insert into #t Values 
(1, 1, 1, '20180101', 0, 0, 1),
(1, 1, 2, '20180102', 0, 1, 1),
(1, 1, 3, '20180103', 0, 0, 1),
(1, 1, 4, '20180110', 1, 0, 0),
(1, 2, 1, '20180101', 0, 0, 1),
(1, 2, 2, '20180102', 1, 1, 1),
(1, 2, 3, '20180102', 0, 0, 1),
(1, 3, 1, '20180105', 1, 0, 0),
(2, 2, 1, '20180101', 0, 0, 1),
(2, 2, 2, '20180102', 0, 1, 1),
(2, 2, 3, '20180102', 0, 0, 1),
(2, 3, 4, '20180103', 1, 0, 0)


Select top (1) with ties *
from #t
Where DTA between '20180101' and '20180103' and isAсtive = 1
Order by ROW_NUMBER() over (partition by GRP, ID order by N DESC) ASC

Как это можно ускорить? Какие индексы имеет смысл построить? Какая конструкция запроса будет оптимальна в таком случае (тот, который показан - иллюстрация, какие выборки обычно требуются).
Типичное количество partition by GRP, ID ~ 10-100 записей, общее количество записей, как я сказал - сильно за 100 миллионов.
Таблица секционирована по GRP, но секций не много, в пределах сотни.
Имеется возможность строить любые индексы, в т.ч. колоночные. Можно строить индексы под конкретные запросы (т.к. обновление производится в отсоединенных секциях, большое количество индексов не влияет на скорость обновления, из таблицы только читают).
Как тут можно ускориться?
Концептуально, т.с.

...

Рейтинг:

0 / 0

20.03.2018, 11:34:23

| Ответить | Цитировать | Написать

Помогите ускорить выборки из последовательного списка

#39617422

aleksrov

Участник

Сообщения: 733

Рейтинг: 0 / 0

uaggster,
Вы же должны понимать, что при запросе isAсtive = 1 SQL не будет использовать никакой индекс, если у вас 100 лямов записей и грубо говоря 50 это isActive = 0 и 50 isActive = 1, SQL в любом случае будет делать скан, более того вы выбираете * (пропишите нормально столбцы, не звездочкой), т.е. если вым нужны все столбы покрывающий индекс вы тоже не сделаете.
Если бы у вас таблица была широкая, а нужно было вам всего несколько столбцов можно было создать индекс для них, один фиг это был бы скан, но гораздо меньшего кол-ва страниц, у нас к примеру таких индексов много.
У вас единственное место где можно немного оптимизировать это order by, но это оптимизация будет настолько ничтожной по сравнению со сканом всей таблицы, что разницы вы не заметите.

...

Рейтинг:

0 / 0

20.03.2018, 12:43:23

| Ответить | Цитировать | Написать

Помогите ускорить выборки из последовательного списка

#39617444

uaggster

Гость

aleksrovuaggster,
Вы же должны понимать, что при запросе isAсtive = 1 SQL не будет использовать никакой индекс, если у вас 100 лямов записей и грубо говоря 50 это isActive = 0 и 50 isActive = 1, SQL в любом случае будет делать скан, более того вы выбираете * (пропишите нормально столбцы, не звездочкой), т.е. если вым нужны все столбы покрывающий индекс вы тоже не сделаете.
Если бы у вас таблица была широкая, а нужно было вам всего несколько столбцов можно было создать индекс для них, один фиг это был бы скан, но гораздо меньшего кол-ва страниц, у нас к примеру таких индексов много.
У вас единственное место где можно немного оптимизировать это order by, но это оптимизация будет настолько ничтожной по сравнению со сканом всей таблицы, что разницы вы не заметите.
Таблица, на самом деле - широкая, сотни три полей.
И битовых критериев - больше трёх (с десяток - точно).
Теоретически, комбинация нескольких критериев дает довольно большую селективность, но всё равно в такой выборке, в типичном случае, вылазит в пределах миллиона записей.
Выборки используются потом для построения каких-то агрегатов, т.е. это такое окно, что-ли.
Проблема в том, что комбинаций этих критериев, в общем, чертова куча используется.
Но, опять же, теоретически, я готов проанализировать, какие комбинации использовать, и построить что-то типа (DTA, isAсtive, isInvalid, isOverlapped, ...), ну, хотя бы некоторые запросы. Но неужели это единственный вариант?
(и будет ли толк вообще).

...

Рейтинг:

0 / 0

20.03.2018, 12:55:06

| Ответить | Цитировать | Написать

Помогите ускорить выборки из последовательного списка

#39617449

aleks222

Участник

Сообщения: 2 564

Рейтинг: 0 / 0

Код: sql

1.
2.
3.

create index A1 on #t (DTA)  where  isAсtive = 1;

create index A0 on #t (DTA)  where  isAсtive = 0;

...

Рейтинг:

0 / 0

20.03.2018, 12:57:56

| Ответить | Цитировать | Написать

Помогите ускорить выборки из последовательного списка

#39617452

TaPaK

Участник

Откуда: Kiev

Сообщения: 6 809

Рейтинг: 0 / 0

uaggster,

у вас секциоирование по какому-то полю, а выборка совсем по другим, на выхде обход всех секций, и допустим фильтрованый индекс на DTA isAсtive = 1 c INCLUDE нужных вам полей, летать эта штука всё равно не будет

...

Рейтинг:

0 / 0

20.03.2018, 12:59:34

| Ответить | Цитировать | Написать

Помогите ускорить выборки из последовательного списка

#39617457

aleks222

Участник

Сообщения: 2 564

Рейтинг: 0 / 0

uaggsteraleksrovuaggster,
Вы же должны понимать, что при запросе isAсtive = 1 SQL не будет использовать никакой индекс, если у вас 100 лямов записей и грубо говоря 50 это isActive = 0 и 50 isActive = 1, SQL в любом случае будет делать скан, более того вы выбираете * (пропишите нормально столбцы, не звездочкой), т.е. если вым нужны все столбы покрывающий индекс вы тоже не сделаете.
Если бы у вас таблица была широкая, а нужно было вам всего несколько столбцов можно было создать индекс для них, один фиг это был бы скан, но гораздо меньшего кол-ва страниц, у нас к примеру таких индексов много.
У вас единственное место где можно немного оптимизировать это order by, но это оптимизация будет настолько ничтожной по сравнению со сканом всей таблицы, что разницы вы не заметите.
Таблица, на самом деле - широкая, сотни три полей.
И битовых критериев - больше трёх (с десяток - точно).
Теоретически, комбинация нескольких критериев дает довольно большую селективность, но всё равно в такой выборке, в типичном случае, вылазит в пределах миллиона записей.
Выборки используются потом для построения каких-то агрегатов, т.е. это такое окно, что-ли.
Проблема в том, что комбинаций этих критериев, в общем, чертова куча используется.
Но, опять же, теоретически, я готов проанализировать, какие комбинации использовать, и построить что-то типа (DTA, isAсtive, isInvalid, isOverlapped, ...), ну, хотя бы некоторые запросы. Но неужели это единственный вариант?
(и будет ли толк вообще).

1. Можно вычисляемое поле забабахать и фсе биты туды сложить.
2. Теоретически сервер умеет делать index intersection. Т.е. два фильтрованных индекса на каждое битовое поле имеют право на существование.

...

Рейтинг:

0 / 0

20.03.2018, 13:01:26

| Ответить | Цитировать | Написать

Помогите ускорить выборки из последовательного списка

#39617468

aleksrov

Участник

Сообщения: 733

Рейтинг: 0 / 0

aleks222,

По сути нужно будет создвть с десяток фильтрованных индексов с include как я понимаю всей таблицы, как было сказано это все ровно не взлетит, да и по месту, по сути копия таблицы будет, хотя читать 1\10 таблицы конечно быстрее будет.

...

Рейтинг:

0 / 0

20.03.2018, 13:07:04

| Ответить | Цитировать | Написать

Помогите ускорить выборки из последовательного списка

#39617518

ScareCrow

Участник

Откуда: Белый город

Сообщения: 16 205

Рейтинг: 0 / 0

авторВы же должны понимать, что при запросе isAсtive = 1 SQL не будет использовать никакой индекс
wat?

...

Рейтинг:

0 / 0

20.03.2018, 13:59:03

| Ответить | Цитировать | Написать

Помогите ускорить выборки из последовательного списка

#39617520

ScareCrow

Участник

Откуда: Белый город

Сообщения: 16 205

Рейтинг: 0 / 0

авторWhere DTA between '20180101' and '20180103' and isAсtive = 1
очевидно индекс по DTA. Возможно фильтрованный индекс по DTA и isAсtive = 1

...

Рейтинг:

0 / 0

20.03.2018, 14:00:27

| Ответить | Цитировать | Написать

Помогите ускорить выборки из последовательного списка

#39617522

uaggster

Гость

TaPaKuaggster,

у вас секциоирование по какому-то полю, а выборка совсем по другим, на выхде обход всех секций, и допустим фильтрованый индекс на DTA isAсtive = 1 c INCLUDE нужных вам полей, летать эта штука всё равно не будет
Да секционирование, тут, в общем, не причем. Табличка порезана на секции по числу подразделений = числу кусков из которых она состыковывается.
Это витрина.
Так для загрузки удобнее.

...

Рейтинг:

0 / 0

20.03.2018, 14:01:13

| Ответить | Цитировать | Написать

Помогите ускорить выборки из последовательного списка

#39617528

TaPaK

Участник

Откуда: Kiev

Сообщения: 6 809

Рейтинг: 0 / 0

uaggsterTaPaKuaggster,

у вас секциоирование по какому-то полю, а выборка совсем по другим, на выхде обход всех секций, и допустим фильтрованый индекс на DTA isAсtive = 1 c INCLUDE нужных вам полей, летать эта штука всё равно не будет
Да секционирование, тут, в общем, не причем. Табличка порезана на секции по числу подразделений = числу кусков из которых она состыковывается.
Это витрина.
Так для загрузки удобнее.
как это не при чём? посмотрите в план вам понравится

...

Рейтинг:

0 / 0

20.03.2018, 14:03:09

| Ответить | Цитировать | Написать

Помогите ускорить выборки из последовательного списка

#39617535

AlanDenton

Гость

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.

CREATE INDEX ix ON #t (GRP, ID, N DESC)
    --INCLUDE ()
    WHERE isAсtive = 1

SELECT *
FROM (
    SELECT *, rn = ROW_NUMBER() OVER (PARTITION BY GRP, ID ORDER BY N DESC)
    FROM #t
    WHERE DTA BETWEEN '20180101' AND '20180103'
        AND isAсtive = 1
) t
WHERE t.rn = 1

Отказ от TIES убирает лишнюю сортировку. Покрывающий индекс создаете под свои нужны.

...

Рейтинг:

0 / 0

20.03.2018, 14:07:45

| Ответить | Цитировать | Написать

Помогите ускорить выборки из последовательного списка

#39617547

AlanDenton

Гость

Раз уж у вас данные секционированные, то есть вариант использовать predicate pushdown:

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.

CREATE INDEX ix1 ON #t (DTA)
    INCLUDE (GRP)
    WHERE isAсtive = 1

CREATE INDEX ix2 ON #t (GRP, ID, N DESC)
    INCLUDE (DTA)
    WHERE isAсtive = 1

DECLARE @GRP_Start INT
      , @GRP_End INT

SELECT @GRP_Start = MIN(GRP)
     , @GRP_End = MAX(GRP)
FROM #t WITH(INDEX(ix1))
WHERE DTA BETWEEN '20180101' AND '20180103'
    AND isAсtive = 1

SELECT GRP, ID, N, DTA
FROM (
    SELECT GRP, ID, N, DTA, rn = ROW_NUMBER() OVER (PARTITION BY GRP, ID ORDER BY N DESC)
    FROM #t WITH(INDEX(ix2))
    WHERE DTA BETWEEN '20180101' AND '20180103'
        AND isAсtive = 1
        AND GRP BETWEEN @GRP_Start AND @GRP_End
) t
WHERE t.rn = 1
OPTION(RECOMPILE)

это как вариант. Если данных очень много, то, возможно, секционированный колумнстор. Либо добавить фильтрованный некластерный колумнсторный индекс, чтобы батч режим мог применяться (от SQL Server 2016)

...

Рейтинг:

0 / 0

20.03.2018, 14:18:37

| Ответить | Цитировать | Написать

Помогите ускорить выборки из последовательного списка

#39617588

.Евгений

Участник

Сообщения: 385

Рейтинг: 0 / 0

uaggster
Вам нужна транзакционность? Писатель один или много?
Если нет, то не уйти ли вам от RDBMS (по крайней мере, в части хранения и фильтрации)?

...

Рейтинг:

0 / 0

20.03.2018, 15:02:07

| Ответить | Цитировать | Написать

Помогите ускорить выборки из последовательного списка

#39617593

TaPaK

Участник

Откуда: Kiev

Сообщения: 6 809

Рейтинг: 0 / 0

.Евгенийuaggster
Вам нужна транзакционность? Писатель один или много?
Если нет, то не уйти ли вам от RDBMS (по крайней мере, в части хранения и фильтрации)?
какой-то набор слов не относящйся к ТС никак

...

Рейтинг:

0 / 0

20.03.2018, 15:04:36

| Ответить | Цитировать | Написать

Помогите ускорить выборки из последовательного списка

#39617628

.Евгений

Участник

Сообщения: 385

Рейтинг: 0 / 0

TaPaK.Евгенийпропущено...

Вам нужна транзакционность? Писатель один или много?
Если нет, то не уйти ли вам от RDBMS (по крайней мере, в части хранения и фильтрации)?
какой-то набор слов не относящйся к ТС никак
Создается DLL с Dictionary и двумя функциями CLR (запись нового элемента и поиск по фильтру). Вам все равно непонятно, как это относится к ТС?

...

Рейтинг:

0 / 0

20.03.2018, 15:33:58

| Ответить | Цитировать | Написать

Помогите ускорить выборки из последовательного списка

#39617631

aleks222

Участник

Сообщения: 2 564

Рейтинг: 0 / 0

aleksrovaleks222,

По сути нужно будет создвть с десяток фильтрованных индексов с include как я понимаю всей таблицы, как было сказано это все ровно не взлетит, да и по месту, по сути копия таблицы будет, хотя читать 1\10 таблицы конечно быстрее будет.

Include, в данном случае, НЕ НУЖНО.
После Index Intersection будет Lookup кластерного.

...

Рейтинг:

0 / 0

20.03.2018, 15:36:08

| Ответить | Цитировать | Написать

Помогите ускорить выборки из последовательного списка

#39617633

TaPaK

Участник

Откуда: Kiev

Сообщения: 6 809

Рейтинг: 0 / 0

.ЕвгенийTaPaKпропущено...

какой-то набор слов не относящйся к ТС никак
Создается DLL с Dictionary и двумя функциями CLR (запись нового элемента и поиск по фильтру). Вам все равно непонятно, как это относится к ТС?
это даже не смешно, хотя нет - смешно

...

Рейтинг:

0 / 0

20.03.2018, 15:38:31

| Ответить | Цитировать | Написать

Помогите ускорить выборки из последовательного списка

#39617750

Владислав Колосов

Участник

Сообщения: 9 447

Рейтинг: 0 / 0

uaggster,

авторКак тут можно ускориться?

Считайте агрегаты заранее, больше никак. Так кубы работают.

...

Рейтинг:

0 / 0

20.03.2018, 18:25:59

| Ответить | Цитировать | Написать

Помогите ускорить выборки из последовательного списка

#39617850

uaggster

Гость

Владислав Колосовuaggster,

авторКак тут можно ускориться?

Считайте агрегаты заранее, больше никак. Так кубы работают.
К сожалению, не получится.
Это витрина данных, которая оперативно обновляется. Некоторые куски - несколько раз в час, некоторые - несколько раз в сутки. Заливка ведется в отсоединенные секции, сама таблица доступна непрерывно, но только на чтение.
Сервер 2016 sp1, к сожалению - стандарт, хотя, в принципе, начиная с sp1 - всё нужное есть.
Сейчас на таблица представляет из себя rowstore, на котором куча выровненных по секциям некластерных индексов, и один секционированный же некластерный колумнстор.
Проблемой является то, что по таблице считают не только (и не столько) агрегаты, а чаще ищут конкретные записи (фильтруют).
Куб, как я понимаю, так оперативно пересчитывать не получится.

...

Рейтинг:

0 / 0

20.03.2018, 21:34:03

| Ответить | Цитировать | Написать

Помогите ускорить выборки из последовательного списка

#39617853

alexeyvg

Участник

Откуда: Moscow

Сообщения: 26 926

Рейтинг: 0 / 0

uaggsterКак это можно ускорить? Какие индексы имеет смысл построить? Какая конструкция запроса будет оптимальна в таком случае (тот, который показан - иллюстрация, какие выборки обычно требуются).А фильтр по датам показан типичный? То есть фильтр по датам достаточно селективный, может, просто кластерного индекса по датам будет достаточно?
И, может, обновляются данные инкрементно по датам? А то, если концептуально, может, секционировать лучше по датам, в том числе рассмотреть вариант с присоединением секций?

...

Рейтинг:

0 / 0

20.03.2018, 21:54:36

| Ответить | Цитировать | Написать

Помогите ускорить выборки из последовательного списка

#39618072

Владислав Колосов

Участник

Сообщения: 9 447

Рейтинг: 0 / 0

uaggster,

авторЭто витрина данных, которая оперативно обновляется
Почему не получится? У всех получается, а у Вас - нет :) Для перерасчета агрегатов используется Change Tracking. Куб именно так и перерасчитывается по расписанию. Там всё не перезаливается каждый раз.

А фильтры разве выбирают миллионы записей? Фильтры имеют смысл при высокой селективности. Если операторы у вас сливают эксели-миллионники, то что-то идёт не так. Значит у них нет подходящих инструментов.

...

Рейтинг:

0 / 0

21.03.2018, 12:05:26

| Ответить | Цитировать | Написать

Помогите ускорить выборки из последовательного списка

#39620300

uaggster

Гость

Владислав Колосовuaggster,

авторЭто витрина данных, которая оперативно обновляется
Почему не получится? У всех получается, а у Вас - нет :) Для перерасчета агрегатов используется Change Tracking . Куб именно так и перерасчитывается по расписанию. Там всё не перезаливается каждый раз.

А фильтры разве выбирают миллионы записей? Фильтры имеют смысл при высокой селективности. Если операторы у вас сливают эксели-миллионники, то что-то идёт не так. Значит у них нет подходящих инструментов.
А вот, кстати, вопрос.
А как в этом случае Change Tracking сработает?
Я ж меняю секцию целиком.
Т.е. создаю из скрипта таблицу, аналогичную секции, заливаю туда данные, а потом делаю свитч партишн.
Понятно, что фактически измененных записей там дай бог, если 1%, но это же другие записи!
(Я не знаю, ROWID другой и всё такое).

...

Рейтинг:

0 / 0

26.03.2018, 08:08:58

| Ответить | Цитировать | Написать

23 сообщений из 23, страница 1 из 1

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=46&msg=39617528&tid=1690051]:	0ms
get settings:	8ms
get forum list:	17ms
check forum access:	3ms
check topic access:	3ms
track hit:	159ms
get topic data:	11ms
get forum data:	3ms
get page messages:	62ms
get tp. blocked users:	1ms
others:	200ms

total:	467ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы