Какое условие по дате будет быстрее? / IBM DB2, WebSphere, IMS, U2

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / IBM DB2, WebSphere, IMS, U2 [игнор отключен] [закрыт для гостей] / Какое условие по дате будет быстрее?

9 сообщений из 9, страница 1 из 1

Какое условие по дате будет быстрее?

#35634334

Semen Popov

Участник

Откуда: Сыктывкар

Сообщения: 799

Рейтинг: 0 / 0

Здравствуйте всем!

Есть таблица TAB1 c полем DATFLD типа DATE. Индексов нет. Нужно сделать выборку записей за один месяц. Меня интересует, какая конструкция отработает быстрее:

Код: plaintext

select * from TAB1 where month(DATFLD)=? and year(DATFLD)=?

Код: plaintext

select * from TAB1 where DATFLD between ? and ?

или

Код: plaintext

select * from TAB1 where ?<=DATFLD and DATFLD<?

А может есть ещё варианты?

Спасибо
С уважением, Семен Попов

...

Рейтинг:

0 / 0

05.11.2008, 10:30

| Ответить | Цитировать | Написать

Какое условие по дате будет быстрее?

#35634463

TORT

Участник

Сообщения: 1 000

Рейтинг: 0 / 0

Если есть индекс по полю с датой, то первый вариант однозначно самый медленный... Так как индекс не будет использоваться.... ИМХО, второй и третий варианты одинаковы... Я пользую второй конструкцией...

...

Рейтинг:

0 / 0

05.11.2008, 11:09

| Ответить | Цитировать | Написать

Какое условие по дате будет быстрее?

#35634559

Victor Metelitsa

Участник

Откуда: Тюмень

Сообщения: 2 626

Рейтинг: 0 / 0

Ещё можно добавить в таблицу generated-поле (назову его Y) по выражению 100 * year(DATFLD) + month(DATFLD) и искать select * from TAB1 where YM=:month + 100 * :year. По YM неплохо не только индексировать, но и использовать в качестве измерения для MDC.

...

Рейтинг:

0 / 0

05.11.2008, 11:46

| Ответить | Цитировать | Написать

Какое условие по дате будет быстрее?

#35634584

Mark Barinstein

Гость

С маркерами параметров надо иметь ввиду следующее:

План запроса строится до того, как становятся известны актуальные значения (есть, конечно, варианты с опцией компиляции reopt, но мы рассматриваем общий случай).
Если у вашей таблицы не стоит флаг volatile, то план запроса в этом случае трудно предсказать, ведь на этапе компиляции не понятно, какое кол-во строк будет в итоге выбрано.

Поэтому, если вы хотите побудить оптимизатор использовать индекс вы можете
- при установленной заранее переменной окружения DB2_SELECTIVITY=ALL:
select * from TAB1 where DATFLD between ? and ? selectivity 0.00001
- не использовать в таких запросах маркеры, а вместо них - актуальные значения параметров. Тогда оптимизатор по собранной статистике может сам, в зависимости от этих значений, выбрать оптимальный план.

Другой вариант:
- завести generated always поле:
datfld_ym generated always as (year(datfld)*100+month(datfld))
- создать индекс по нему
- использовать запросы типа:
select * from TAB1 where year(datfld)*100+month(datfld)=?
select * from TAB1 where datfld_ym=?

оптимизатор при обоих запросах должен будет использовать индекс по datfld_ym.

...

Рейтинг:

0 / 0

05.11.2008, 11:54

| Ответить | Цитировать | Написать

Какое условие по дате будет быстрее?

#35634724

Semen Popov

Участник

Откуда: Сыктывкар

Сообщения: 799

Рейтинг: 0 / 0

TORTЕсли есть индекс по полю с датой, то первый вариант однозначно самый медленный... Так как индекс не будет использоваться.... ИМХО, второй и третий варианты одинаковы... Я пользую второй конструкцией...Спасибо. А если индексов, использующих это поле, нет? Моё мнение, что первый вариант в любом случае будет самым медленным.
Victor MetelitsaЕщё можно добавить в таблицу generated-поле (назову его Y) по выражению 100 * year(DATFLD) + month(DATFLD) и искать select * from TAB1 where YM=:month + 100 * :year. По YM неплохо не только индексировать, но и использовать в качестве измерения для MDC.Спасибо. Как-нибудь учту при проектировании следующей базы. Сейчас не хотелось бы менять структуру существующей базы. Записей не много - до 50 тыс., поэтому второй вариант из предложенных мною, думаю, будет достаточным. Хотя индекс и напрашивается, но таких полей-дат, по которым производятся различные расчёты и выборки, много. Некоторые разработчики утверждают, что таблицу не стоит нагружать(?) большим количеством индексов.
Mark BarinsteinС маркерами параметров надо иметь ввиду следующее:

План запроса строится до того, как становятся известны актуальные значения (есть, конечно, варианты с опцией компиляции reopt, но мы рассматриваем общий случай).
Если у вашей таблицы не стоит флаг volatile, то план запроса в этом случае трудно предсказать, ведь на этапе компиляции не понятно, какое кол-во строк будет в итоге выбрано.

Поэтому, если вы хотите побудить оптимизатор использовать индекс вы можете
- при установленной заранее переменной окружения DB2_SELECTIVITY=ALL:
select * from TAB1 where DATFLD between ? and ? selectivity 0.00001
- не использовать в таких запросах маркеры, а вместо них - актуальные значения параметров. Тогда оптимизатор по собранной статистике может сам, в зависимости от этих значений, выбрать оптимальный план.
...Спасибо. Таблица not volatile. Насколько разумно побуждать оптимизатор использовать индекс, если количество записей до 50 тыс? В каких условиях рекомендуется побуждать оптимизатор?

...

Рейтинг:

0 / 0

05.11.2008, 12:31

| Ответить | Цитировать | Написать

Какое условие по дате будет быстрее?

#35634829

Mark Barinstein

Гость

Semen PopovНасколько разумно побуждать оптимизатор использовать индекс, если количество записей до 50 тыс? В каких условиях рекомендуется побуждать оптимизатор?Если ваша таблица настолько мала, что влезает на одну страницу данных, например, то индекс ей, вероятно, не нужен - страницы всё равно в память целиком считываются.
Если же нет, то возможны варианты - там желательно создать индекс и дать возможность оптимизатору оценить, использовать его или нет.
50 тыс. строк не влезут в 1 страницу...

...

Рейтинг:

0 / 0

05.11.2008, 13:11

| Ответить | Цитировать | Написать

Какое условие по дате будет быстрее?

#35635436

Semen Popov

Участник

Откуда: Сыктывкар

Сообщения: 799

Рейтинг: 0 / 0

Mark BarinsteinSemen PopovНасколько разумно побуждать оптимизатор использовать индекс, если количество записей до 50 тыс? В каких условиях рекомендуется побуждать оптимизатор?Если ваша таблица настолько мала, что влезает на одну страницу данных, например, то индекс ей, вероятно, не нужен - страницы всё равно в память целиком считываются.
Если же нет, то возможны варианты - там желательно создать индекс и дать возможность оптимизатору оценить, использовать его или нет.
50 тыс. строк не влезут в 1 страницу...Спасибо. А если мы будем говорить только о рассчётах, а не выборке записей? Например,

Код: plaintext

select count(*),sum(FLD1) from TAB1 where DATFLD between ? and ?

Как в этом случае? Нужно ли предусматривать для вычислений индексы или побуждать оптимизатор?

...

Рейтинг:

0 / 0

05.11.2008, 16:15

| Ответить | Цитировать | Написать

Какое условие по дате будет быстрее?

#35635579

Mark Barinstein

Гость

Semen PopovА если мы будем говорить только о рассчётах, а не выборке записей? Например,

Код: plaintext

select count(*),sum(FLD1) from TAB1 where DATFLD between ? and ?

Как в этом случае? Нужно ли предусматривать для вычислений индексы или побуждать оптимизатор?Правильнее всего будет либо избегать таких запросов, либо использовать reopt always опцию bind (но это для статического sql или для динамического, когда какой-либо package контролирует выполнение этого динамического sql - например для sql sp).
Т.е. вы должны создать такой индекс и дать оптимизатору возможность решить, какой метод доступа использовать - в зависимости от актуальных значений параметров, т.к. в этом случае нельзя заставлять оптимизатор компилировать запрос без предоставления этих значений.
Разумеется, все эти утверждения - не для крошечных таблиц.

...

Рейтинг:

0 / 0

05.11.2008, 16:58

| Ответить | Цитировать | Написать

Какое условие по дате будет быстрее?

#35635778

Semen Popov

Участник

Откуда: Сыктывкар

Сообщения: 799

Рейтинг: 0 / 0

Премного благодарен

...

Рейтинг:

0 / 0

05.11.2008, 17:48

| Ответить | Цитировать | Написать

9 сообщений из 9, страница 1 из 1

Форумы / IBM DB2, WebSphere, IMS, U2 [игнор отключен] [закрыт для гостей] / Какое условие по дате будет быстрее?

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=43&gotonew=1&tid=1603600]:	0ms
get settings:	8ms
get forum list:	18ms
check forum access:	3ms
check topic access:	3ms
track hit:	55ms
get topic data:	9ms
get first new msg:	5ms
get forum data:	2ms
get page messages:	45ms
get tp. blocked users:	1ms
others:	253ms

total:	402ms