Выбор типа и размера TABLESPACE и BUFFERPOOL / IBM DB2, WebSphere, IMS, U2

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / IBM DB2, WebSphere, IMS, U2 [игнор отключен] [закрыт для гостей] / Выбор типа и размера TABLESPACE и BUFFERPOOL

4 сообщений из 4, страница 1 из 1

Выбор типа и размера TABLESPACE и BUFFERPOOL

#38850264

Александр Тарасенко

Участник

Сообщения: 97

Рейтинг: 0 / 0

Собственно, вопрос начального уровня, но почему-то ускользает от понимания совсем ((
Исходные данные:
Большая таблица (более 40 млн записей). Длина записи - 42 байт.
Полей - 8.
Была таблица организована в MDC (по 2 измерениям, направление и продукция). Получилось достаточно разреженно.
Подобран под эту организацию размер BUFFERPOOL (automatic на 4К) и tablespace (extensize - 32, PREFETCHSIZE 32).
Хочется пересобрать всю таблицу под:
Первое (направление) делить все данные на 2 части.
Второе - дата. Первые числа месяца, 10 лет (соот-но 250 примерно).
При этом в каждом измерении соот-но примерно 120-150 тыс. записей.
Вот теперь и непонятен выбор типа и размера TABLESPACE и BUFFERPOOL.
Пытался подбором, но путь глупый.
Нагрузка на таблицу - запросы для получения данных от всей таблицы по датам до различных по дате (пару месяцев, год и т.д.).
Сразу выбор на первом шаге по направлению и соот-но - либо одно, либо другое.
Похоже, что нужна предварительная выборка и скорее всего будет нужен блочный пул буферов.
Выбрал сначала буферпул такой:
CREATE BUFFERPOOL BP_STAT_32K
IMMEDIATE
ALL DBPARTITIONNUMS
SIZE AUTOMATIC
NUMBLOCKPAGES 128
BLOCKSIZE 128
PAGESIZE 32K``
и соот-но
таблспейс
CREATE REGULAR TABLESPACE TS_STAT_32K
IN DATABASE PARTITION GROUP IBMDEFAULTGROUP
PAGESIZE 32K
MANAGED BY AUTOMATIC STORAGE
EXTENTSIZE 64
PREFETCHSIZE 128
BUFFERPOOL BP_STAT_32K
OVERHEAD 10.67
TRANSFERRATE 0.02
AUTORESIZE YES
INITIALSIZE 32M
NO FILE SYSTEM CACHING
DROPPED TABLE RECOVERY OFF
``
стало хуже, из-за неоптимального размера.
В общем, просьба дать направление, где более-менее четко даны формулы выбора Размера extensize и PREFETCHSIZE
Ну и как определить OVERHEAD и TRANSFERRATE путь.

...

Рейтинг:

0 / 0

08.01.2015, 16:38

| Ответить | Цитировать | Написать

Выбор типа и размера TABLESPACE и BUFFERPOOL

#38850273

Александр Тарасенко

Участник

Сообщения: 97

Рейтинг: 0 / 0

и еще, вопрос такой, насколько может помочь замена измерения Date на int(date)/100 integer например?
если по Date точно будет один из запросов по определению например диапазона значений?

...

Рейтинг:

0 / 0

08.01.2015, 16:50

| Ответить | Цитировать | Написать

Выбор типа и размера TABLESPACE и BUFFERPOOL

#38852590

CawaSPb

Участник

Откуда: Питер/Москва/Wroclaw

Сообщения: 787

Рейтинг: 0 / 0

RedBook в помощь - http://www.redbooks.ibm.com/abstracts/sg247467.html

Александр ТарасенкоХочется пересобрать всю таблицу под:
Первое (направление) делить все данные на 2 части.
Второе - дата. Первые числа месяца , 10 лет (соот-но 250 примерно).
Вот это не очень понятно. 25 (24?) кластеров на год - каждый месяц на две части делится? [1 - N], (N - 29/30/31]? Как задаётся условие по измерению?
Или 250 - это всего и деление идёт по "дата с точностью до месяца" + год?

Обращаю внимание, что при "сложном" (например, по вычислимой колонке) условии распределения по измерению крайне желательно, чтобы в запросах предикат точно этому условию соответствовал (иначе оптимизатор может не понять, что выборку по измерению сделать надо и запрос будет читать таблицу (другие измерения) целиком).

Александр ТарасенкоНагрузка на таблицу - запросы для получения данных от всей таблицы по датам до различных по дате (пару месяцев, год и т.д.).
Вот можно чуть подробнее? Не очень понятно.

PAGE SIZE выбирать следует исходя из того какими блоками всё это будет читаться (и писаться). Достаточно наберётся co-located строк, вычитывающихся за раз - прекрасно. Для чтения большими блоками - чем больше, тем лучше (недостаточное количество строк в кластере MDC таблицы будет скорее ошибкой физического дизайна самой таблицы).
Важно! Табличное пространство в данном случае должно быть не REGULAR, а LARGE. Иначе в страницу будут класться максимум 255 строк (== ~10Kb в вашем случае).
У вас по грубым прикидкам под мегабайт данных в день, чтение меньше чем по "по направлению за день" не производится. 32K на страницу будет в самый раз.

EXTENT SIZE выбирается исходя из физических характеристик дисковой подсистемы (размер страйпа в raid) и размером блока для эффективного чтения с дисковой подсистемы.
Я бы лично рекомендовал выставлять _минимальный_ по выходу дисковой подсистемы на точку насыщения по потоковому чтению (что будет позволять на наиболее раннем этапе получать выгоду от параллелизации при разбрасывании контейнеров на разные "диски", если таковые имеются/могут появиться).
В остальном EXTENT SIZE будет влиять на maintenance операции (REBALANCING, EXTENT MOVEMENT после запроса на LOWER HIGH WATER MARK).

"Правильный" PREFETCH SIZE напрямую зависит зависит от количества контейнеров (на разных дисковых подсистемах) и тупо в лоб считается простым умножением количества контейнеров (дисков) на extent size, если extent size выбран по приведённому выше принципу (насыщения скорости потокового чтения + кратности размеры страницы).
Если по каким-то причинам мы выбрали другой extent size, то prefetch size выбираем, сначала посчитав "правильный" extent size.

Теоретически, PREFETCH SIZE можно урезать, если мы знаем, что читать за раз больше чем "столько-то" мы никогда не будем (даже на неэффективно составленых планах запросов), но на практике это мало когда можно грантировать.

NUMBLOCKPAGES и BLOCKSIZE следует подкручивать уже пост-фактум на реальной нагрузке, основываясь на monitor element'ах block_ios и pages_from_block_ios.
Но уверяю, это уже "тонкая настройка", влияющая на co-location читаемых данных в памяти (последующую эффективность процессорных кэшей) и уменьшение накладных расходов по CPU на поддержку карты страниц в буферпуле. Т.е. это уже "о-малое" по сравнению с остальным (физическим дизайном табличного пространства и физическим дизайном таблицы).
Векторное чтение (которое есть сейчас, наверное, практически везде) почти полностью выполнит задачи, которые возлагаются на блоковое.
Занимайтесь всем этим в последнюю очередь.
Если интересно, читайте в доке раздел Prefetching data into the buffer pool и по монитор-элементам block_ios, pages_from_block_ios, vectored_ios, pages_from_vectored_ios.

Александр ТарасенкоНу и как определить OVERHEAD и TRANSFERRATE путь.
OVERHEAD - "время доступа" в тысячных долях секунды, TRANSFERRATE - время чтения страницы (тоже в тысячных долях секунды).
Table space impact on query optimization .
Дефолтовые значения дадут вполне вразумительные с точки зрения работы оптимизатора значения, но правильно, конечно, померять (спросить у storage админов, если система внешняя).

Вообще говоря, очень похоже, что таблица - набор исторических данных.
В таком случае может оказаться более правильным упихать всё в range partitioned таблицу, по факту физически отсортированную по времени и партиционированную по направлению + дате (по месяцам).
MDC скорее для возможностей одновременной свёртки по различным направлениям и физически (по сравнению с обычными и range partitioned таблицами) они хранятся по-другому, что влечёт некоторые накладные расходы.
Важно - сделать после создания ALTER таблицы и установить режим APPEND ON.
Как нарезать разделы по дате - зависит от предполагаемых запросов.

Замена даты на "номер месяца" - вполне обычная практика, но плясать надо от предполагаемых запросов.

BTW Производится ли по таблице выборки по primary key, что таковым является, join'ится ли таблица с чем-либо?

...

Рейтинг:

0 / 0

12.01.2015, 20:14

| Ответить | Цитировать | Написать

Выбор типа и размера TABLESPACE и BUFFERPOOL

#38854257

Александр Тарасенко

Участник

Сообщения: 97

Рейтинг: 0 / 0

Попробовал организовать в MDC (по направлению - 2 части и составной параметр (продукция и страна) - 11000 примерно уникальных значений, итого 22710 ячеек).
Рассчитал размер extetsize, руководствуясь наставлениями
Повышение производительности запросов DB2 в среде интеллектуального бизнес-анализа .
Получилось на страницу 4К - размер 32.
Затем создал на основе этой таблицы MQT (присоединив по inner join другую таблицу, от которой в MQT получается 1 дополнительное поле).
Эта таблица MQT также организована в MDC по тем же 2 направлениям, в тот же TS.
В общем в скрипте создаю MQT, затем первый SET INTEGRITY (примерно минут 10).
После этого:
ALTER TABLE WORLD_MQT
DATA CAPTURE NONE``

ALTER TABLE WORLD_MQT
PCTFREE 0``

ALTER TABLE WORLD_MQT
LOCKSIZE ROW``

ALTER TABLE WORLD_MQT
APPEND OFF``

ALTER TABLE WORLD_MQT
NOT VOLATILE``
и создаю на ней 4 индекса.
И вот потом уже SET INTEGRITY ваще отказался ее воспринимать. Выполнялся часов 8-9 и ничего (.
Притом, когда создавал тестовую MQT, загнав в нее 1,5 млн записей, все прошло ... за примерно минут 10 (первая SET INTEGRITY = 1,5 мин там).
вот и вопрос, не кушает из-за размера?
Да, возможно что-то не то с Tablespace, в котором они лежат, который REGULAR на 4К? Все-таки лучше было бы делать на 32К и LARGE?

...

Рейтинг:

0 / 0

14.01.2015, 14:48

| Ответить | Цитировать | Написать

4 сообщений из 4, страница 1 из 1

Форумы / IBM DB2, WebSphere, IMS, U2 [игнор отключен] [закрыт для гостей] / Выбор типа и размера TABLESPACE и BUFFERPOOL

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=43&msg=38854257&tid=1600911]:	0ms
get settings:	7ms
get forum list:	11ms
check forum access:	2ms
check topic access:	2ms
track hit:	132ms
get topic data:	10ms
get forum data:	2ms
get page messages:	49ms
get tp. blocked users:	1ms
others:	257ms

total:	473ms