резкое снижение производительности при использовании HDR / Informix

ReSQL.ru

2.0.59

Планшетная версия Контакт Правила FAQ Помощь

Гость

Войти | Профиль | Очистить

Нов. | Гор. | Избр.

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Действия ...

Доб. в избранное
Игнор. тему
Прикреп. тему
Пометить прочит. / непрочит.
Фильтр:
Сообщения автора темы
Сообщение содержит вложения
Сообщение содержит картинки
Сообщение содержит видеоклипы
Сообщение содержит аудиоклипы
Сообщение содержит картинки или видео 18+

Форумы / Informix [игнор отключен] [закрыт для гостей] / резкое снижение производительности при использовании HDR / 22 сообщений из 22, страница 1 из 1

04.05.2011, 13:01

#37245236

Денис_88

Участник

Сообщения: 72
Рейтинг: 0 / 0

резкое снижение производительности при использовании HDR

Добрый день,
столкнулся с проблемой настройки производительности с репликацией.

Ситуация такова:есть высоконагруженная система, необходимо настроить репликацию с боевого сервера на резерв.

На 2 серверах(linux) прописал 2 одинаковых onconfig,все параметры информикса одинаковы (чанки,пространства,логика и физика) ,железо на секондари сервере меньше по памяти,но диски точно такие же как и на праймари.

Восстанавливаю на секондари физический бэкап, подключаю реплику и секондари догоняет праймари по логике.Все хорошо,все работает, НО:

при запуске приложения, которое активно удаляет временные таблицы или просто проводит высоконагруженные расчеты, приложение работает в 2 раза дольше,чем без репликации на этих же машинах с этими же данными.

checkpoint'ы на праймари делаются раз в минуту и их продолжительность 60-70сек в момент нагрузки.На секондари раз в минуту, продолжительность 0сек.

Подскажите плиз в чем может быть проблема?куда еще покопать?

Onconfig приложил.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

04.05.2011, 14:33

#37245456

GVF112GVF

Гость

резкое снижение производительности при использовании HDR

Денис_88Добрый день,
столкнулся с проблемой настройки производительности с репликацией.

Ситуация такова:есть высоконагруженная система, необходимо настроить репликацию с боевого сервера на резерв.

На 2 серверах(linux) прописал 2 одинаковых onconfig,все параметры информикса одинаковы (чанки,пространства,логика и физика) ,железо на секондари сервере меньше по памяти,но диски точно такие же как и на праймари.

Восстанавливаю на секондари физический бэкап, подключаю реплику и секондари догоняет праймари по логике.Все хорошо,все работает, НО:

при запуске приложения, которое активно удаляет временные таблицы или просто проводит высоконагруженные расчеты, приложение работает в 2 раза дольше,чем без репликации на этих же машинах с этими же данными.

checkpoint'ы на праймари делаются раз в минуту и их продолжительность 60-70сек в момент нагрузки.На секондари раз в минуту, продолжительность 0сек.

Подскажите плиз в чем может быть проблема?куда еще покопать?

Onconfig приложил.

Денис,
есть несколько гипотез относительно Вашей сиуации:

1. Длительность прохождения контрольной точки на primary (оптимизация контрольной точки).
2. Настройка параметров конфигурации - BUFFERPOOL, NETTYPE, DRINTERVAL, DRTIMEOUT.
3. Настрока сетевых интерфейсов для primary.
4. Наличие багов для текущей версии Informix (IBM Technical Support - APAR, PMR).
5. Наличие багов для текущей версии платформы (OS - TCP/IP).

С уважением,
Вадим.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

04.05.2011, 14:45

#37245482

cpr

Гость

резкое снижение производительности при использовании HDR

Денис_88,

Проверьте приложение

создаются ли в нем временные таблицы с опцией with no log

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

04.05.2011, 14:46

#37245484

cpr

Гость

резкое снижение производительности при использовании HDR

cpr,

если темповые таблицы создаются без этой опции, то все операции с ними входят в транзакцию.
А коммит на первичке происходит после коммита на вторичке.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

04.05.2011, 14:49

#37245490

Ikir

Участник

Сообщения: 251
Рейтинг: 0 / 0

резкое снижение производительности при использовании HDR

Денис_88,

По большому счету включение HDR добавляет обработку потока данных от primary севера к secondary. Оно реализовано у вас в асинхронном режиме через журналирование.
Первое, что я бы попробовал, это уменьшить этот поток

Код: plaintext

при запуске приложения, которое активно удаляет временные таблицы или просто проводит высоконагруженные расчеты,

Выставить параметр TEMPTAB_NOLOG = 1 , если у вас временные таблицы не используются с WITH NO LOG.

Второе, согласен с Вадимом, очень подозрительно выглядит

Код: plaintext

checkpoint'ы на праймари делаются раз в минуту и их продолжительность  60 -70сек в момент нагрузки

то есть отработка контрольных точек идет у вас непрерывно.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

04.05.2011, 15:20

#37245559

GVF112GVF

Гость

резкое снижение производительности при использовании HDR

GVF112GVFДенис_88Добрый день,
столкнулся с проблемой настройки производительности с репликацией.

Ситуация такова:есть высоконагруженная система, необходимо настроить репликацию с боевого сервера на резерв.

На 2 серверах(linux) прописал 2 одинаковых onconfig,все параметры информикса одинаковы (чанки,пространства,логика и физика) ,железо на секондари сервере меньше по памяти,но диски точно такие же как и на праймари.

Восстанавливаю на секондари физический бэкап, подключаю реплику и секондари догоняет праймари по логике.Все хорошо,все работает, НО:

при запуске приложения, которое активно удаляет временные таблицы или просто проводит высоконагруженные расчеты, приложение работает в 2 раза дольше,чем без репликации на этих же машинах с этими же данными.

checkpoint'ы на праймари делаются раз в минуту и их продолжительность 60-70сек в момент нагрузки.На секондари раз в минуту, продолжительность 0сек.

Подскажите плиз в чем может быть проблема?куда еще покопать?

Onconfig приложил.

Денис,
есть несколько гипотез относительно Вашей сиуации:

1. Длительность прохождения контрольной точки на primary (оптимизация контрольной точки).
2. Настройка параметров конфигурации - BUFFERPOOL, NETTYPE, DRINTERVAL, DRTIMEOUT.
3. Настрока сетевых интерфейсов для primary.
4. Наличие багов для текущей версии Informix (IBM Technical Support - APAR, PMR).
5. Наличие багов для текущей версии платформы (OS - TCP/IP).

С уважением,
Вадим.

После оптимизации контрольной точки,
oбратите внимание на настройки сетевого интерфеса NETTYPE на primary - сервере !!!

PS: Что-то подобное было у людей - http://www.dbforums.com/informix/893968-hdr-impact-db-performance.html

In the asymmetric configuration, the rule of a thumb to avoid long checkpoints in HDR pair:
SECONDARY MUST BE MORE POWERFUL THEN PRIMARY - more memory and more powerful disk subsystem, CPU power is not that important (unless you run out of CPU resources on Secondary).

Kind regards,
Vadim Golovsky.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

04.05.2011, 15:24

#37245564

Денис_88

Участник

Сообщения: 72
Рейтинг: 0 / 0

резкое снижение производительности при использовании HDR

Спасибо всем за помощь,но некоторые моменты не понял:

Вадим:

1.Длительность прохождения контрольной точки на primary (оптимизация контрольной точки).--как этого добиться?Увеличением интервала?
2. Настройка параметров конфигурации - BUFFERPOOL, NETTYPE, DRINTERVAL, DRTIMEOUT.
-DRINTERVAL стоит на обоих серверах одинаковый и выставлен в 150.Как я понимаю,это просто время для соединения
-DRTIMEOUT ставил разный от 30 до 500.Тоже самое,причем производительность не меняется.
-BUFFERPOOL, NETTYPE -- стоит одинаково на 2 серверах и без реплики работает быстро.В какую сторону здесь смотреть?
3. Настрока сетевых интерфейсов для primary.--2 сервера находятся в 1 подсети, файлы по ssh передаются со скоростью 50Мбит/сек стабильно,так что это отпадает
4. Наличие багов для текущей версии Informix (IBM Technical Support - APAR, PMR).--версия на 2 серверах одна и та же+без реплики работает-значит наверное тоже отпадает
5. Наличие багов для текущей версии платформы (OS - TCP/IP).--так же как п.4

cpr,
все временные таблицы создаются с параметром with no log

Ikir,
то есть отработка контрольных точек идет у вас непрерывно. --Да,так и есть.Исправить увеличением интервала?

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

04.05.2011, 15:31

#37245602

яфшуеі

Гость

резкое снижение производительности при использовании HDR

Денис_88Добрый день,
столкнулся с проблемой настройки производительности с репликацией.

На 2 серверах(linux) прописал 2 одинаковых onconfig,все параметры информикса одинаковы (чанки,пространства,логика и физика) ,железо на секондари сервере меньше по памяти,но диски точно такие же как и на праймари.

при запуске приложения, которое активно удаляет временные таблицы или просто проводит высоконагруженные расчеты, приложение работает в 2 раза дольше,чем без репликации на этих же машинах с этими же данными.

checkpoint'ы на праймари делаются раз в минуту и их продолжительность 60-70сек в момент нагрузки.На секондари раз в минуту, продолжительность 0сек.
Подскажите плиз в чем может быть проблема?куда еще покопать?
Onconfig приложил.

Вы почти полностью ответили на свой вопрос.
Да и в ветке народ правильно на счет with no log сказал.

По своему опыту знаю, что при большом количестве операций удаления HDR тормозит работу транзакций основного сервера.
С єти нужно бороться, если вы уверены, что неправильно работают с временными таблицами - провести работу с разработчиками
либо воспользоваться конф. параметром как грили выше.

Кроме того - понятие "удаляет временные таблицы" в моем понимании - drop table. Если это так, то вышесказанное мною неправильно. Но если там delete и временная таблица with log - тормоза прогнозируемые.

Касательно к.т. - зачем такая интенсивность? Да и долго уж как-то слишком.
Они такое же время віполняются что с HDR что без?

Если к.т. выполняются без HDR ЗНАЧИТЕЛЬНО быстрее, то трабла скорее всего в физ. журнале на HDR.
Нужно бі его вінести на диски побістрее. Да и процы вы не сказали какие на HDR. Дока в данном случае права и даже больше,
на HDR, как по мне, нужно ядро побыстрее чем на основном.

Когда у меня тормозила HDR, (много ждущих записи в лог) я разрываю HDR на несколько сек, за это время очередь как правило рассасывается и изначальная причина тоже завершает работу.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

04.05.2011, 15:57

#37245694

Денис_88

Участник

Сообщения: 72
Рейтинг: 0 / 0

резкое снижение производительности при использовании HDR

яфшуеі,

Касательно к.т. - зачем такая интенсивность? Да и долго уж как-то слишком.
Они такое же время віполняются что с HDR что без?

--интенсивность большая,потому что большая высоконагруженная банковская система
--без реплики они выполняются 0-1сек

Если к.т. выполняются без HDR ЗНАЧИТЕЛЬНО быстрее, то трабла скорее всего в физ. журнале на HDR.
Нужно бі его вінести на диски побістрее. Да и процы вы не сказали какие на HDR. Дока в данном случае права и даже больше,
на HDR, как по мне, нужно ядро побыстрее чем на основном.

--диски на быстром рейде,а вот процы действительно на секондари хуже

Отставание уровня железа на секондари сильно влияет на HDR?

Подскажите пожалуйста еще 1 самый важный вопрос:когда на первичном ложится транзакция, она передается на вторичный,но ждет ли первичный пока она закоментариться на вторичном???Или первичный коммитит независимо от вторичного?

Спасибо

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

04.05.2011, 16:47

#37245826

яфшуеі

Гость

резкое снижение производительности при использовании HDR

Денис_88Отставание уровня железа на секондари сильно влияет на HDR?

Подскажите пожалуйста еще 1 самый важный вопрос:когда на первичном ложится транзакция, она передается на вторичный,но ждет ли первичный пока она закоментариться на вторичном???Или первичный коммитит независимо от вторичного?

Спасибо

1. При определенніх операциях железо очень сильно влияет (производительность дисковой системы и отдельно взятого ядра ).
На HDR нужно не большое количество старого железа, а мощность.
Там практически ничего не параллелится.

2. Если я не ошибаюсь, у вас асинхронная репликация настроена.
Соответственно, буфер передается в зависимости от транзакционного режима БД.
Думаю, у вас скорее за все унбуфферед.
Если это так - буфер передается при любом коммите либо при заполнении.

В свое время, пока это не дошло, мы у себя физ. журнал выносили на отдельные диски - малость помогало, но это было давно.

Если вам верить на слово, то у вас же, ВОЗМОЖНО, проблема скорее всего в том, что HDR тормозит к.т.
Статистику по к.т. (на проблемном месте с и без HDR ) вы кстати не приводили вроде как.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

04.05.2011, 16:51

#37245838

GVF112GVF

Гость

резкое снижение производительности при использовании HDR

Денис_88Спасибо всем за помощь,но некоторые моменты не понял:

Вадим:

1.Длительность прохождения контрольной точки на primary (оптимизация контрольной точки).--как этого добиться?Увеличением интервала?
2. Настройка параметров конфигурации - BUFFERPOOL, NETTYPE, DRINTERVAL, DRTIMEOUT.
-DRINTERVAL стоит на обоих серверах одинаковый и выставлен в 150.Как я понимаю,это просто время для соединения
-DRTIMEOUT ставил разный от 30 до 500.Тоже самое,причем производительность не меняется.
-BUFFERPOOL, NETTYPE -- стоит одинаково на 2 серверах и без реплики работает быстро.В какую сторону здесь смотреть?
3. Настрока сетевых интерфейсов для primary.--2 сервера находятся в 1 подсети, файлы по ssh передаются со скоростью 50Мбит/сек стабильно,так что это отпадает
4. Наличие багов для текущей версии Informix (IBM Technical Support - APAR, PMR).--версия на 2 серверах одна и та же+без реплики работает-значит наверное тоже отпадает
5. Наличие багов для текущей версии платформы (OS - TCP/IP).--так же как п.4

cpr,
все временные таблицы создаются с параметром with no log

Ikir,
то есть отработка контрольных точек идет у вас непрерывно. --Да,так и есть.Исправить увеличением интервала?

1.Длительность прохождения контрольной точки на primary (оптимизация контрольной точки).--как этого добиться?Увеличением интервала?

Нет, наоборот - уменьшением интервала ... :)

Длительность прохождения контрольной точки регулируется:
1. Частотой контрольной точки - CKPTINTVL (значением параметра - PHYSFILE, как быстро заполняется физический журнал).
У Вас установлен параметр AUTO_CKPTS 1, что в принципе нормально.

2. Эффективностью работы потоков чистильщиков (CLEANERS) между контрольными точками.
В данном случае нужно пересмотреть значение для BUFFERPOOL !!!

Например,
Я не знаю зачем нужен такой большой размер BUFFERPOOL (возможно, что так и надо)
BUFFERPOOL size=2K,buffers=5500000,lrus=256,lru_min_dirty=25.000000,lru_max_dirty=35.000000
на сброс 10% (грязныз страниц) этого буфера при скорости 50Мб/c, потребуется ~ 22 сек ... :)

Вы можете уменьшить значение buffers или установить меньшие пороги для lru_min_dirty и lru_max_dirty
(например, lru_min_dirty = 1 и lru_max_dirty = 3). Здесь нужно быть осторожным. Уменьшение порогов может
сократить длительность прохождение контрольной точки, но дополнительно нагрузить дисковую подсистему I/O.
Нужно выполнять мониторинг работы потоков чистильщиков (onstat -FR) и т.д.

-DRINTERVAL стоит на обоих серверах одинаковый и выставлен в 150.Как я понимаю,это просто время для соединения

Не совсем так.
Для асинхронной репликации, значение параметра DRINTERVAL, определяет верхний порог временного интервала, в течение которого репликационный буфер должен быть сброшен. Предпологается, что в течение этого интервала - primary-сервер,
отправит репликационный буфкр на secondary-сервер. Другими словами DRINTERVAL - определяет интервал времени, через который репликационный буфер должен быть отправлен на вторичный сервер.

-DRTIMEOUT ставил разный от 30 до 500.Тоже самое,причем производительность не меняется.

DRTIMEOUT specifies the upper limit of time that the Primary will wait for an acknowledgment from the Secondary until it assumes a data replication failure. Checkpoints on the Secondary must not exceed the DRTIMEOUT boundary. Primary and Secondary will also ping each other regardless if logical log records are send. DRTIMEOUT specifies the interval at which those pings are send. A HDR failure is assumed after four sequential ping attempts failed. So the DRTIMEOUT parameter should be set to 1/4 (25 %) of the total time that is appropriate before declaring a failure. This parameter must have the same value on the Primary and on the Secondary.

-BUFFERPOOL, NETTYPE -- стоит одинаково на 2 серверах и без реплики работает быстро.В какую сторону здесь смотреть?

Про BUFFERPOOL - было чуть выше ... :)

Внимательно посмотри onstat -g rea для HDR-потоков - http://www.dbforums.com/informix/893968-hdr-impact-db-performance.html
...
3) To make dr_send thread to use NET VP class. So, it will not hold back other processing in this queue as it will be the only thread
using the NET VP.

... and so on.

С уважением,
Вадим.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

04.05.2011, 17:29

#37245951

cpr

Гость

резкое снижение производительности при использовании HDR

GVF112GVF,

т.е. я правильно понимаю, что когда запускаем onstat -g rea
, то потоков HDR не должно быть видно?
если они есть, то они чего то ждут?

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

04.05.2011, 18:02

#37246046

Денис_88

Участник

Сообщения: 72
Рейтинг: 0 / 0

резкое снижение производительности при использовании HDR

вывод команды onstat -P

Totals: 5500000 422993 2253524 2823483 11

Percentages:
Data 40.97
Btree 7.69
Other 51.34

Buffer pool page size: 12288
partnum total btree data other dirty
0 87867 0 0 87867 0
62914561 3 0 2 1 0
62914562 130 0 130 0 0

Totals: 88000 0 132 87868 0

Percentages:
Data 0.15
Btree 0.00
Other 99.85

Buffer pool page size: 16384
partnum total btree data other dirty
0 32997 0 0 32997 0
61865985 3 0 2 1 0

Totals: 33000 0 2 32998 0

Percentages:
Data 0.01
Btree 0.00
Other 99.99

что хранится в Other?

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

04.05.2011, 19:17

#37246171

GVF112GVF

Гость

резкое снижение производительности при использовании HDR

cprGVF112GVF,

т.е. я правильно понимаю, что когда запускаем onstat -g rea
, то потоков HDR не должно быть видно?
если они есть, то они чего то ждут?

The onstat -g rea command displays the threads that are on the ready queue and are awaiting a VP on which to run.

Если есть потоки HDR, то не хватает ресурсов VP (скорее всего VP CPU).

С уважением,
Вадим.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

04.05.2011, 19:19

#37246173

victor16

Гость

резкое снижение производительности при использовании HDR

Денис_88вывод команды onstat -P

Totals: 5500000 422993 2253524 2823483 11

Percentages:
Data 40.97
Btree 7.69
Other 51.34

Buffer pool page size: 12288
partnum total btree data other dirty
0 87867 0 0 87867 0
62914561 3 0 2 1 0
62914562 130 0 130 0 0

Totals: 88000 0 132 87868 0

Percentages:
Data 0.15
Btree 0.00
Other 99.85

Buffer pool page size: 16384
partnum total btree data other dirty
0 32997 0 0 32997 0
61865985 3 0 2 1 0

Totals: 33000 0 2 32998 0

Percentages:
Data 0.01
Btree 0.00
Other 99.99

что хранится в Other?
Если уж речь зашла о команде onstat -P, то есть три вещи, на которые надо обратить внимание в выводе этой команды.
1) Первая строка (partnum 0), число в поле 'other' показывает количество неиспользуемых страниц в буферном пуле, оно должно быть значительно меньше, чем значения других полей. Сохраняющееся в течении длительного периода высокое значение в этом поле указывает на то, что можно уменьшить количество буферов без особого ущерба для производительности. Однако, чтобы быть полностью уверенным в своих выводах, это надо проверить в моменты пиковой нагрузки (я солидарен с Василием)
2) Totals в конце страницы. В "правильной" OLTP/DSS системе нормальным считается соотношение 60-80% data pages, 15-35% index (BTree) pages и малое значение "other". Естественно, что в DW-системах с небольшим количеством индексов это соотношение будет другим. Нужно иметь в виду, что для старых систем (7.3 и 9.2), если Btree выше 60%, это может свидетельствовать о наличии старого "buffer aging bug".
3) Каждая строка с указанием partnum. Эта информация может использоваться для вычисления часто используемых таблиц с целью их последующего фрагментирования для распределения нагрузки от параллельного сканирования. Также в этой строке можно вычислить таблицы небольшого размера, но очень часто используемые в течении рабочего дня, с целью сделать их резидентными, правда, для новых версий это уже неактуально, поскольку сервер сам решает вопрос о резидентности таблиц и индексов.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

05.05.2011, 10:58

#37246807

klepa

Гость

резкое снижение производительности при использовании HDR

М.б. я невнимательно читал, но какая версия сервера Informix и ОС?

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

05.05.2011, 14:43

#37247456

cpr

Гость

резкое снижение производительности при использовании HDR

GVF112GVFcprGVF112GVF,

т.е. я правильно понимаю, что когда запускаем onstat -g rea
, то потоков HDR не должно быть видно?
если они есть, то они чего то ждут?

The onstat -g rea command displays the threads that are on the ready queue and are awaiting a VP on which to run.

Если есть потоки HDR, то не хватает ресурсов VP (скорее всего VP CPU).

С уважением,
Вадим.

позвольте еще вопрос плиз.

по команде
onstat -g con |grep drcb_bqf

я вижу нить репликации ожидающую условие.
она в этом выводе присутствует всегда.
я правлиьно понимаю, что если waittime > 0 то это плохо?

и еще интересно в каких единицах этот waittime - в секундах?

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

05.05.2011, 22:44

#37248460

GVF112GVF

Гость

резкое снижение производительности при использовании HDR

cprGVF112GVFпропущено...

The onstat -g rea command displays the threads that are on the ready queue and are awaiting a VP on which to run.

Если есть потоки HDR, то не хватает ресурсов VP (скорее всего VP CPU).

С уважением,
Вадим.

позвольте еще вопрос плиз.

по команде
onstat -g con |grep drcb_bqf

я вижу нить репликации ожидающую условие.
она в этом выводе присутствует всегда.
я правлиьно понимаю, что если waittime > 0 то это плохо?

и еще интересно в каких единицах этот waittime - в секундах?

Насколько Я помню в секундах ... :)
http://publib.boulder.ibm.com/infocenter/idshelp/v117/topic/com.ibm.adref.doc/ids_adr_0520.htm

onstat -g con |grep drcb_bqf

Thread waiting for buffer to show up on full Data Replication buffer queue.
Mutex "drcb_bqf" - the latch on the full replication buffer queue (by full this means that the buffer has data in it).

PS: To discover the session associated with the thread ID that is waiting on the condition, execute the following SQL statement against the sysmaster database, replacing the question mark (?) with the thread ID obtained from the onstat -g con output.
SELECT sid FROM rstcb WHERE tid = ?
This will return the session ID for the thread waiting on the condition. It is now possible to analyze the thread at the process level by using the process ID (pid) for the session.

С уважением,
Вадим Головский.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

06.05.2011, 11:35

#37249243

яфшуеі

Гость

резкое снижение производительности при использовании HDR

GVF112GVFНасколько Я помню в секундах ... :)
http://publib.boulder.ibm.com/infocenter/idshelp/v117/topic/com.ibm.adref.doc/ids_adr_0520.htm

onstat -g con |grep drcb_bqf

Thread waiting for buffer to show up on full Data Replication buffer queue.
Mutex "drcb_bqf" - the latch on the full replication buffer queue (by full this means that the buffer has data in it).

PS: To discover the session associated with the thread ID that is waiting on the condition, execute the following SQL statement against the sysmaster database, replacing the question mark (?) with the thread ID obtained from the onstat -g con output.
SELECT sid FROM rstcb WHERE tid = ?
This will return the session ID for the thread waiting on the condition. It is now possible to analyze the thread at the process level by using the process ID (pid) for the session.

С уважением,
Вадим Головский.

А теперь вернемся к изначальной проблеме - снижению производительности при выполнении некоего расчета.
Если заполнен буфер репликации а сессия нужно писать в лог - имеем что?
Правильно, имеем ожидание записи в лог журнал, тобишь в буфер лог журнала - определяется более простым и понятным
onstat -u.

Зная, что это происходит при включенном HDR можно сделать выводы:
1. тормозит сеть
2. тормозит железо на HDR
3. тормозит IDS на HDR
...

Сеть - проверяем время отклика и т.п.
Железо - чел. написал, что часть железа послабее.
IDS - смотрим количество каких ISAM операций увеличивается, либо анализируем лог.
"интенсивный" DELETE/UPDATE применяется на HDR дольше чем теже инсерты.
Если тормозит таки IDS и выявили на каких операторах - по логу/трассе и т.п. вычисляем
на каких это операторах "отчета".

Но, по описанию есть и вторая сторона проблемы - длительное выполнение к.т. при включенном HDR
Как по мне это чаще всего связано со слабой проихводительностью HDR сервера(железа).

Ну и сам обращающийся, говорит, что система высоконагруженная.
Чем определяется эта высонагруженность?
Во время к.т. как с использованием ресурсов на HDR?

Кстати, по поводу в 2 раза дольше - простая математика.
мы имеем изначально к.т. 1 раз в минуту продолжительностью 0-1 сек. и время расчета 1 едининца.
При включенном HDR мы имеем время выполнения к.т. 60 сек. при интервале 60 сек. и время выполнения расчета 2 ед.
Т.е. получается, что транзакции 60 сек. работают и 60 сек. стоят. в статусе C
Все логично, причина - долгое выполнение к.т. при включенной репликации.
Для выяснения причин этого, нужно как минимум смотерть на работу HDR сервера, предоставленной инфы мало.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

06.05.2011, 19:16

#37250228

GVF112GVF

Гость

резкое снижение производительности при использовании HDR

яфшуеіGVF112GVFНасколько Я помню в секундах ... :)
http://publib.boulder.ibm.com/infocenter/idshelp/v117/topic/com.ibm.adref.doc/ids_adr_0520.htm

onstat -g con |grep drcb_bqf

Thread waiting for buffer to show up on full Data Replication buffer queue.
Mutex "drcb_bqf" - the latch on the full replication buffer queue (by full this means that the buffer has data in it).

PS: To discover the session associated with the thread ID that is waiting on the condition, execute the following SQL statement against the sysmaster database, replacing the question mark (?) with the thread ID obtained from the onstat -g con output.
SELECT sid FROM rstcb WHERE tid = ?
This will return the session ID for the thread waiting on the condition. It is now possible to analyze the thread at the process level by using the process ID (pid) for the session.

С уважением,
Вадим Головский.

А теперь вернемся к изначальной проблеме - снижению производительности при выполнении некоего расчета.
Если заполнен буфер репликации а сессия нужно писать в лог - имеем что?
Правильно, имеем ожидание записи в лог журнал, тобишь в буфер лог журнала - определяется более простым и понятным
onstat -u.

Зная, что это происходит при включенном HDR можно сделать выводы:
1. тормозит сеть
2. тормозит железо на HDR
3. тормозит IDS на HDR
...

Сеть - проверяем время отклика и т.п.
Железо - чел. написал, что часть железа послабее.
IDS - смотрим количество каких ISAM операций увеличивается, либо анализируем лог.
"интенсивный" DELETE/UPDATE применяется на HDR дольше чем теже инсерты.
Если тормозит таки IDS и выявили на каких операторах - по логу/трассе и т.п. вычисляем
на каких это операторах "отчета".

Но, по описанию есть и вторая сторона проблемы - длительное выполнение к.т. при включенном HDR
Как по мне это чаще всего связано со слабой проихводительностью HDR сервера(железа).

Ну и сам обращающийся, говорит, что система высоконагруженная.
Чем определяется эта высонагруженность?
Во время к.т. как с использованием ресурсов на HDR?

Кстати, по поводу в 2 раза дольше - простая математика.
мы имеем изначально к.т. 1 раз в минуту продолжительностью 0-1 сек. и время расчета 1 едининца.
При включенном HDR мы имеем время выполнения к.т. 60 сек. при интервале 60 сек. и время выполнения расчета 2 ед.
Т.е. получается, что транзакции 60 сек. работают и 60 сек. стоят. в статусе C
Все логично, причина - долгое выполнение к.т. при включенной репликации.
Для выяснения причин этого, нужно как минимум смотерть на работу HDR сервера, предоставленной инфы мало.

Игорь,
что-то Я не понял - каким боком ты меня цетировать начал? К чему это все ?!

С уважением,
Вадим

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

10.05.2011, 11:32

#37252348

Денис_88

Участник

Сообщения: 72
Рейтинг: 0 / 0

резкое снижение производительности при использовании HDR

всем спасибо

проблема решилась включением параметра RTO_SERVER_RESTART в 60.Теперь к.т. идет по заполнению и продолжается 1-2сек.Видимо блокировка транзакций во время к.т. не исчезла.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

10.05.2011, 12:35

#37252476

victor16

Гость

резкое снижение производительности при использовании HDR

Денис_88всем спасибо

проблема решилась включением параметра RTO_SERVER_RESTART в 60.Теперь к.т. идет по заполнению и продолжается 1-2сек.Видимо блокировка транзакций во время к.т. не исчезла.
RTO_SERVER_RESTART = 60
мне кажется это слишком жесткие условия. Следует помониторить, и если сервер самостоятельно будет уменьшать значения lru_min_dirty и lru_max_dirty, лучше будет увеличить.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=44&mobile=1&tid=1607363]:	0ms
get settings:	10ms
get forum list:	13ms
check forum access:	2ms
check topic access:	2ms
track hit:	78ms
get topic data:	12ms
get forum data:	2ms
get page messages:	53ms
get tp. blocked users:	1ms
others:	13ms

total:	186ms