Гость
Map
Форумы / Informix [игнор отключен] [закрыт для гостей] / резкое снижение производительности при использовании HDR / 22 сообщений из 22, страница 1 из 1
04.05.2011, 13:01
    #37245236
Денис_88
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
резкое снижение производительности при использовании HDR
Добрый день,
столкнулся с проблемой настройки производительности с репликацией.

Ситуация такова:есть высоконагруженная система, необходимо настроить репликацию с боевого сервера на резерв.

На 2 серверах(linux) прописал 2 одинаковых onconfig,все параметры информикса одинаковы (чанки,пространства,логика и физика) ,железо на секондари сервере меньше по памяти,но диски точно такие же как и на праймари.

Восстанавливаю на секондари физический бэкап, подключаю реплику и секондари догоняет праймари по логике.Все хорошо,все работает, НО:

при запуске приложения, которое активно удаляет временные таблицы или просто проводит высоконагруженные расчеты, приложение работает в 2 раза дольше,чем без репликации на этих же машинах с этими же данными.

checkpoint'ы на праймари делаются раз в минуту и их продолжительность 60-70сек в момент нагрузки.На секондари раз в минуту, продолжительность 0сек.

Подскажите плиз в чем может быть проблема?куда еще покопать?


Onconfig приложил.
...
Рейтинг: 0 / 0
04.05.2011, 14:33
    #37245456
GVF112GVF
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
резкое снижение производительности при использовании HDR
Денис_88Добрый день,
столкнулся с проблемой настройки производительности с репликацией.

Ситуация такова:есть высоконагруженная система, необходимо настроить репликацию с боевого сервера на резерв.

На 2 серверах(linux) прописал 2 одинаковых onconfig,все параметры информикса одинаковы (чанки,пространства,логика и физика) ,железо на секондари сервере меньше по памяти,но диски точно такие же как и на праймари.

Восстанавливаю на секондари физический бэкап, подключаю реплику и секондари догоняет праймари по логике.Все хорошо,все работает, НО:

при запуске приложения, которое активно удаляет временные таблицы или просто проводит высоконагруженные расчеты, приложение работает в 2 раза дольше,чем без репликации на этих же машинах с этими же данными.

checkpoint'ы на праймари делаются раз в минуту и их продолжительность 60-70сек в момент нагрузки.На секондари раз в минуту, продолжительность 0сек.

Подскажите плиз в чем может быть проблема?куда еще покопать?

Onconfig приложил.

Денис,
есть несколько гипотез относительно Вашей сиуации:

1. Длительность прохождения контрольной точки на primary (оптимизация контрольной точки).
2. Настройка параметров конфигурации - BUFFERPOOL, NETTYPE, DRINTERVAL, DRTIMEOUT.
3. Настрока сетевых интерфейсов для primary.
4. Наличие багов для текущей версии Informix (IBM Technical Support - APAR, PMR).
5. Наличие багов для текущей версии платформы (OS - TCP/IP).

С уважением,
Вадим.
...
Рейтинг: 0 / 0
04.05.2011, 14:45
    #37245482
cpr
cpr
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
резкое снижение производительности при использовании HDR
Денис_88,

Проверьте приложение

создаются ли в нем временные таблицы с опцией with no log
...
Рейтинг: 0 / 0
04.05.2011, 14:46
    #37245484
cpr
cpr
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
резкое снижение производительности при использовании HDR
cpr,

если темповые таблицы создаются без этой опции, то все операции с ними входят в транзакцию.
А коммит на первичке происходит после коммита на вторичке.
...
Рейтинг: 0 / 0
04.05.2011, 14:49
    #37245490
Ikir
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
резкое снижение производительности при использовании HDR
Денис_88,

По большому счету включение HDR добавляет обработку потока данных от primary севера к secondary. Оно реализовано у вас в асинхронном режиме через журналирование.
Первое, что я бы попробовал, это уменьшить этот поток
Код: plaintext
при запуске приложения, которое активно удаляет временные таблицы или просто проводит высоконагруженные расчеты,

Выставить параметр TEMPTAB_NOLOG = 1 , если у вас временные таблицы не используются с WITH NO LOG.

Второе, согласен с Вадимом, очень подозрительно выглядит
Код: plaintext
checkpoint'ы на праймари делаются раз в минуту и их продолжительность  60 -70сек в момент нагрузки

то есть отработка контрольных точек идет у вас непрерывно.
...
Рейтинг: 0 / 0
04.05.2011, 15:20
    #37245559
GVF112GVF
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
резкое снижение производительности при использовании HDR
GVF112GVFДенис_88Добрый день,
столкнулся с проблемой настройки производительности с репликацией.

Ситуация такова:есть высоконагруженная система, необходимо настроить репликацию с боевого сервера на резерв.

На 2 серверах(linux) прописал 2 одинаковых onconfig,все параметры информикса одинаковы (чанки,пространства,логика и физика) ,железо на секондари сервере меньше по памяти,но диски точно такие же как и на праймари.

Восстанавливаю на секондари физический бэкап, подключаю реплику и секондари догоняет праймари по логике.Все хорошо,все работает, НО:

при запуске приложения, которое активно удаляет временные таблицы или просто проводит высоконагруженные расчеты, приложение работает в 2 раза дольше,чем без репликации на этих же машинах с этими же данными.

checkpoint'ы на праймари делаются раз в минуту и их продолжительность 60-70сек в момент нагрузки.На секондари раз в минуту, продолжительность 0сек.

Подскажите плиз в чем может быть проблема?куда еще покопать?

Onconfig приложил.

Денис,
есть несколько гипотез относительно Вашей сиуации:

1. Длительность прохождения контрольной точки на primary (оптимизация контрольной точки).
2. Настройка параметров конфигурации - BUFFERPOOL, NETTYPE, DRINTERVAL, DRTIMEOUT.
3. Настрока сетевых интерфейсов для primary.
4. Наличие багов для текущей версии Informix (IBM Technical Support - APAR, PMR).
5. Наличие багов для текущей версии платформы (OS - TCP/IP).

С уважением,
Вадим.

После оптимизации контрольной точки,
oбратите внимание на настройки сетевого интерфеса NETTYPE на primary - сервере !!!

PS: Что-то подобное было у людей - http://www.dbforums.com/informix/893968-hdr-impact-db-performance.html

In the asymmetric configuration, the rule of a thumb to avoid long checkpoints in HDR pair:
SECONDARY MUST BE MORE POWERFUL THEN PRIMARY - more memory and more powerful disk subsystem, CPU power is not that important (unless you run out of CPU resources on Secondary).

Kind regards,
Vadim Golovsky.
...
Рейтинг: 0 / 0
04.05.2011, 15:24
    #37245564
Денис_88
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
резкое снижение производительности при использовании HDR
Спасибо всем за помощь,но некоторые моменты не понял:

Вадим:

1.Длительность прохождения контрольной точки на primary (оптимизация контрольной точки).--как этого добиться?Увеличением интервала?
2. Настройка параметров конфигурации - BUFFERPOOL, NETTYPE, DRINTERVAL, DRTIMEOUT.
-DRINTERVAL стоит на обоих серверах одинаковый и выставлен в 150.Как я понимаю,это просто время для соединения
-DRTIMEOUT ставил разный от 30 до 500.Тоже самое,причем производительность не меняется.
-BUFFERPOOL, NETTYPE -- стоит одинаково на 2 серверах и без реплики работает быстро.В какую сторону здесь смотреть?
3. Настрока сетевых интерфейсов для primary.--2 сервера находятся в 1 подсети, файлы по ssh передаются со скоростью 50Мбит/сек стабильно,так что это отпадает
4. Наличие багов для текущей версии Informix (IBM Technical Support - APAR, PMR).--версия на 2 серверах одна и та же+без реплики работает-значит наверное тоже отпадает
5. Наличие багов для текущей версии платформы (OS - TCP/IP).--так же как п.4

cpr,
все временные таблицы создаются с параметром with no log

Ikir,
то есть отработка контрольных точек идет у вас непрерывно. --Да,так и есть.Исправить увеличением интервала?
...
Рейтинг: 0 / 0
04.05.2011, 15:31
    #37245602
яфшуеі
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
резкое снижение производительности при использовании HDR
Денис_88Добрый день,
столкнулся с проблемой настройки производительности с репликацией.

На 2 серверах(linux) прописал 2 одинаковых onconfig,все параметры информикса одинаковы (чанки,пространства,логика и физика) ,железо на секондари сервере меньше по памяти,но диски точно такие же как и на праймари.

при запуске приложения, которое активно удаляет временные таблицы или просто проводит высоконагруженные расчеты, приложение работает в 2 раза дольше,чем без репликации на этих же машинах с этими же данными.

checkpoint'ы на праймари делаются раз в минуту и их продолжительность 60-70сек в момент нагрузки.На секондари раз в минуту, продолжительность 0сек.
Подскажите плиз в чем может быть проблема?куда еще покопать?
Onconfig приложил.

Вы почти полностью ответили на свой вопрос.
Да и в ветке народ правильно на счет with no log сказал.

По своему опыту знаю, что при большом количестве операций удаления HDR тормозит работу транзакций основного сервера.
С єти нужно бороться, если вы уверены, что неправильно работают с временными таблицами - провести работу с разработчиками
либо воспользоваться конф. параметром как грили выше.


Кроме того - понятие "удаляет временные таблицы" в моем понимании - drop table. Если это так, то вышесказанное мною неправильно. Но если там delete и временная таблица with log - тормоза прогнозируемые.

Касательно к.т. - зачем такая интенсивность? Да и долго уж как-то слишком.
Они такое же время віполняются что с HDR что без?

Если к.т. выполняются без HDR ЗНАЧИТЕЛЬНО быстрее, то трабла скорее всего в физ. журнале на HDR.
Нужно бі его вінести на диски побістрее. Да и процы вы не сказали какие на HDR. Дока в данном случае права и даже больше,
на HDR, как по мне, нужно ядро побыстрее чем на основном.


Когда у меня тормозила HDR, (много ждущих записи в лог) я разрываю HDR на несколько сек, за это время очередь как правило рассасывается и изначальная причина тоже завершает работу.
...
Рейтинг: 0 / 0
04.05.2011, 15:57
    #37245694
Денис_88
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
резкое снижение производительности при использовании HDR
яфшуеі,

Касательно к.т. - зачем такая интенсивность? Да и долго уж как-то слишком.
Они такое же время віполняются что с HDR что без?

--интенсивность большая,потому что большая высоконагруженная банковская система
--без реплики они выполняются 0-1сек


Если к.т. выполняются без HDR ЗНАЧИТЕЛЬНО быстрее, то трабла скорее всего в физ. журнале на HDR.
Нужно бі его вінести на диски побістрее. Да и процы вы не сказали какие на HDR. Дока в данном случае права и даже больше,
на HDR, как по мне, нужно ядро побыстрее чем на основном.

--диски на быстром рейде,а вот процы действительно на секондари хуже


Отставание уровня железа на секондари сильно влияет на HDR?

Подскажите пожалуйста еще 1 самый важный вопрос:когда на первичном ложится транзакция, она передается на вторичный,но ждет ли первичный пока она закоментариться на вторичном???Или первичный коммитит независимо от вторичного?

Спасибо
...
Рейтинг: 0 / 0
04.05.2011, 16:47
    #37245826
яфшуеі
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
резкое снижение производительности при использовании HDR
Денис_88Отставание уровня железа на секондари сильно влияет на HDR?

Подскажите пожалуйста еще 1 самый важный вопрос:когда на первичном ложится транзакция, она передается на вторичный,но ждет ли первичный пока она закоментариться на вторичном???Или первичный коммитит независимо от вторичного?

Спасибо

1. При определенніх операциях железо очень сильно влияет (производительность дисковой системы и отдельно взятого ядра ).
На HDR нужно не большое количество старого железа, а мощность.
Там практически ничего не параллелится.

2. Если я не ошибаюсь, у вас асинхронная репликация настроена.
Соответственно, буфер передается в зависимости от транзакционного режима БД.
Думаю, у вас скорее за все унбуфферед.
Если это так - буфер передается при любом коммите либо при заполнении.


В свое время, пока это не дошло, мы у себя физ. журнал выносили на отдельные диски - малость помогало, но это было давно.

Если вам верить на слово, то у вас же, ВОЗМОЖНО, проблема скорее всего в том, что HDR тормозит к.т.
Статистику по к.т. (на проблемном месте с и без HDR ) вы кстати не приводили вроде как.
...
Рейтинг: 0 / 0
04.05.2011, 16:51
    #37245838
GVF112GVF
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
резкое снижение производительности при использовании HDR
Денис_88Спасибо всем за помощь,но некоторые моменты не понял:

Вадим:

1.Длительность прохождения контрольной точки на primary (оптимизация контрольной точки).--как этого добиться?Увеличением интервала?
2. Настройка параметров конфигурации - BUFFERPOOL, NETTYPE, DRINTERVAL, DRTIMEOUT.
-DRINTERVAL стоит на обоих серверах одинаковый и выставлен в 150.Как я понимаю,это просто время для соединения
-DRTIMEOUT ставил разный от 30 до 500.Тоже самое,причем производительность не меняется.
-BUFFERPOOL, NETTYPE -- стоит одинаково на 2 серверах и без реплики работает быстро.В какую сторону здесь смотреть?
3. Настрока сетевых интерфейсов для primary.--2 сервера находятся в 1 подсети, файлы по ssh передаются со скоростью 50Мбит/сек стабильно,так что это отпадает
4. Наличие багов для текущей версии Informix (IBM Technical Support - APAR, PMR).--версия на 2 серверах одна и та же+без реплики работает-значит наверное тоже отпадает
5. Наличие багов для текущей версии платформы (OS - TCP/IP).--так же как п.4

cpr,
все временные таблицы создаются с параметром with no log

Ikir,
то есть отработка контрольных точек идет у вас непрерывно. --Да,так и есть.Исправить увеличением интервала?

1.Длительность прохождения контрольной точки на primary (оптимизация контрольной точки).--как этого добиться?Увеличением интервала?

Нет, наоборот - уменьшением интервала ... :)

Длительность прохождения контрольной точки регулируется:
1. Частотой контрольной точки - CKPTINTVL (значением параметра - PHYSFILE, как быстро заполняется физический журнал).
У Вас установлен параметр AUTO_CKPTS 1, что в принципе нормально.

2. Эффективностью работы потоков чистильщиков (CLEANERS) между контрольными точками.
В данном случае нужно пересмотреть значение для BUFFERPOOL !!!

Например,
Я не знаю зачем нужен такой большой размер BUFFERPOOL (возможно, что так и надо)
BUFFERPOOL size=2K,buffers=5500000,lrus=256,lru_min_dirty=25.000000,lru_max_dirty=35.000000
на сброс 10% (грязныз страниц) этого буфера при скорости 50Мб/c, потребуется ~ 22 сек ... :)

Вы можете уменьшить значение buffers или установить меньшие пороги для lru_min_dirty и lru_max_dirty
(например, lru_min_dirty = 1 и lru_max_dirty = 3). Здесь нужно быть осторожным. Уменьшение порогов может
сократить длительность прохождение контрольной точки, но дополнительно нагрузить дисковую подсистему I/O.
Нужно выполнять мониторинг работы потоков чистильщиков (onstat -FR) и т.д.

-DRINTERVAL стоит на обоих серверах одинаковый и выставлен в 150.Как я понимаю,это просто время для соединения

Не совсем так.
Для асинхронной репликации, значение параметра DRINTERVAL, определяет верхний порог временного интервала, в течение которого репликационный буфер должен быть сброшен. Предпологается, что в течение этого интервала - primary-сервер,
отправит репликационный буфкр на secondary-сервер. Другими словами DRINTERVAL - определяет интервал времени, через который репликационный буфер должен быть отправлен на вторичный сервер.

-DRTIMEOUT ставил разный от 30 до 500.Тоже самое,причем производительность не меняется.

DRTIMEOUT specifies the upper limit of time that the Primary will wait for an acknowledgment from the Secondary until it assumes a data replication failure. Checkpoints on the Secondary must not exceed the DRTIMEOUT boundary. Primary and Secondary will also ping each other regardless if logical log records are send. DRTIMEOUT specifies the interval at which those pings are send. A HDR failure is assumed after four sequential ping attempts failed. So the DRTIMEOUT parameter should be set to 1/4 (25 %) of the total time that is appropriate before declaring a failure. This parameter must have the same value on the Primary and on the Secondary.

-BUFFERPOOL, NETTYPE -- стоит одинаково на 2 серверах и без реплики работает быстро.В какую сторону здесь смотреть?

Про BUFFERPOOL - было чуть выше ... :)

Внимательно посмотри onstat -g rea для HDR-потоков - http://www.dbforums.com/informix/893968-hdr-impact-db-performance.html
...
3) To make dr_send thread to use NET VP class. So, it will not hold back other processing in this queue as it will be the only thread
using the NET VP.

... and so on.

С уважением,
Вадим.
...
Рейтинг: 0 / 0
04.05.2011, 17:29
    #37245951
cpr
cpr
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
резкое снижение производительности при использовании HDR
GVF112GVF,

т.е. я правильно понимаю, что когда запускаем onstat -g rea
, то потоков HDR не должно быть видно?
если они есть, то они чего то ждут?
...
Рейтинг: 0 / 0
04.05.2011, 18:02
    #37246046
Денис_88
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
резкое снижение производительности при использовании HDR
вывод команды onstat -P

Totals: 5500000 422993 2253524 2823483 11

Percentages:
Data 40.97
Btree 7.69
Other 51.34

Buffer pool page size: 12288
partnum total btree data other dirty
0 87867 0 0 87867 0
62914561 3 0 2 1 0
62914562 130 0 130 0 0

Totals: 88000 0 132 87868 0

Percentages:
Data 0.15
Btree 0.00
Other 99.85

Buffer pool page size: 16384
partnum total btree data other dirty
0 32997 0 0 32997 0
61865985 3 0 2 1 0

Totals: 33000 0 2 32998 0

Percentages:
Data 0.01
Btree 0.00
Other 99.99



что хранится в Other?
...
Рейтинг: 0 / 0
04.05.2011, 19:17
    #37246171
GVF112GVF
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
резкое снижение производительности при использовании HDR
cprGVF112GVF,

т.е. я правильно понимаю, что когда запускаем onstat -g rea
, то потоков HDR не должно быть видно?
если они есть, то они чего то ждут?

The onstat -g rea command displays the threads that are on the ready queue and are awaiting a VP on which to run.

Если есть потоки HDR, то не хватает ресурсов VP (скорее всего VP CPU).

С уважением,
Вадим.
...
Рейтинг: 0 / 0
04.05.2011, 19:19
    #37246173
victor16
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
резкое снижение производительности при использовании HDR
Денис_88вывод команды onstat -P

Totals: 5500000 422993 2253524 2823483 11

Percentages:
Data 40.97
Btree 7.69
Other 51.34

Buffer pool page size: 12288
partnum total btree data other dirty
0 87867 0 0 87867 0
62914561 3 0 2 1 0
62914562 130 0 130 0 0

Totals: 88000 0 132 87868 0

Percentages:
Data 0.15
Btree 0.00
Other 99.85

Buffer pool page size: 16384
partnum total btree data other dirty
0 32997 0 0 32997 0
61865985 3 0 2 1 0

Totals: 33000 0 2 32998 0

Percentages:
Data 0.01
Btree 0.00
Other 99.99



что хранится в Other?
Если уж речь зашла о команде onstat -P, то есть три вещи, на которые надо обратить внимание в выводе этой команды.
1) Первая строка (partnum 0), число в поле 'other' показывает количество неиспользуемых страниц в буферном пуле, оно должно быть значительно меньше, чем значения других полей. Сохраняющееся в течении длительного периода высокое значение в этом поле указывает на то, что можно уменьшить количество буферов без особого ущерба для производительности. Однако, чтобы быть полностью уверенным в своих выводах, это надо проверить в моменты пиковой нагрузки (я солидарен с Василием)
2) Totals в конце страницы. В "правильной" OLTP/DSS системе нормальным считается соотношение 60-80% data pages, 15-35% index (BTree) pages и малое значение "other". Естественно, что в DW-системах с небольшим количеством индексов это соотношение будет другим. Нужно иметь в виду, что для старых систем (7.3 и 9.2), если Btree выше 60%, это может свидетельствовать о наличии старого "buffer aging bug".
3) Каждая строка с указанием partnum. Эта информация может использоваться для вычисления часто используемых таблиц с целью их последующего фрагментирования для распределения нагрузки от параллельного сканирования. Также в этой строке можно вычислить таблицы небольшого размера, но очень часто используемые в течении рабочего дня, с целью сделать их резидентными, правда, для новых версий это уже неактуально, поскольку сервер сам решает вопрос о резидентности таблиц и индексов.
...
Рейтинг: 0 / 0
05.05.2011, 10:58
    #37246807
klepa
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
резкое снижение производительности при использовании HDR
М.б. я невнимательно читал, но какая версия сервера Informix и ОС?
...
Рейтинг: 0 / 0
05.05.2011, 14:43
    #37247456
cpr
cpr
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
резкое снижение производительности при использовании HDR
GVF112GVFcprGVF112GVF,

т.е. я правильно понимаю, что когда запускаем onstat -g rea
, то потоков HDR не должно быть видно?
если они есть, то они чего то ждут?

The onstat -g rea command displays the threads that are on the ready queue and are awaiting a VP on which to run.

Если есть потоки HDR, то не хватает ресурсов VP (скорее всего VP CPU).

С уважением,
Вадим.

позвольте еще вопрос плиз.

по команде
onstat -g con |grep drcb_bqf

я вижу нить репликации ожидающую условие.
она в этом выводе присутствует всегда.
я правлиьно понимаю, что если waittime > 0 то это плохо?

и еще интересно в каких единицах этот waittime - в секундах?
...
Рейтинг: 0 / 0
05.05.2011, 22:44
    #37248460
GVF112GVF
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
резкое снижение производительности при использовании HDR
cprGVF112GVFпропущено...


The onstat -g rea command displays the threads that are on the ready queue and are awaiting a VP on which to run.

Если есть потоки HDR, то не хватает ресурсов VP (скорее всего VP CPU).

С уважением,
Вадим.

позвольте еще вопрос плиз.

по команде
onstat -g con |grep drcb_bqf

я вижу нить репликации ожидающую условие.
она в этом выводе присутствует всегда.
я правлиьно понимаю, что если waittime > 0 то это плохо?

и еще интересно в каких единицах этот waittime - в секундах?

Насколько Я помню в секундах ... :)
http://publib.boulder.ibm.com/infocenter/idshelp/v117/topic/com.ibm.adref.doc/ids_adr_0520.htm

onstat -g con |grep drcb_bqf

Thread waiting for buffer to show up on full Data Replication buffer queue.
Mutex "drcb_bqf" - the latch on the full replication buffer queue (by full this means that the buffer has data in it).

PS: To discover the session associated with the thread ID that is waiting on the condition, execute the following SQL statement against the sysmaster database, replacing the question mark (?) with the thread ID obtained from the onstat -g con output.
SELECT sid FROM rstcb WHERE tid = ?
This will return the session ID for the thread waiting on the condition. It is now possible to analyze the thread at the process level by using the process ID (pid) for the session.

С уважением,
Вадим Головский.
...
Рейтинг: 0 / 0
06.05.2011, 11:35
    #37249243
яфшуеі
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
резкое снижение производительности при использовании HDR
GVF112GVFНасколько Я помню в секундах ... :)
http://publib.boulder.ibm.com/infocenter/idshelp/v117/topic/com.ibm.adref.doc/ids_adr_0520.htm

onstat -g con |grep drcb_bqf

Thread waiting for buffer to show up on full Data Replication buffer queue.
Mutex "drcb_bqf" - the latch on the full replication buffer queue (by full this means that the buffer has data in it).

PS: To discover the session associated with the thread ID that is waiting on the condition, execute the following SQL statement against the sysmaster database, replacing the question mark (?) with the thread ID obtained from the onstat -g con output.
SELECT sid FROM rstcb WHERE tid = ?
This will return the session ID for the thread waiting on the condition. It is now possible to analyze the thread at the process level by using the process ID (pid) for the session.

С уважением,
Вадим Головский.

А теперь вернемся к изначальной проблеме - снижению производительности при выполнении некоего расчета.
Если заполнен буфер репликации а сессия нужно писать в лог - имеем что?
Правильно, имеем ожидание записи в лог журнал, тобишь в буфер лог журнала - определяется более простым и понятным
onstat -u.

Зная, что это происходит при включенном HDR можно сделать выводы:
1. тормозит сеть
2. тормозит железо на HDR
3. тормозит IDS на HDR
...

Сеть - проверяем время отклика и т.п.
Железо - чел. написал, что часть железа послабее.
IDS - смотрим количество каких ISAM операций увеличивается, либо анализируем лог.
"интенсивный" DELETE/UPDATE применяется на HDR дольше чем теже инсерты.
Если тормозит таки IDS и выявили на каких операторах - по логу/трассе и т.п. вычисляем
на каких это операторах "отчета".

Но, по описанию есть и вторая сторона проблемы - длительное выполнение к.т. при включенном HDR
Как по мне это чаще всего связано со слабой проихводительностью HDR сервера(железа).

Ну и сам обращающийся, говорит, что система высоконагруженная.
Чем определяется эта высонагруженность?
Во время к.т. как с использованием ресурсов на HDR?

Кстати, по поводу в 2 раза дольше - простая математика.
мы имеем изначально к.т. 1 раз в минуту продолжительностью 0-1 сек. и время расчета 1 едининца.
При включенном HDR мы имеем время выполнения к.т. 60 сек. при интервале 60 сек. и время выполнения расчета 2 ед.
Т.е. получается, что транзакции 60 сек. работают и 60 сек. стоят. в статусе C
Все логично, причина - долгое выполнение к.т. при включенной репликации.
Для выяснения причин этого, нужно как минимум смотерть на работу HDR сервера, предоставленной инфы мало.
...
Рейтинг: 0 / 0
06.05.2011, 19:16
    #37250228
GVF112GVF
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
резкое снижение производительности при использовании HDR
яфшуеіGVF112GVFНасколько Я помню в секундах ... :)
http://publib.boulder.ibm.com/infocenter/idshelp/v117/topic/com.ibm.adref.doc/ids_adr_0520.htm

onstat -g con |grep drcb_bqf

Thread waiting for buffer to show up on full Data Replication buffer queue.
Mutex "drcb_bqf" - the latch on the full replication buffer queue (by full this means that the buffer has data in it).

PS: To discover the session associated with the thread ID that is waiting on the condition, execute the following SQL statement against the sysmaster database, replacing the question mark (?) with the thread ID obtained from the onstat -g con output.
SELECT sid FROM rstcb WHERE tid = ?
This will return the session ID for the thread waiting on the condition. It is now possible to analyze the thread at the process level by using the process ID (pid) for the session.

С уважением,
Вадим Головский.

А теперь вернемся к изначальной проблеме - снижению производительности при выполнении некоего расчета.
Если заполнен буфер репликации а сессия нужно писать в лог - имеем что?
Правильно, имеем ожидание записи в лог журнал, тобишь в буфер лог журнала - определяется более простым и понятным
onstat -u.

Зная, что это происходит при включенном HDR можно сделать выводы:
1. тормозит сеть
2. тормозит железо на HDR
3. тормозит IDS на HDR
...

Сеть - проверяем время отклика и т.п.
Железо - чел. написал, что часть железа послабее.
IDS - смотрим количество каких ISAM операций увеличивается, либо анализируем лог.
"интенсивный" DELETE/UPDATE применяется на HDR дольше чем теже инсерты.
Если тормозит таки IDS и выявили на каких операторах - по логу/трассе и т.п. вычисляем
на каких это операторах "отчета".

Но, по описанию есть и вторая сторона проблемы - длительное выполнение к.т. при включенном HDR
Как по мне это чаще всего связано со слабой проихводительностью HDR сервера(железа).

Ну и сам обращающийся, говорит, что система высоконагруженная.
Чем определяется эта высонагруженность?
Во время к.т. как с использованием ресурсов на HDR?

Кстати, по поводу в 2 раза дольше - простая математика.
мы имеем изначально к.т. 1 раз в минуту продолжительностью 0-1 сек. и время расчета 1 едининца.
При включенном HDR мы имеем время выполнения к.т. 60 сек. при интервале 60 сек. и время выполнения расчета 2 ед.
Т.е. получается, что транзакции 60 сек. работают и 60 сек. стоят. в статусе C
Все логично, причина - долгое выполнение к.т. при включенной репликации.
Для выяснения причин этого, нужно как минимум смотерть на работу HDR сервера, предоставленной инфы мало.

Игорь,
что-то Я не понял - каким боком ты меня цетировать начал? К чему это все ?!

С уважением,
Вадим
...
Рейтинг: 0 / 0
10.05.2011, 11:32
    #37252348
Денис_88
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
резкое снижение производительности при использовании HDR
всем спасибо

проблема решилась включением параметра RTO_SERVER_RESTART в 60.Теперь к.т. идет по заполнению и продолжается 1-2сек.Видимо блокировка транзакций во время к.т. не исчезла.
...
Рейтинг: 0 / 0
10.05.2011, 12:35
    #37252476
victor16
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
резкое снижение производительности при использовании HDR
Денис_88всем спасибо

проблема решилась включением параметра RTO_SERVER_RESTART в 60.Теперь к.т. идет по заполнению и продолжается 1-2сек.Видимо блокировка транзакций во время к.т. не исчезла.
RTO_SERVER_RESTART = 60
мне кажется это слишком жесткие условия. Следует помониторить, и если сервер самостоятельно будет уменьшать значения lru_min_dirty и lru_max_dirty, лучше будет увеличить.
...
Рейтинг: 0 / 0
Форумы / Informix [игнор отключен] [закрыт для гостей] / резкое снижение производительности при использовании HDR / 22 сообщений из 22, страница 1 из 1
Целевая тема:
Создать новую тему:
Автор:
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]