powered by simpleCommunicator - 2.0.56     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Informix [игнор отключен] [закрыт для гостей] / "Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
25 сообщений из 56, страница 1 из 3
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36043066
IDS admin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
День добрый.

Есть БД на IDS 7.31 на SCO OSR 507. Трудится над OLTP 24х7. До 20ти запросов в секунду. Все запросы простые: выборка по PK, insert одной записи, update по индекс. полю.

Все бы хорошо, но БД начала периодически и без явных причин "подвисать". Т.е. в один прекрасный момент все приложения, которые работают с базой, блокируют свое дальнейшее выполнение при любом запросе на изменение данных в БД. Затем все одновременно (с точностью до 0.01 сек) продолжают свою работу.
Т.е. выглядит это примерно так:
1) что-то случается с БД в 12:00:00
2) С 12:00:00 по 12:00:05 все приложения делают запрос к БД и подвисают на нем.
3) С 12:00:05 по 12:00:25 вся система парализована.
4) В 12:00:25 все приложения отвисают.

Такие вещи происходят до 10 раз в сутки. В online.log только записи о КТ (0-2 сек), окончании очередного журнала и о бекапе журналов (2-7 сек).

База под репликацией HDR (!).

Вопроса насчет этого безобразия 2:
1) Кто-нибудь на основании этого описания и своего опыта может предложить возможную причину? Буду крайне признателен.
2) Как и чем мне вычислить такую ситуацию. Предполагаю, что нужно запустить какое-то периодическое считование счетчиков IDS и ОС, но не знаю что именно... Еще этим мониторингом нельзя мешать работе самой системы.

Вот еще: создается впечатление, что такие зависания наиболее вероятны после запроса UPDATE на несколько тыс. записей.

Заранее всем спасибо за помощь!
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36043299
АнатоЛой
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
IDS admin
Есть БД на IDS 7.31

Более точно версию, пожалуйста.

IDS admin
блокируют свое дальнейшее выполнение при любом запросе на изменение данных в БД.
Затем все одновременно (с точностью до 0.01 сек) продолжают свою работу.
...
Такие вещи происходят до 10 раз в сутки. В online.log только записи о КТ (0-2 сек), окончании очередного журнала и о бекапе журналов (2-7 сек).
База под репликацией HDR (!).


Описанные остановки - достаточно яркий признак. И обычно это чекпоинт - но слишком уж период остановки долгий. Репликация - вполне вероятно - но нужно явно больше информации.
1. Проверяли ли следующее: читающие запросы из какой-нибудь утилиты (dbaccess, eSQLEditor, ...) в моменті зависаний отрабатывают нормально?
2. Проверяли-ли состояние репликации onstat -g dri? (Хотя в online.log по Вашим словам ничего подозрительного. Отсюда следствие №1 "Не пересказівайте своими словами то, что можете взять из системы" (почти (с) ЧаВО)

IDS admin
Как и чем мне вычислить такую ситуацию. Предполагаю, что нужно запустить какое-то периодическое считование счетчиков IDS и ОС, но не знаю что именно... Еще этим мониторингом нельзя мешать работе самой системы.

Как минимум, периодический onstat: работать должен с памятью, объём информации сохраняемый на винчестер достаточно небольшой при разумном пользовании. Даже если вы сделаете вручную в нужные моменты: до начала проблемы, в период зависания и после отвисания - уже неплохо.

IDS admin
Вот еще: создается впечатление, что такие зависания наиболее вероятны после запроса UPDATE на несколько тыс. записей.

Подумайте, можете ли воспроизвести ситуацию либо определить моменты выполнения таких апдейтов для пристального слежения за системой.

10 раз в сутки на полчаса - это много - имхо, не самое время переживать о том, "чтобы мониторинг чего-нить там не затормозил" (хотя позаботиться - по мере возможности - стоит...).
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36043322
АнатоЛой
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Следствие №2: почитайте "Как правиьно задвать вопросы" хотя юы ПОСЛЕ того, как спадёт горячка.

№2: online.log в архив - и сюда в аттач.

№3: Поскольку у Вас HDR - online.log с HDR - тоже сюда.

№4: HDR используется только как резервный - или используется сессиями для получения данных?
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36043443
Фотография Daugava
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ну не на полчаса, а на 25 секунд.
Возможно хватит обычного onstat -u в момент подвисания, для того чтобы увидеть, кого все ждут.
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36043460
Алексан
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
IDS admin...Все бы хорошо, но БД начала периодически и без явных причин "подвисать". Т.е. в один прекрасный момент все приложения, которые работают с базой, блокируют свое дальнейшее выполнение при любом запросе на изменение данных в БД. Затем все одновременно (с точностью до 0.01 сек) продолжают свою работу...

Вопроса насчет этого безобразия 2:
1) Кто-нибудь на основании этого описания и своего опыта может предложить возможную причину? Буду крайне признателен...
Вот еще: создается впечатление, что такие зависания наиболее вероятны после запроса UPDATE на несколько тыс. записей... Похоже на ожидание чекпоинта (контрольной точки, как Вы его называете). Также похоже на недостаточность размера физического журнала (если он заполняется на 75%, то инициируется чекпоинт).
Желательно увидеть фрагмент online.log'а, охватывающий несколько таких зависаний, конфигурационный файл (обычно $INFORMIXDIR/etc/onconfig) или, как минимум, значение конф. параметра CKPTINTVL и выход onstat -l (идеально в момент зависания).
К слову, onstat не замедлит работу Вашей системы.
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36043999
vasilis
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
АлексанIDS adminВот еще: создается впечатление, что такие зависания наиболее вероятны после запроса UPDATE на несколько тыс. записей...
Похоже на ожидание чекпоинта (контрольной точки, как Вы его называете).
Поддерживаю Александра.
Инициируется КТ, все транзакции приостанавливаются, но алгоритм старых версий IDS не может приостановить ВСЕ текущие транзакции - продолжает работать та, в которой выполняется "критическая секция кода" (по доке). Сюда относятся, в том числе, и транзакции, которые ведут активную запись (вот вам и Update нескольких тысяч записей). Пока эта транзакция не закончит свое дело. все будут стоять и ждать.
Ранее этого не наблюдалось, скорее всего, из-за того, что объемы UPDATE были меньше (таблицы со временем разрослись или пользователей стало больше). Если диагноз подтвердится - методі лечения предложим.
Второй причиной может быть блокировка какой-то ключевой таблицы, с которой работают все приложения (пользователи) и которую "прихватывает" тот самый update.
Нужен onstat -p за период активной работы (1-2 часа) или периодический просмотр блокировок или запрос по ожиданиям на блокировках по таблицам. Если не знаете как - спросите.
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36044112
АнатоЛой
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
DaugavaНу не на полчаса, а на 25 секунд.
Возможно хватит обычного onstat -u в момент подвисания, для того чтобы увидеть, кого все ждут.
Мда, спасибо, облажался (с)
Тогда и про контрольную точку можно подумать.
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36044131
АнатоЛой
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
vasilisПоддерживаю Александра.
Инициируется КТ, все транзакции приостанавливаются, но алгоритм старых версий IDS не может приостановить ВСЕ текущие транзакции - продолжает работать та, в которой выполняется "критическая секция кода" (по доке).

IDS adminТакие вещи происходят до 10 раз в сутки. В online.log только записи о КТ (0-2 сек), окончании очередного журнала и о бекапе журналов (2-7 сек).

vasilis, а что, в этом случае длительность КТ измеряется от момента начала непосредственно записи на диск, а не от момента начала всего процесса? Или делаем допуск на недостаточную внимательность IDS admin при чтении online.log?
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36044495
IDS admin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Спасибо за советы. Пойду осмыслять)

Вот доп. информация:

onstat -g dri:
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
Informix Dynamic Server Version 7.31.UC5    -- On-Line (Prim) -- Up 7 days 09:16:20 -- 704512 Kbytes

Data Replication:
  Type         State        Paired server        Last DR CKPT (id/pg)
  primary      on           ol37                    159686 / 23184

  DRINTERVAL   20
  DRTIMEOUT    30
  DRAUTO       0
  DRLOSTFOUND  /usr/informix/etc/dr.lostfound


Последнее зависание произошло
Код: plaintext
1.
с 18:15:54
по18:16:14

Записи в online.log PRIMARY:
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
18:14:14  Logical Log 159181 Complete.
18:14:16  Checkpoint Completed:  duration was 0 seconds.
18:14:17  Logical Log 159181 - Backup Started
18:14:19  Logical Log 159181 - Backup Completed
18:14:47  Checkpoint Completed:  duration was 0 seconds.
18:15:19  Checkpoint Completed:  duration was 1 seconds.
18:15:48  Logical Log 159182 Complete.
18:15:51  Logical Log 159182 - Backup Started
18:15:51  Checkpoint Completed:  duration was 2 seconds.
18:15:52  Logical Log 159182 - Backup Completed
18:16:22  Checkpoint Completed:  duration was 0 seconds.
18:16:53  Checkpoint Completed:  duration was 1 seconds.
18:17:24  Checkpoint Completed:  duration was 1 seconds.
18:17:44  Logical Log 159183 Complete.
18:17:48  Logical Log 159183 - Backup Started
18:17:50  Logical Log 159183 - Backup Completed
18:17:55  Checkpoint Completed:  duration was 1 seconds.


Записи в online.log SECONDARY:
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
18:12:50  Checkpoint Completed:  duration was 7 seconds.
18:13:22  Checkpoint Completed:  duration was 7 seconds.
18:13:53  Checkpoint Completed:  duration was 7 seconds.
18:14:23  Checkpoint Completed:  duration was 7 seconds.
18:14:53  Checkpoint Completed:  duration was 6 seconds.
18:15:28  Checkpoint Completed:  duration was 9 seconds.
 18:16:14  Checkpoint Completed:  duration was 22 seconds. 
18:16:30  Checkpoint Completed:  duration was 8 seconds.
18:17:08  Checkpoint Completed:  duration was 13 seconds.
18:17:29  Checkpoint Completed:  duration was 5 seconds.
18:18:03  Checkpoint Completed:  duration was 7 seconds.
18:18:35  Checkpoint Completed:  duration was 8 seconds.
18:19:01  Checkpoint Completed:  duration was 3 seconds.
18:19:30  Checkpoint Completed:  duration was 2 seconds.
18:20:01  Checkpoint Completed:  duration was 2 seconds.

Не могу понять, почему чекпойнты на read-only сервере дольше чем на основном.
да и 22 секунды - это как то очень круто.
Время окончания совпадает с временем "отвисания". И длительность похожа.

Может как-то связано...
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36044515
АнатоЛой
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
IDS adminНе могу понять, почему чекпойнты на read-only сервере дольше чем на основном.
да и 22 секунды - это как то очень круто.
Время окончания совпадает с временем "отвисания". И длительность похожа.

Может как-то связано...
Таки Александр и vasilis были правы.
Дальше нужно разбираться с железом, ОС и конфигом secondary...
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36044532
IDS admin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
2 АнатоЛой

АнатоЛой1. Проверяли ли следующее: читающие запросы из какой-нибудь утилиты (dbaccess, eSQLEditor, ...) в моменті зависаний отрабатывают нормально?
Не могу сказать. Нужно "ловить" момент и запускать читающую утилиту. Как это сделать - ума не приложу.

АнатоЛой
Подумайте, можете ли воспроизвести ситуацию либо определить моменты выполнения таких апдейтов для пристального слежения за системой.

Нет, никак. Данные генерируются "на лету". Много уникальных параметров. Чтобы воспроизвести реальные условия нужно очень большой стенд собирать. А синтетические тесты и бенчмарки тут, боюсь, не помогут, т.к. ни в одном из них не наблюдалось такое поведение.

АнатоЛой
№4: HDR используется только как резервный - или используется сессиями для получения данных?
Насколько мне известно - только как резерв. Но я это еще проверю.
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36044538
IDS admin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
АнатоЛой,

АнатоЛойТаки Александр и vasilis были правы.
Дальше нужно разбираться с железом, ОС и конфигом secondary...

А почему тогда зависания не наблюдаются, когда на Secondary проходит менее длительный чекпойнт?

Например, когда он был
Код: plaintext
18:17:08  Checkpoint Completed:  duration was 13 seconds.
никакого зависания на 13 секунд не было.
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36044544
IDS admin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
DaugavaВозможно хватит обычного onstat -u в момент подвисания, для того чтобы увидеть, кого все ждут.
Да я бы с радостью, но не знаю как мне это сделать непосредственно в момент подвисания. Только если делать его постоянно, раз в 5-10 секунд.
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36044573
IDS admin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
2 vasilis
Thx.

vasilisПоддерживаю Александра.
Инициируется КТ, все транзакции приостанавливаются, но алгоритм старых версий IDS не может приостановить ВСЕ текущие транзакции - продолжает работать та, в которой выполняется "критическая секция кода" (по доке). Сюда относятся, в том числе, и транзакции, которые ведут активную запись (вот вам и Update нескольких тысяч записей). Пока эта транзакция не закончит свое дело. все будут стоять и ждать.
Ранее этого не наблюдалось, скорее всего, из-за того, что объемы UPDATE были меньше (таблицы со временем разрослись или пользователей стало больше). Если диагноз подтвердится - методі лечения предложим.
Второй причиной может быть блокировка какой-то ключевой таблицы, с которой работают все приложения (пользователи) и которую "прихватывает" тот самый update.
Нужен onstat -p за период активной работы (1-2 часа) или периодический просмотр блокировок или запрос по ожиданиям на блокировках по таблицам.

А разве КТ на Secondary сервере влияет на работу Primary? Ведь на Primary все КТ проходят быстро, а не 2-25 сек, как на Secondary.

Сорри, возможно я не совсем понятно написал. Тот большой update, о котором идет речь, успевает закончится до зависаний за несколько минут. Иногда зависания вообще нельзя связать с этим update.

Насчет блокировки ключевой таблицы - это вряд ли, т.к. подвисают ф-и разных приложений, работающие с разными таблицами. Там простые запросы, триггеров нет.

onstat -p сделаю. Как лучше делать? Обнулить один раз (onstat -z) и через 1 час сделать onstat -p, либо за 1 час сделать N onstat-p и onstat-z?

Если не знаете как - спросите.
Как сделать периодический просмотр блокировок или запрос по ожиданиям на блокировках по таблицам? )
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36044576
АнатоЛой
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
IDS admin
Код: plaintext
1.
Informix Dynamic Server Version 7.31.UC5    -- On-Line (Prim) -- Up 7 days 09:16:20 -- 704512 Kbytes


Вместо UС5 что-нить побольше поставить не хотите-ли (по памяти, как минимум UD8 был)? Можно, конечно, сначала пошерстить и в перечне пофиксеных багов...
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36044591
АнатоЛой
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
IDS admin
onstat -p сделаю. Как лучше делать? Обнулить один раз (onstat -z) и через 1 час сделать onstat -p, либо за 1 час сделать N onstat-p и onstat-z?


Обнулить один раз (onstat -z) и в crontab повесить регулярный раз в 1 мин onstat -p с приписыванием имени файла даты-времени.

IDS admin
Как сделать периодический просмотр блокировок или запрос по ожиданиям на блокировках по таблицам? )
аналогично onstat -k - и в кронтаб
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36044600
IDS admin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
АнатоЛойIDS admin
Код: plaintext
1.
Informix Dynamic Server Version 7.31.UC5    -- On-Line (Prim) -- Up 7 days 09:16:20 -- 704512 Kbytes


Вместо UС5 что-нить побольше поставить не хотите-ли (по памяти, как минимум UD8 был)? Можно, конечно, сначала пошерстить и в перечне пофиксеных багов...

Хотим. Но не можем к сожалению. Тем более планируем вообще уходить со SCO и пересесть на 11.50 под Linux.
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36044604
IDS admin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
АнатоЛой
Обнулить один раз (onstat -z) и в crontab повесить регулярный раз в 1 мин onstat -p с приписыванием имени файла даты-времени.

аналогично onstat -k - и в кронтаб

Спасибо!
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36044613
IDS admin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Всем спасибо за советы.

Теперь есть четкое понимание:
Зависания происходят в тот же момент, что и начало checkpoint'а на Secondary (!!!) сервере.
Зависания заканчиваются одновременно с checkpoint'ом на Secondary сервере.
Все с точностью до 0.5 сек. (время ИМХО по разному округляется в трассах)

Теперь вопросы,
1) что из этого причина, а что следствие (зависания / долгие checkpoint'ы)? Либо эти оба факта есть следствия 3ей проблемы?
2) Почему так долго делаются checkpoint'ы на Secondary?
3) Как checkpoint'ы Secondary блокируют транзакции на Primary?
4) И главное. Если дело все-таки в checkpoint'ах на Secondary, то как их ускорить? Там неплохой сервер, корзина на 15 дисков, нормальный контроллер с кешем (150 МБ чтение, 360 запись).
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36044783
АнатоЛой
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
IDS admin4) И главное. Если дело все-таки в checkpoint'ах на Secondary, то как их ускорить? Там неплохой сервер, корзина на 15 дисков, нормальный контроллер с кешем (150 МБ чтение, 360 запись).

"Хороший сервер" - это ВСЕГДА относительно :). Вы не так уж много рассказывали про нагрузку - только про "20 запросов в секунду" (как Вы их, кстати, считали?), "выборка по PK, insert одной записи, update по индекс. полю.". Реальный объём изменяемых и получаемых данных всё так же у нас в предположениях. "onstat -p" мы так и не увидели :) :(. Конфиги с обоих серверов тоже.
Стесняетесь? Боитесь? ОК. :(

Сравнивайте железо и конфиги на двух серверах: первичном и вторичном. НЕ хотите показывать весь конфиг - спрашивайте об отличиях конкретных параметров конфига или насколько важно такое-то и такое отличие в железе и настройках операционки и файловой системы. Сравнивайте onstat перичного и вторичного сервера.

Для разборок: параметры конфига CKPTINTVL, CLEANERS, DRINTERVAL, LOGBUFF, LOGSIZE, LOGFILES, LRUS, LRU_MIN_DIRTY, LRU_MAX_DIRTY, NUMAIOVPS, ONDBSPACEDOWN, PHYSBUFF, PHYSFILE.

Не помешает onstat -g iof, iov. Надеюсь, проверять скорость работы сетевого соединения между серверами не понадобится, а также не понадобится проверять, а не нагружен ли вторичный посторонней работой по отношению к Informix HDR :)

Кроме того, возникают типичные вопросы: допустим у первого сервера проблем нет, и всякие обыденные мелочи типа разделения физического журнала, логического журнала, и rootdbs уже имеются. Тем не менее, нормально ли вторичном сервере расположены чанки на дисках, нормально ли работает дисковая система, чанки используются cooked, raw, ...
Вопросов и идей много - поможет ли оно Вам без наличия нормальной обратной связи?
Удачи. %)
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36045022
Фотография Тан
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
IDS admin
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
18:14:16  Checkpoint Completed:  duration was 0 seconds.
18:14:47  Checkpoint Completed:  duration was 0 seconds.
18:15:19  Checkpoint Completed:  duration was 1 seconds.
18:15:51  Checkpoint Completed:  duration was 2 seconds.
18:16:22  Checkpoint Completed:  duration was 0 seconds.
18:16:53  Checkpoint Completed:  duration was 1 seconds.
18:17:24  Checkpoint Completed:  duration was 1 seconds.
18:17:55  Checkpoint Completed:  duration was 1 seconds.

а почему у вас чекпойнты так часто?
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36045059
IDS admin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
ТанIDS admin
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
18:14:16  Checkpoint Completed:  duration was 0 seconds.
18:14:47  Checkpoint Completed:  duration was 0 seconds.
18:15:19  Checkpoint Completed:  duration was 1 seconds.
18:15:51  Checkpoint Completed:  duration was 2 seconds.
18:16:22  Checkpoint Completed:  duration was 0 seconds.
18:16:53  Checkpoint Completed:  duration was 1 seconds.
18:17:24  Checkpoint Completed:  duration was 1 seconds.
18:17:55  Checkpoint Completed:  duration was 1 seconds.

а почему у вас чекпойнты так часто?

Предполагаю, что это из-за CKPTINTVL = 0. Хотя судя по документации
IBMСервер баз данных также может производить обработку контрольных точек при других условиях, например, когда физический журнал заполнится на 75 процентов.
но интервал в обеих IDS строго 30 секунд. Особенность 7.31?
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36045243
IDS admin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
2 АнатоЛой, 2 ALL

Итак, поехали:

onstat -p за 1 час 30 минут работы
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
Informix Dynamic Server Version 7.31.UC5    -- On-Line (Prim) -- Up 8 days 01:05:34 -- 704512 Kbytes

Profile
dskreads pagreads bufreads %cached dskwrits pagwrits bufwrits %cached
23986275 32268974 482024528 95.02   4260237  7171281  9592173  55.59

isamtot  open     start    read     write    rewrite  delete   commit   rollbk
220858436 837859   3416107  106643894 305615   1713517  564      1806322  0

gp_read  gp_write gp_rewrt gp_del   gp_alloc gp_free  gp_curs
0        0        0        0        0        0        0

ovlock   ovuserthread ovbuff   usercpu  syscpu   numckpts flushes
0        0            0        3024.63  1419.28  173      346

bufwaits lokwaits lockreqs deadlks  dltouts  ckpwaits compress seqscans
2146488  1593     289396202 0        0        731      45232    15195

ixda-RA  idx-RA   da-RA    RA-pgsused lchwaits
5962451  5        12167759 17942272   1603116
Это примерно в 3 раза меньшая загрузка, чем на пиках.

Сервера PRIMARY и SECONDARY
2 одинаковые машины (ОС, параметры ядра, onconfig, внутренние диски/контроллер). Различие есть только дисковой подсистеме, на которых работает информикс:
на Primary SAS и 256 МБ кеш
на Secondary SCSII U320 и 512 МБ кеш.
На обоих серваках по 8 Core 2. По 4 ГБ ОП.
Чанки везде - это RAW, под ними разделы дисков SCO (т.е. SCO видит диски, сконфигуренные на контроллере RAID 1+ 0, они fdisk'ом побиты на партиции, и каждая партиция затем побита на "разделы" divvy. Вот ссылки из /dev/r* - это и есть чанки. У всех, понятное дело crw-------)
Месяц назад текущий Secondary был Primary. Работал точно так же, как сейчас работает бывший Secondary.
Сеть между ними - это сеть только между ними (отдельные сетевухи у каждого из серваков воткнутые в один свитчик). Пинг в обе стороны < 1 ms. Скорость закачки файлов по FTP 9390.73 Kbytes/s (Primary - сервер, secondary - клиент). С сетью вроде все Ок. Почти все 100 МБит.
Secondary сервер ничем кроме информикса в ReadOnly не нагружен.

onconfig (одинаковый для обоих серверов приложил)
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36045371
IDS admin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
На всякий случай, 2 разных onstat -p. Для Prim и Sec. За онид и тот же промежуток времени.

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
Informix Dynamic Server Version 7.31.UC5    -- On-Line ( Prim ) -- Up 8 days 01:34:16 -- 704512 Kbytes

Profile
dskreads pagreads bufreads %cached dskwrits pagwrits bufwrits %cached
1550046  2931571  44241529 96.50   538317   1370041  1178393  54.32

isamtot  open     start    read     write    rewrite  delete   commit   rollbk
27492608 133817   425863   13396280 23381    221266   65       225289   0

gp_read  gp_write gp_rewrt gp_del   gp_alloc gp_free  gp_curs
0        0        0        0        0        0        0

ovlock   ovuserthread ovbuff   usercpu  syscpu   numckpts flushes
0        0            0        314.21   138.65   21       42

bufwaits lokwaits lockreqs deadlks  dltouts  ckpwaits compress seqscans
216061   214      31998008 0        0        98       3537     2537

ixda-RA  idx-RA   da-RA    RA-pgsused lchwaits
704200   0        496602   1200579    155030


Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
Informix Dynamic Server Version 7.31.UC5    -- Read-Only ( Sec ) -- Up 01:43:29 -- 704512 Kbytes

Profile
dskreads pagreads bufreads %cached dskwrits pagwrits bufwrits %cached
5580331  7578575  25914684 78.47   192594   452102   818567   76.47

isamtot  open     start    read     write    rewrite  delete   commit   rollbk
800453   1        0        36       0        0        0        0        0

gp_read  gp_write gp_rewrt gp_del   gp_alloc gp_free  gp_curs
0        0        0        0        0        0        0

ovlock   ovuserthread ovbuff   usercpu  syscpu   numckpts flushes
0        0            0        192.95   152.09   20       41

bufwaits lokwaits lockreqs deadlks  dltouts  ckpwaits compress seqscans
139742   0        0        0        0        0        21169    0

ixda-RA  idx-RA   da-RA    RA-pgsused lchwaits
0        0        4349555  4191666    451403

Видно, что Secondary читает с диска больше в 3.6 раза, а пишет меньше в 2.8 раза.
...
Рейтинг: 0 / 0
"Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
    #36045477
Алексан
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ТанIDS admin
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
18:14:16  Checkpoint Completed:  duration was 0 seconds.
18:14:47  Checkpoint Completed:  duration was 0 seconds.
18:15:19  Checkpoint Completed:  duration was 1 seconds.
18:15:51  Checkpoint Completed:  duration was 2 seconds.
18:16:22  Checkpoint Completed:  duration was 0 seconds.
18:16:53  Checkpoint Completed:  duration was 1 seconds.
18:17:24  Checkpoint Completed:  duration was 1 seconds.
18:17:55  Checkpoint Completed:  duration was 1 seconds.

а почему у вас чекпойнты так часто?Потому что сервер не настроен; как Вам, например, такое соотношение: размер одного журнала тр-й - 256 Мб (судя по конфигу, onstat -l он так и не показал; заметьте, и его хватает на 1,5-2 минуты...), а размер физического журнала - 32 Мб, и, кроме того, LRU_MIN_DIRTY/LRU_MAX_DIRTY - 20/30 и клинеров всего 8. Ещё и NUMAIOVPS не установлен - по-умолчанию используется 4 AIO VPs, кажется...). Соответственно, ему ничего не остаётся, как настроить чекпоинты как можно чаще - он и поставил в 0 (правда, тут уже сервер отказывается их делать чаще, чем раз в 30 секунд...)
...
Рейтинг: 0 / 0
25 сообщений из 56, страница 1 из 3
Форумы / Informix [игнор отключен] [закрыт для гостей] / "Подвисает" OLTP на IDS 7.31. Чем (и как) узнать причину?
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]