powered by simpleCommunicator - 2.0.59     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Informix [игнор отключен] [закрыт для гостей] / Длинный чек поинт
25 сообщений из 39, страница 1 из 2
Длинный чек поинт
    #34716065
KyRo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
У меня при бекапах возникает длинный чек поинт от 5 -30 мин .
При этом сервер все это время не отвечает .
Скажите из за чего это может быть ? Или как сделать что бы сервер хотя бы работал во время чек поинта !!
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34716075
KyRo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
 04 : 27 : 02   Level  0  Archive started on rootdbs, logdbs1, online
 04 : 27 : 43   Logical Log  92606  Complete, timestamp:- 1578923763 .
 04 : 27 : 43   Logical Log  92606  - Backup Started
 04 : 27 : 44   Logical Log  92606  - Backup Completed
 04 : 32 : 28   Checkpoint Completed:  duration was  0  seconds.
 04 : 32 : 28   Checkpoint loguniq  92607 , logpos 0x21a7018, timestamp: - 1578826567 

 04 : 32 : 28   Maximum server connections  88 
 04 : 33 : 39   Logical Log  92607  Complete, timestamp:- 1578764063 .
 04 : 33 : 40   Logical Log  92607  - Backup Started
 04 : 33 : 41   Logical Log  92607  - Backup Completed
 04 : 37 : 28   Checkpoint Completed:  duration was  0  seconds.
 04 : 37 : 28   Checkpoint loguniq  92608 , logpos 0x68f2a8, timestamp: - 1578692590 

 04 : 37 : 28   Maximum server connections  88 
 04 : 42 : 29   Checkpoint Completed:  duration was  0  seconds.
 04 : 42 : 29   Checkpoint loguniq  92608 , logpos 0x9f8430, timestamp: - 1578648667 

 04 : 42 : 29   Maximum server connections  88 
 05 : 14 : 58   Checkpoint Completed:  duration was  1649  seconds.
 05 : 14 : 58   Checkpoint loguniq  92608 , logpos 0xd3c5b8, timestamp: - 1578615931 

 05 : 14 : 58   Maximum server connections  88 
 05 : 15 : 04   Archive on rootdbs, logdbs1, online Completed.
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34716148
Алексан
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
KyRo
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
 04 : 27 : 02   Level  0  Archive started on rootdbs, logdbs1, online
 04 : 27 : 43   Logical Log  92606  Complete, timestamp:- 1578923763 .
 04 : 27 : 43   Logical Log  92606  - Backup Started
 04 : 27 : 44   Logical Log  92606  - Backup Completed
 04 : 32 : 28   Checkpoint Completed:  duration was  0  seconds.
 04 : 32 : 28   Checkpoint loguniq  92607 , logpos 0x21a7018, timestamp: - 1578826567 

 04 : 32 : 28   Maximum server connections  88 
 04 : 33 : 39   Logical Log  92607  Complete, timestamp:- 1578764063 .
 04 : 33 : 40   Logical Log  92607  - Backup Started
 04 : 33 : 41   Logical Log  92607  - Backup Completed
 04 : 37 : 28   Checkpoint Completed:  duration was  0  seconds.
 04 : 37 : 28   Checkpoint loguniq  92608 , logpos 0x68f2a8, timestamp: - 1578692590 

 04 : 37 : 28   Maximum server connections  88 
 04 : 42 : 29   Checkpoint Completed:  duration was  0  seconds.
 04 : 42 : 29   Checkpoint loguniq  92608 , logpos 0x9f8430, timestamp: - 1578648667 

 04 : 42 : 29   Maximum server connections  88 
 05 : 14 : 58   Checkpoint Completed:  duration was  1649  seconds.
 05 : 14 : 58   Checkpoint loguniq  92608 , logpos 0xd3c5b8, timestamp: - 1578615931 

 05 : 14 : 58   Maximum server connections  88 
 05 : 15 : 04   Archive on rootdbs, logdbs1, online Completed.
Это может быть из-за слабой подсистемы ввода/вывода, что можно определить по выходам onstat -F, onstat -g iov и onstat -g ioq или средставми операционной системы. Кстати, какая у Вас версия IDS и на какой платформе он работает? Может из-за маленького значения TAPEBLK - я обычно ставлю 256.
Скажите, из приведённого фрагмента следует, что чекпоинтов с 4:42 до 5:14 не было - это похоже на правду? А чекпоинты перед бэкапом и после него не были продолжительными?
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34716194
KyRo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
У меня стоит IDS 9.4 На плтформе Linux RH 4 EN

Linux ix1 2.6.9-5.ELsmp #1 SMP Wed Jan 5 19:30:39 EST 2005 i686 i686 i386

В основном длинный чек поинт возникает именно во время бекапа . Иногда бывает он
возникает и просто так по не понятным причинам , но это очень редко.

При бекапе же он возникает в 40% И состовляет от 3 х минут и до бесконечности .

АлексанСкажите, из приведённого фрагмента следует, что чекпоинтов с 4:42 до 5:14 не было - это похоже на правду? А чекпоинты перед бэкапом и после него не были продолжительными?

Чек поинт у нас да и впрочем везде ж так идут каждые пять минут . А то что вы тут видите это то что он начался 4:47 и длился до 5:14 .
Код: plaintext
 05 : 14 : 58   Checkpoint Completed:  duration was  1649  seconds.

Параметры TAPEBLK у меня такие


Код: plaintext
1.
2.
TAPEBLK          128               # Tape block size (Kbytes)
LTAPEBLK         32               # Log tape block size (Kbytes)
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34716245
KyRo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
У меня стоит IDS 9.4 На плтформе Linux RH 4 EN

Linux ix1 2.6.9-5.ELsmp #1 SMP Wed Jan 5 19:30:39 EST 2005 i686 i686 i386

В основном длинный чек поинт возникает именно во время бекапа . Иногда бывает он
возникает и просто так по не понятным причинам , но это очень редко.

При бекапе же он возникает в 40% И состовляет от 3 х минут и до бесконечности .

АлексанСкажите, из приведённого фрагмента следует, что чекпоинтов с 4:42 до 5:14 не было - это похоже на правду? А чекпоинты перед бэкапом и после него не были продолжительными?

Чек поинт у нас да и впрочем везде ж так идут каждые пять минут . А то что вы тут видите это то что он начался 4:47 и длился до 5:14 .
Код: plaintext
 05 : 14 : 58   Checkpoint Completed:  duration was  1649  seconds.

Параметры TAPEBLK у меня такие


Код: plaintext
1.
2.
TAPEBLK          128               # Tape block size (Kbytes)
LTAPEBLK         32               # Log tape block size (Kbytes)
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34716266
Чемберлен
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Сколько процессоров на сервере и какое значение NUMCPUVPs вы используете? Выложите также результаты onstat -u по ходу такого длинного чекпоинта.

Я такую ситуацию один раз уже видел...
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34716325
KyRo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Значение NUMCPUVPS
Код: plaintext
NUMCPUVPS        3                # Number of user (cpu) vps

На сервере 4 процессора и много памяти

Вот вывод команды топ

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
top -  10 : 40 : 34  up  1  day,   2 : 18 ,  15  users,  load average:  0 . 36 ,  1 . 33 ,  2 . 86 
Tasks:  246  total,    1  running,  245  sleeping,    0  stopped,    0  zombie
Cpu0  :   1 . 0 % us,   1 . 3 % sy,   0 . 0 % ni,  83 . 4 % id,  12 . 9 % wa,   0 . 3 % hi,   1 . 0 % si
Cpu1  :   1 . 0 % us,   2 . 0 % sy,   0 . 0 % ni,  72 . 2 % id,  23 . 2 % wa,   0 . 3 % hi,   1 . 3 % si
Cpu2  :   1 . 3 % us,   1 . 3 % sy,   0 . 0 % ni,  77 . 7 % id,  18 . 9 % wa,   0 . 3 % hi,   0 . 3 % si
Cpu3  :   0 . 7 % us,   1 . 3 % sy,   0 . 3 % ni,  80 . 7 % id,  16 . 3 % wa,   0 . 0 % hi,   0 . 7 % si
Cpu4  :   0 . 7 % us,   0 . 3 % sy,   0 . 0 % ni,  98 . 0 % id,   0 . 7 % wa,   0 . 3 % hi,   0 . 0 % si
Cpu5  :   0 . 3 % us,   0 . 3 % sy,   0 . 3 % ni,  97 . 4 % id,   1 . 7 % wa,   0 . 0 % hi,   0 . 0 % si
Cpu6  :   0 . 3 % us,   1 . 0 % sy,   1 . 0 % ni,  97 . 0 % id,   0 . 3 % wa,   0 . 0 % hi,   0 . 3 % si
Cpu7  :   0 . 7 % us,   0 . 3 % sy,   0 . 7 % ni,  98 . 0 % id,   0 . 0 % wa,   0 . 3 % hi,   0 . 0 % si
Mem:   4149144k total,  4144940k used,     4204k free,   162032k buffers
Swap:  2031608k total,    17092k used,  2014516k free,  3339968k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND


Оnstat -u могу показать какой счас . Когда будет следующий длинный чек поинт точно сказать не могу .
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34716345
Чемберлен
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
KyRoОnstat -u могу показать какой счас . Когда будет следующий длинный чек поинт точно сказать не могу .

Нужен в момент, когда вы наблюдаете длинный чекпоинт. Можно на cron раз в пять минут повесить и ждать...
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34716369
KyRo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ок буду ждать как только замечу сразу выложу.

Вот кстати кусок лога за вчера с длинным чек поинтом который возник просто так (не во время бекапа).
Я подозреваю из за того что я начал переливать по сети через фтп 40 гб бекап базы.

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
 17 : 09 : 01   Maximum server connections  73 
 17 : 14 : 01   Checkpoint Completed:  duration was  0  seconds.
 17 : 14 : 01   Checkpoint loguniq  92504 , logpos 0x25b9018, timestamp: - 1594254641 

 17 : 14 : 01   Maximum server connections  73 
 17 : 14 : 27   Logical Log  92504  Complete, timestamp:- 1594251437 .
 17 : 14 : 27   Logical Log  92504  - Backup Started
 17 : 14 : 28   Logical Log  92504  - Backup Completed
 17 : 19 : 02   Checkpoint Completed:  duration was  0  seconds.
 17 : 19 : 02   Checkpoint loguniq  92505 , logpos 0x1ffa018, timestamp: - 1594109209 

 17 : 19 : 02   Maximum server connections  73 
 17 : 19 : 30   Logical Log  92505  Complete, timestamp:- 1594085084 .
 17 : 19 : 31   Logical Log  92505  - Backup Started
 17 : 19 : 31   Logical Log  92505  - Backup Completed
 17 : 27 : 39   VP Notify mechanism incomplete after  5  minutes. This can be due to slo
w network file access. Will try  12  more times
 17 : 33 : 09   VP Notify mechanism incomplete after  5  minutes. This can be due to slo
w network file access. Will try  11  more times
 17 : 36 : 24   VP Notify mechanism completed
 17 : 36 : 24   Checkpoint Completed:  duration was  741  seconds.
 17 : 36 : 24   Checkpoint loguniq  92506 , logpos 0x218e0c8, timestamp: - 1593937129 

 17 : 36 : 24   Maximum server connections  88 
 17 : 36 : 25   Logical Log  92506  Complete, timestamp:- 1593884974 .
 17 : 36 : 26   Logical Log  92506  - Backup Started
 17 : 36 : 27   Logical Log  92506  - Backup Completed
 17 : 37 : 32   Logical Log  92507  Complete, timestamp:- 1593681712 .
 17 : 37 : 33   Logical Log  92507  - Backup Started
 17 : 37 : 33   Logical Log  92507  - Backup Completed
 17 : 40 : 28   Logical Log  92508  Complete, timestamp:- 1593528806 .
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34716582
Алексан
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
KyRoок буду ждать как только замечу сразу выложу.

Вот кстати кусок лога за вчера с длинным чек поинтом который возник просто так (не во время бекапа).
Я подозреваю из за того что я начал переливать по сети через фтп 40 гб бекап базы.

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
 17 : 09 : 01   Maximum server connections  73 
 17 : 14 : 01   Checkpoint Completed:  duration was  0  seconds.
 17 : 14 : 01   Checkpoint loguniq  92504 , logpos 0x25b9018, timestamp: - 1594254641 

 17 : 14 : 01   Maximum server connections  73 
 17 : 14 : 27   Logical Log  92504  Complete, timestamp:- 1594251437 .
 17 : 14 : 27   Logical Log  92504  - Backup Started
 17 : 14 : 28   Logical Log  92504  - Backup Completed
 17 : 19 : 02   Checkpoint Completed:  duration was  0  seconds.
 17 : 19 : 02   Checkpoint loguniq  92505 , logpos 0x1ffa018, timestamp: - 1594109209 

 17 : 19 : 02   Maximum server connections  73 
 17 : 19 : 30   Logical Log  92505  Complete, timestamp:- 1594085084 .
 17 : 19 : 31   Logical Log  92505  - Backup Started
 17 : 19 : 31   Logical Log  92505  - Backup Completed
 17 : 27 : 39   VP Notify mechanism incomplete after  5  minutes. This can be due to slo
w network file access. Will try  12  more times
 17 : 33 : 09   VP Notify mechanism incomplete after  5  minutes. This can be due to slo
w network file access. Will try  11  more times
 17 : 36 : 24   VP Notify mechanism completed
 17 : 36 : 24   Checkpoint Completed:  duration was  741  seconds.
 17 : 36 : 24   Checkpoint loguniq  92506 , logpos 0x218e0c8, timestamp: - 1593937129 

 17 : 36 : 24   Maximum server connections  88 
 17 : 36 : 25   Logical Log  92506  Complete, timestamp:- 1593884974 .
 17 : 36 : 26   Logical Log  92506  - Backup Started
 17 : 36 : 27   Logical Log  92506  - Backup Completed
 17 : 37 : 32   Logical Log  92507  Complete, timestamp:- 1593681712 .
 17 : 37 : 33   Logical Log  92507  - Backup Started
 17 : 37 : 33   Logical Log  92507  - Backup Completed
 17 : 40 : 28   Logical Log  92508  Complete, timestamp:- 1593528806 .
Выглядит как если один из VP не ответил на сигнал SIGNOTIFY - сигнал не дошел или VP висел... Я бы проверил параметры ядра системы, определяющие системные ресурсы (число открытых файлов, число семафоров и т.п.), и как они фактически используются - например, сколько открытых сетевых соединений. Интересно также взглянуть, не жаловалась ли операционная система на что-нибудь, например, на сетевой интерфейс...
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34716697
KyRo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Из параметров ядра изменялись следующие значения

Код: plaintext
1.
2.
3.
4.
5.
6.
kernel.core_uses_pid =  1 
kernel.shmmax =  409600000 
kernel.msgmnb =  131072 
kernel.sem =  250   32000   100   128 
kernel.shmall =  4194304 
kernel.msgmni =  200 

Все остальное осталось по умолчанию.



авторИнтересно также взглянуть, не жаловалась ли операционная система на что-нибудь, например, на сетевой интерфейс...

Нет по логам линукса нечего не обычного нет .
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34717663
Алексан
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
KyRoНет по логам линукса нечего не обычного нет .Тогда Вам остаётся следить за нитями, когда такие события случатся в следующий раз.
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34719066
Фотография Andron
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
KyRoок буду ждать как только замечу сразу выложу.

Вот кстати кусок лога за вчера с длинным чек поинтом который возник просто так (не во время бекапа).
Я подозреваю из за того что я начал переливать по сети через фтп 40 гб бекап базы.
...


Повторите переливание такого объема данных по FTP - и если опять получите длинный чекпоинт, то будет видно что дело вовсе не в информиксе. Возможно информикс конкурирует за ресурсы с каким то другим приложением (FTP или др.), отсюда и длинные чекпоинты.
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34719108
onstat-
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Andron KyRoок буду ждать как только замечу сразу выложу.

Вот кстати кусок лога за вчера с длинным чек поинтом который возник просто так (не во время бекапа).
Я подозреваю из за того что я начал переливать по сети через фтп 40 гб бекап базы.
...


Повторите переливание такого объема данных по FTP - и если опять получите длинный чекпоинт, то будет видно что дело вовсе не в информиксе. Возможно информикс конкурирует за ресурсы с каким то другим приложением (FTP или др.), отсюда и длинные чекпоинты.

Я уверен на 90%, что конкуренция идет за кеш файловой системы, при этом чанки лежат не на raw.
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34719781
cpr
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
cpr
Гость
А сам бэкап замедляется или нет?
У меня на семерке была такая проблема, сначала заметили, что чекпойнты резко увеличились, затем с ростом объемов заметили рекое замедление самого бэкапа. Лечится установкой недокументированного параметра CCFLAGS в 0x400000, но без согласования с суппортом Informix ставить его не рекомендуется.
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34719848
KyRo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
авторПовторите переливание такого объема данных по FTP - и если опять получите длинный чекпоинт, то будет видно что дело вовсе не в информиксе. Возможно информикс конкурирует за ресурсы с каким то другим приложением (FTP или др.), отсюда и длинные чекпоинты.


Повторял . Нечего нет . Каждый день переливаю таким образом (Правда тогда лил не по сети а просто делал мув с одного раздела на другой).
Эксперементировать к сожалению не могу -это живая система которая должна быть всегда доступна .

Чанки находятся на сырцах разделов.

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
Chunks
address  chunk/dbs  offset     size       free       bpages     flags pathname
685ea928  1       1      0            1000000      947308                 PO--  /dev/sda1
685eaab0  1        1     0            1000000      0                      MO--  /dev/sdc3
68e93718  2       2      0            1000000      999597                 PO--  /dev/sdc1
68e938a0  3       3      0            1000000      499947                 PO--  /dev/sdb1
68e94c58  3        3     0            1000000      0                      MD--  /dev/sdc2
68e93a28  4       4      0            1000000      19                     PO--  /dev/sdd1
68e93bb0  5       4      0            3900000      3                      PO-B  /dev/sdd2
68e93d38  6       4      0            3900000      0                      PO-B  /dev/sde1
68e94018  7       4      0            3900000      0                      PO-B  /dev/sdf1
68e941a0  8       4      0            3900000      12951                  PO-B  /dev/sdd3
68e94328  9       4      0            3900000      2827635                PO-B  /dev/sde2
68e944b0  10      4      0            3900000      0                      PO-B  /dev/sdf2
68e94638  11      4      0            3900000      0                      PO-B  /dev/sdd5
68e947c0  12      4      0            3900000      3899997                PO-B  /dev/sde3
68e94948  13      4      0            3900000      3899997                PO-B  /dev/sdf3
68e94ad0  14      2      0            1000000      999997                 PO--  /dev/sde5
  14  active,  32766  maximum


авторА сам бэкап замедляется или нет?

Точно сказать не могу . Но судя по последнему разу то нет с длинным чек поинтом он длился 50 мин.

А сегодня не было длинного чек поинта и он длился гораздо больше почти 1.5 часа
Код: plaintext
1.
2.
 04 : 43 : 27   Level  0  Archive started on rootdbs, logdbs1, online
 06 : 18 : 29   Archive on rootdbs, logdbs1, online Completed.
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34720298
onstat-
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
KyRo

Чанки находятся на сырцах разделов.

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
Chunks
address  chunk/dbs  offset     size       free       bpages     flags pathname
685ea928  1       1      0            1000000      947308                 PO--  /dev/sda1
685eaab0  1        1     0            1000000      0                      MO--  /dev/sdc3
68e93718  2       2      0            1000000      999597                 PO--  /dev/sdc1
68e938a0  3       3      0            1000000      499947                 PO--  /dev/sdb1
68e94c58  3        3     0            1000000      0                      MD--  /dev/sdc2
68e93a28  4       4      0            1000000      19                     PO--  /dev/sdd1
68e93bb0  5       4      0            3900000      3                      PO-B  /dev/sdd2
68e93d38  6       4      0            3900000      0                      PO-B  /dev/sde1
68e94018  7       4      0            3900000      0                      PO-B  /dev/sdf1
68e941a0  8       4      0            3900000      12951                  PO-B  /dev/sdd3
68e94328  9       4      0            3900000      2827635                PO-B  /dev/sde2
68e944b0  10      4      0            3900000      0                      PO-B  /dev/sdf2
68e94638  11      4      0            3900000      0                      PO-B  /dev/sdd5
68e947c0  12      4      0            3900000      3899997                PO-B  /dev/sde3
68e94948  13      4      0            3900000      3899997                PO-B  /dev/sdf3
68e94ad0  14      2      0            1000000      999997                 PO--  /dev/sde5
  14  active,  32766  maximum



По умолчанию Linux сырые устройства находятся на /dev/raw
где в выводе ls -al первая буква "с"

А то что у вас подключено называется блочные устройства.
в выводе ls -al для ваших устройств первая буква "b".

Для блочных устройств ядро по умолчанию использует кеш для операций ввода вывода.

Коственно использование кеша ОС можно проверить с помошью команды
sar -B , обращать внимание на столбец fault/s
Если его значение увеличивается прорционально росту ВВ базы значит
при операциях ВВ базы используется буферный кеш ОС.
В случае же использования настоящих raw ( с буквой 'c' ) значение fault/s
не будет зависить от обьема ВВ базы данных.
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34721325
onstat-
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
KyRo
А сегодня не было длинного чек поинта и он длился гораздо больше почти 1.5 часа
Код: plaintext
1.
2.
 04 : 43 : 27   Level  0  Archive started on rootdbs, logdbs1, online
 06 : 18 : 29   Archive on rootdbs, logdbs1, online Completed.


Интуиция мне подсказывает, что у Вас происходло(происходит) следующее:

В случае длиной контрольной точки ОС выганяет в своп разделяему память БД
и дает зеленый свет операциям ВВ бекапирования через дисковый кеш.

В случае же более быстрой контрольной точки бэкап идет медленне изза недостатка
памяти под дисковый кеш, зато за счет того, что разделяемая память находится в ОЗУ
контрольная точка проходит быстрее.


Без анализа onconfig и конфигурации железа и ОС это только предположения.

Интуиция != телепатия
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34725704
KyRo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
авторВ случае длиной контрольной точки ОС выганяет в своп разделяему память БД
и дает зеленый свет операциям ВВ бекапирования через дисковый кеш.

В случае же более быстрой контрольной точки бэкап идет медленне изза недостатка
памяти под дисковый кеш, зато за счет того, что разделяемая память находится в ОЗУ
контрольная точка проходит быстрее.


Возможно это именно так и происходит. Потому что происходят чек поинты при длительных операциях с дисками (В основном при записи на диск , а не чтения).
Можно ли сделать что бы приоритет доступа к дискам был у чек поинтов ?

авторБез анализа onconfig и конфигурации железа и ОС это только предположения.


Про железо могу сказать следующее :
Это 4 х Процессорный сервер IBM366 4 Gb Ram . База данных лежит на SCSI дисковой подсистеме

Насчет onconfig вот он :

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
102.
103.
104.
105.
106.
107.
108.
109.
110.
111.
112.
113.
114.
115.
116.
117.
118.
119.
120.
121.
122.
123.
124.
125.
126.
127.
128.
129.
130.
131.
132.
133.
134.
135.
136.
137.
138.
139.
140.
141.
142.
143.
144.
145.
146.
147.
148.
149.
150.
151.
152.
153.
154.
155.
156.
157.
158.
159.
160.
161.
162.
163.
164.
165.
166.
167.
168.
169.
170.
171.
172.
173.
174.
175.
176.
177.
178.
179.
180.
181.
182.
183.
184.
185.
186.
187.
188.
189.
190.
191.
192.
193.
194.
195.
196.
197.
198.
199.
200.
201.
202.
203.
204.
205.
206.
207.
208.
209.
210.
211.
212.
213.
214.
215.
216.
217.
218.
219.
220.
221.
222.
223.
224.
225.
226.
227.
228.
229.
230.
231.
232.
233.
234.
235.
236.
237.
238.
239.
240.
241.
242.
243.
244.
245.
246.
247.
248.
249.
250.
251.
252.
253.
254.
255.
256.
257.
258.
259.
260.
261.
262.
263.
264.
265.
266.
267.
268.
269.
270.
271.
# additional parameter to outcome old page checkpoint error
# CCFLAGS               0x400000

# Root Dbspace Configuration

ROOTNAME        rootdbs         # Root dbspace name
ROOTPATH        /dev/sda1       # Path for device containing root dbspace
ROOTOFFSET       0                # Offset of root dbspace into device (Kbytes)
ROOTSIZE         2000000          # Size of root dbspace (Kbytes)

# Disk Mirroring Configuration Parameters

MIRROR           1                # Mirroring flag (Yes =  1 , No =  0 )
MIRRORPATH      /dev/sdc3       # Path for device containing mirrored root
MIRROROFFSET     0                # Offset into mirrored device (Kbytes)

# Physical Log Configuration

PHYSDBS         rootdbs         # Location (dbspace) of physical log
PHYSFILE         100000  # 25000            # Physical log file size (Kbytes)

# Logical Log Configuration

LOGFILES         50               # Number of logical log files
LOGSIZE          20000            # Logical log size (Kbytes)

# Diagnostics

MSGPATH         /usr/informix/online.log # System message log file path
CONSOLE         /dev/tty08      # System console message path

# To automatically backup logical logs, edit alarmprogram.sh and set
# BACKUPLOGS=Y
ALARMPROGRAM    /usr/informix/etc/alarm.sh      # Alarm program path
TBLSPACE_STATS   0                # Maintain tblspace statistics

# System Archive Tape Device

#TAPEDEV                /dev/st0        # Tape device path
#TAPEDEV                /dev/null       # NULL Tape device path
#TAPEDEV         /sdf/online.bkp
TAPEDEV         /backup/phys.bkp
TAPEBLK          128               # Tape block size (Kbytes)
TAPESIZE         50000000         # Maximum amount of data to put on tape (Kbytes)

# Log Archive Tape Device

LTAPEDEV        /backup/log
#LTAPEDEV       /dev/tapedev    # Log tape device path
#LTAPEDEV        /dev/null       # NULL Log tape device path
#LTAPEDEV       /backup/log.bkp
LTAPEBLK         32               # Log tape block size (Kbytes)
LTAPESIZE        10240000            # Max amount of data to put on log tape (Kbytes)

# Optical

STAGEBLOB                       # Informix Dynamic Server staging area

# System Configuration

SERVERNUM        0                # Unique id corresponding to a OnLine instance
DBSERVERNAME    onlnew          # Name of default database server
DBSERVERALIASES onlnew_tcp      # List of alternate dbservernames
NETTYPE         ipcshm, 2 , 200 ,CPU # Configure poll thread(s) for nettype
NETTYPE         soctcp, 1 , 20 ,NET # Configure poll thread(s) for nettype
DEADLOCK_TIMEOUT  60               # Max time to wait of lock in distributed env.
RESIDENT         2                # Forced residency flag (Yes =  1 , No =  0 )

MULTIPROCESSOR   1                #  0  for single-processor,  1  for multi-processor
NUMCPUVPS        3                # Number of user (cpu) vps
SINGLE_CPU_VP    0                # If non-zero, limit number of cpu vps to one

NOAGE            1                # Process aging
AFF_SPROC        0                # Affinity start processor
AFF_NPROCS       0                # Affinity number of processors

# Shared Memory Parameters

LOCKS            600000           # Maximum number of locks
BUFFERS          256000           # Maximum number of shared buffers
NUMAIOVPS        8                # Number of IO vps
PHYSBUFF         256              # Physical log buffer size (Kbytes)
LOGBUFF          64  # 256              # Logical log buffer size (Kbytes)
CLEANERS         8                # Number of buffer cleaner processes
SHMBASE         0x44000000      # Shared memory base address
SHMVIRTSIZE      65536            # initial virtual shared memory segment size
SHMADD           8192             # Size of new shared memory segments (Kbytes)
SHMTOTAL         0                # Total shared memory (Kbytes).  0 =>unlimited
CKPTINTVL        300              # Check point interval (in sec)
LRUS             127              # Number of LRU queues
LRU_MAX_DIRTY    8 . 000000        # LRU percent dirty begin cleaning limit
LRU_MIN_DIRTY    2 . 000000         # LRU percent dirty end cleaning limit
TXTIMEOUT       0x12c             # Transaction timeout (in sec)
STACKSIZE        32               # Stack size (Kbytes)

# Dynamic Logging
# DYNAMIC_LOGS:
#     2  : server automatically add a new logical log when necessary. (ON)
#     1  : notify DBA to add new logical logs when necessary. (ON)
#     0  : cannot add logical log on the fly. (OFF)
#
# When dynamic logging is on, we can have higher values for LTXHWM/LTXEHWM,
# because the server can add new logical logs during long transaction rollback.
# However, to limit the number of new logical logs being added, LTXHWM/LTXEHWM
# can be set to smaller values.
#
# If dynamic logging is off, LTXHWM/LTXEHWM need to be set to smaller values
# to avoid long transaction rollback hanging the server due to lack of logical
# log space, i.e.  50 / 60  or lower.

DYNAMIC_LOGS     2 
LTXHWM           50 
LTXEHWM          60 

# System Page Size
# BUFFSIZE - OnLine no longer supports this configuration parameter.
#            To determine the page size used by OnLine on your platform
#            see the last line of output from the command, 'onstat -b'.


# Recovery Variables
# OFF_RECVRY_THREADS:
# Number of parallel worker threads during fast recovery or an offline restore.
# ON_RECVRY_THREADS:
# Number of parallel worker threads during an online restore.

OFF_RECVRY_THREADS  10               # Default number of offline worker threads
ON_RECVRY_THREADS  1                # Default number of online worker threads
# Data Replication Variables
DRINTERVAL       30               # DR max time between DR buffer flushes (in sec)
DRTIMEOUT        30               # DR network timeout (in sec)
DRLOSTFOUND     /usr/informix/etc/dr.lostfound # DR lost+found file path

# CDR Variables
CDR_EVALTHREADS  1 , 2              # evaluator threads (per-cpu-vp,additional)
CDR_DSLOCKWAIT   5                # DS lockwait timeout (seconds)
CDR_QUEUEMEM     4096             # Maximum amount of memory for any CDR queue (Kbytes)
CDR_NIFCOMPRESS  0                # Link level compression (- 1  never,  0  none,  9  max)
CDR_SERIAL       0 , 0              # Serial Column Sequence
CDR_DBSPACE                     # dbspace for syscdr database
CDR_QHDR_DBSPACE                 # CDR queue dbspace (default same as catalog)
CDR_QDATA_SBSPACE                 # List of CDR queue smart blob spaces

# CDR_MAX_DYNAMIC_LOGS
# - 1  => unlimited
#   0  => disable dynamic log addition
# > 0  => limit the no. of dynamic log additions with the specified value.
# Max dynamic log requests that CDR can make within one server session.

CDR_MAX_DYNAMIC_LOGS  0                # Dynamic log addition disabled by default

# Backup/Restore variables
BAR_ACT_LOG     /usr/informix/bar_act.log # ON-Bar Log file - not in /tmp please
BAR_DEBUG_LOG   /usr/informix/bar_dbug.log
                                # ON-Bar Debug Log - not in /tmp please
BAR_MAX_BACKUP   0 
BAR_RETRY        1 
BAR_NB_XPORT_COUNT  10 
BAR_XFER_BUF_SIZE  31 
RESTARTABLE_RESTORE on
BAR_PROGRESS_FREQ  0 

# Informix Storage Manager variables
ISM_DATA_POOL   ISMData
ISM_LOG_POOL    ISMLogs

# Read Ahead Variables
RA_PAGES         128                         # Number of pages to attempt to read ahead
RA_THRESHOLD      64                # Number of pages left before next group

# DBSPACETEMP:
# OnLine equivalent of DBTEMP for SE. This is the list of dbspaces
# that the OnLine SQL Engine will use to create temp tables etc.
# If specified it must be a colon separated list of dbspaces that exist
# when the OnLine system is brought online.  If not specified, or if
# all dbspaces specified are invalid, various ad hoc queries will create
# temporary files in /tmp instead.

DBSPACETEMP     tempdbs1        # Default temp dbspaces
# DUMP*:
# The following parameters control the type of diagnostics information which
# is preserved when an unanticipated error condition (assertion failure) occurs
# during OnLine operations.
# For DUMPSHMEM, DUMPGCORE and DUMPCORE  1  means Yes,  0  means No.

DUMPDIR         /tmp            # Preserve diagnostics in this directory
DUMPSHMEM        1                # Dump a copy of shared memory
DUMPGCORE        0                # Dump a core image using 'gcore'
DUMPCORE         0                # Dump a core image (Warning:this aborts OnLine)
DUMPCNT          1                # Number of shared memory or gcore dumps for
                                # a single user's session

FILLFACTOR       90               # Fill factor for building indexes

# method for OnLine to use when determining current time
USEOSTIME        0                #  0 : use internal time(fast),  1 : get time from OS(slow)

# Parallel Database Queries (pdq)
MAX_PDQPRIORITY  100              # Maximum allowed pdqpriority
DS_MAX_QUERIES                  # Maximum number of decision support queries
DS_TOTAL_MEMORY                 # Decision support memory (Kbytes)
DS_MAX_SCANS     1048576          # Maximum number of decision support scans
DATASKIP        off
# OPTCOMPIND
#  0  => Nested loop joins will be preferred (where
#      possible) over sortmerge joins and hash joins.
#  1  => If the transaction isolation mode is not
#      "repeatable read", optimizer behaves as in ( 2 )
#      below.  Otherwise it behaves as in ( 0 ) above.
#  2  => Use costs regardless of the transaction isolation
#      mode.  Nested loop joins are not necessarily
#      preferred.  Optimizer bases its decision purely
#      on costs.
OPTCOMPIND       2                # To hint the optimizer
DIRECTIVES       1                # Optimizer DIRECTIVES ON ( 1 /Default) or OFF ( 0 )

ONDBSPACEDOWN    0                # Dbspace down option:  0  = CONTINUE,  1  = ABORT,  2  = WAIT
OPCACHEMAX       0                # Maximum optical cache size (Kbytes)

# HETERO_COMMIT (Gateway participation in distributed transactions)
#  1  => Heterogeneous Commit is enabled
#  0  (or any other value) => Heterogeneous Commit is disabled
HETERO_COMMIT    0 

SBSPACENAME                     # Default smartblob space name - this is where blobs
                       # go if no sbspace is specified when the smartblob is
                       # created. It is also used by some datablades as
                       # the location to put their smartblobs.
SYSSBSPACENAME                  # Default smartblob space for use by the Informix
                       # Server. This is used primarily for Informix Server
                       # system statistics collection.

BLOCKTIMEOUT     3600             # Default timeout for system block
SYSALARMPROGRAM /usr/informix/etc/evidence.sh # System Alarm program path

# Optimization goal: - 1  = ALL_ROWS(Default),  0  = FIRST_ROWS
OPT_GOAL        - 1 

ALLOW_NEWLINE    0                # embedded newlines(Yes =  1 , No =  0  or anything but  1 )

#
# The following are default settings for enabling Java in the database.
# Replace all occurrences of /usr/informix with the value of $INFORMIXDIR.

#VPCLASS        jvp,num= 1        # Number of JVPs to start with

JVPJAVAHOME     /usr/informix/extend/krakatoa/jre
                                # JRE installation root directory
JVPHOME         /usr/informix/extend/krakatoa # Krakatoa installation directory

JVPPROPFILE     /usr/informix/extend/krakatoa/.jvpprops # JVP property file
JVPLOGFILE      /usr/informix/jvp.log # JVP log file.

JDKVERSION       1 . 3              # JDK version supported by this server

# The path to the JRE libraries relative to JVPJAVAHOME
JVPJAVALIB      /lib/i386/
# The JRE libraries to use for the Java VM

JVPJAVAVM       hpi:server:verify:java:net:zip:jpeg

# use JVPARGS to change Java VM configuration
#To display jni call
#JVPARGS        -verbose:jni

# Classpath to use upon Java VM start-up (use _g version for debugging)

#JVPCLASSPATH  /usr/informix/extend/krakatoa/krakatoa_g.jar:/usr/informix/extend/krakatoa/jdbc_g.jar
JVPCLASSPATH    /usr/informix/extend/krakatoa/krakatoa.jar:/usr/informix/extend/krakatoa/jdbc.jar

NOFUZZYCKPT     1 
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34726230
onstat-
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
KyRo
Можно ли сделать что бы приоритет доступа к дискам был у чек поинтов ?


Пусть на вам вопрос ответит тот кто ставил параметр NOFUZZYCKPT .
Подозреваю это были не Вы, если задаете этот вопрос.

Правилный ответ нельзя,
Почитайте в руководстве Системного Администратора о том, что происходит вовремя checkpoint,


KyRo
авторБез анализа onconfig и конфигурации железа и ОС это только предположения.


Про железо могу сказать следующее :
Это 4 х Процессорный сервер IBM366 4 Gb Ram . База данных лежит на SCSI дисковой подсистеме


Давайте iostat 1 50 во время активных изменений базы и во время длинного checkpoint.
А также sar -Bu



KyRo
Насчет onconfig вот он :

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
# additional parameter to outcome old page checkpoint error
# CCFLAGS               0x400000

# Root Dbspace Configuration

ROOTNAME        rootdbs         # Root dbspace name
ROOTPATH        /dev/sda1       # Path for device containing root dbspace
ROOTOFFSET       0                # Offset of root dbspace into device (Kbytes)
ROOTSIZE         2000000          # Size of root dbspace (Kbytes)

# Disk Mirroring Configuration Parameters

MIRROR           1                # Mirroring flag (Yes =  1 , No =  0 )
MIRRORPATH      /dev/sdc3       # Path for device containing mirrored root
MIRROROFFSET     0                # Offset into mirrored device (Kbytes)

# Physical Log Configuration

PHYSDBS         rootdbs         # Location (dbspace) of physical log
PHYSFILE         100000  # 25000            # Physical log file size (Kbytes)

# Logical Log Configuration

LOGFILES         50               # Number of logical log files
LOGSIZE          20000            # Logical log size (Kbytes)

# Diagnostics

MSGPATH         /usr/informix/online.log # System message log file path
CONSOLE         /dev/tty08      # System console message path

# To automatically backup logical logs, edit alarmprogram.sh and set
# BACKUPLOGS=Y
ALARMPROGRAM    /usr/informix/etc/alarm.sh      # Alarm program path
TBLSPACE_STATS   0                # Maintain tblspace statistics

# System Archive Tape Device

#TAPEDEV                /dev/st0        # Tape device path
#TAPEDEV                /dev/null       # NULL Tape device path
#TAPEDEV         /sdf/online.bkp
TAPEDEV         /backup/phys.bkp
TAPEBLK          128               # Tape block size (Kbytes)
TAPESIZE         50000000         # Maximum amount of data to put on tape (Kbytes)

# Log Archive Tape Device

LTAPEDEV        /backup/log
#LTAPEDEV       /dev/tapedev    # Log tape device path
#LTAPEDEV        /dev/null       # NULL Log tape device path
#LTAPEDEV       /backup/log.bkp
LTAPEBLK         32               # Log tape block size (Kbytes)
LTAPESIZE        10240000            # Max amount of data to put on log tape (Kbytes)

# Optical

STAGEBLOB                       # Informix Dynamic Server staging area

# System Configuration

SERVERNUM        0                # Unique id corresponding to a OnLine instance
DBSERVERNAME    onlnew          # Name of default database server
DBSERVERALIASES onlnew_tcp      # List of alternate dbservernames

NETTYPE         ipcshm, 2 , 200 ,CPU # Configure poll thread(s) for nettype
NETTYPE         soctcp, 1 , 20 ,NET # Configure poll thread(s) for nettype

DEADLOCK_TIMEOUT  60               # Max time to wait of lock in distributed env.
RESIDENT         2                # Forced residency flag (Yes =  1 , No =  0 )

Из каких соображений стоит значение 2 ?

KyRo

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
# additional parameter to outcome old page checkpoint error

MULTIPROCESSOR   1                #  0  for single-processor,  1  for multi-processor
NUMCPUVPS        3                # Number of user (cpu) vps
SINGLE_CPU_VP    0                # If non-zero, limit number of cpu vps to one

NOAGE            1                # Process aging
AFF_SPROC        0                # Affinity start processor
AFF_NPROCS       0                # Affinity number of processors

# Shared Memory Parameters

LOCKS            600000           # Maximum number of locks
BUFFERS          256000           # Maximum number of shared buffers
NUMAIOVPS        8                # Number of IO vps



NUMAIOVPS попробуйте увеличить до количества активно используемых чанков


KyRo
Код: plaintext
1.
2.
3.
PHYSBUFF         256              # Physical log buffer size (Kbytes)
LOGBUFF          64  # 256              # Logical log buffer size (Kbytes)
CLEANERS         8                # Number of buffer cleaner processes



CLEANERS попробуйте увеличить до количества активно используемых чанков .

KyRo
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
SHMBASE         0x44000000      # Shared memory base address
SHMVIRTSIZE      65536            # initial virtual shared memory segment size
SHMADD           8192             # Size of new shared memory segments (Kbytes)
SHMTOTAL         0                # Total shared memory (Kbytes).  0 =>unlimited
CKPTINTVL        300              # Check point interval (in sec)
LRUS             127              # Number of LRU queues

LRU_MAX_DIRTY    8 . 000000        # LRU percent dirty begin cleaning limit
LRU_MIN_DIRTY    2 . 000000         # LRU percent dirty end cleaning limit


попробуйте значения :
LRU_MAX_DIRTY 1.000000 # LRU percent dirty begin cleaning limit
LRU_MIN_DIRTY 0.000000 # LRU percent dirty end cleaning limit


KyRo
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
TXTIMEOUT       0x12c             # Transaction timeout (in sec)
STACKSIZE        32               # Stack size (Kbytes)

# Dynamic Logging
# DYNAMIC_LOGS:
#     2  : server automatically add a new logical log when necessary. (ON)
#     1  : notify DBA to add new logical logs when necessary. (ON)
#     0  : cannot add logical log on the fly. (OFF)
#
# When dynamic logging is on, we can have higher values for LTXHWM/LTXEHWM,
# because the server can add new logical logs during long transaction rollback.
# However, to limit the number of new logical logs being added, LTXHWM/LTXEHWM
# can be set to smaller values.
#
# If dynamic logging is off, LTXHWM/LTXEHWM need to be set to smaller values
# to avoid long transaction rollback hanging the server due to lack of logical
# log space, i.e.  50 / 60  or lower.

DYNAMIC_LOGS     2 
LTXHWM           50 
LTXEHWM          60 

# System Page Size
# BUFFSIZE - OnLine no longer supports this configuration parameter.
#            To determine the page size used by OnLine on your platform
#            see the last line of output from the command, 'onstat -b'.


# Recovery Variables
# OFF_RECVRY_THREADS:
# Number of parallel worker threads during fast recovery or an offline restore.
# ON_RECVRY_THREADS:
# Number of parallel worker threads during an online restore.

OFF_RECVRY_THREADS  10               # Default number of offline worker threads
ON_RECVRY_THREADS  1                # Default number of online worker threads
# Data Replication Variables
DRINTERVAL       30               # DR max time between DR buffer flushes (in sec)
DRTIMEOUT        30               # DR network timeout (in sec)
DRLOSTFOUND     /usr/informix/etc/dr.lostfound # DR lost+found file path

# CDR Variables
CDR_EVALTHREADS  1 , 2              # evaluator threads (per-cpu-vp,additional)
CDR_DSLOCKWAIT   5                # DS lockwait timeout (seconds)
CDR_QUEUEMEM     4096             # Maximum amount of memory for any CDR queue (Kbytes)
CDR_NIFCOMPRESS  0                # Link level compression (- 1  never,  0  none,  9  max)
CDR_SERIAL       0 , 0              # Serial Column Sequence
CDR_DBSPACE                     # dbspace for syscdr database
CDR_QHDR_DBSPACE                 # CDR queue dbspace (default same as catalog)
CDR_QDATA_SBSPACE                 # List of CDR queue smart blob spaces

# CDR_MAX_DYNAMIC_LOGS
# - 1  => unlimited
#   0  => disable dynamic log addition
# > 0  => limit the no. of dynamic log additions with the specified value.
# Max dynamic log requests that CDR can make within one server session.

CDR_MAX_DYNAMIC_LOGS  0                # Dynamic log addition disabled by default

# Backup/Restore variables
BAR_ACT_LOG     /usr/informix/bar_act.log # ON-Bar Log file - not in /tmp please
BAR_DEBUG_LOG   /usr/informix/bar_dbug.log
                                # ON-Bar Debug Log - not in /tmp please
BAR_MAX_BACKUP   0 
BAR_RETRY        1 
BAR_NB_XPORT_COUNT  10 
BAR_XFER_BUF_SIZE  31 
RESTARTABLE_RESTORE on
BAR_PROGRESS_FREQ  0 

# Informix Storage Manager variables
ISM_DATA_POOL   ISMData
ISM_LOG_POOL    ISMLogs

# Read Ahead Variables
RA_PAGES         128                         # Number of pages to attempt to read ahead
RA_THRESHOLD      64                # Number of pages left before next group


На основании чего устанавливались такие начения?
RA_PAGES 128 # Number of pages to attempt to read ahead
RA_THRESHOLD 64 # Number of pages left before next group

У Вас DSS или OLAP база ?
тогда почему так мало в SHMVIRTSIZE ?



KyRo
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
102.
# DBSPACETEMP:
# OnLine equivalent of DBTEMP for SE. This is the list of dbspaces
# that the OnLine SQL Engine will use to create temp tables etc.
# If specified it must be a colon separated list of dbspaces that exist
# when the OnLine system is brought online.  If not specified, or if
# all dbspaces specified are invalid, various ad hoc queries will create
# temporary files in /tmp instead.

DBSPACETEMP     tempdbs1        # Default temp dbspaces
# DUMP*:
# The following parameters control the type of diagnostics information which
# is preserved when an unanticipated error condition (assertion failure) occurs
# during OnLine operations.
# For DUMPSHMEM, DUMPGCORE and DUMPCORE  1  means Yes,  0  means No.

DUMPDIR         /tmp            # Preserve diagnostics in this directory
DUMPSHMEM        1                # Dump a copy of shared memory
DUMPGCORE        0                # Dump a core image using 'gcore'
DUMPCORE         0                # Dump a core image (Warning:this aborts OnLine)
DUMPCNT          1                # Number of shared memory or gcore dumps for
                                # a single user's session

FILLFACTOR       90               # Fill factor for building indexes

# method for OnLine to use when determining current time
USEOSTIME        0                #  0 : use internal time(fast),  1 : get time from OS(slow)

# Parallel Database Queries (pdq)
MAX_PDQPRIORITY  100              # Maximum allowed pdqpriority
DS_MAX_QUERIES                  # Maximum number of decision support queries
DS_TOTAL_MEMORY                 # Decision support memory (Kbytes)
DS_MAX_SCANS     1048576          # Maximum number of decision support scans
DATASKIP        off
# OPTCOMPIND
#  0  => Nested loop joins will be preferred (where
#      possible) over sortmerge joins and hash joins.
#  1  => If the transaction isolation mode is not
#      "repeatable read", optimizer behaves as in ( 2 )
#      below.  Otherwise it behaves as in ( 0 ) above.
#  2  => Use costs regardless of the transaction isolation
#      mode.  Nested loop joins are not necessarily
#      preferred.  Optimizer bases its decision purely
#      on costs.
OPTCOMPIND       2                # To hint the optimizer
DIRECTIVES       1                # Optimizer DIRECTIVES ON ( 1 /Default) or OFF ( 0 )

ONDBSPACEDOWN    0                # Dbspace down option:  0  = CONTINUE,  1  = ABORT,  2  = WAIT
OPCACHEMAX       0                # Maximum optical cache size (Kbytes)

# HETERO_COMMIT (Gateway participation in distributed transactions)
#  1  => Heterogeneous Commit is enabled
#  0  (or any other value) => Heterogeneous Commit is disabled
HETERO_COMMIT    0 

SBSPACENAME                     # Default smartblob space name - this is where blobs
                       # go if no sbspace is specified when the smartblob is
                       # created. It is also used by some datablades as
                       # the location to put their smartblobs.
SYSSBSPACENAME                  # Default smartblob space for use by the Informix
                       # Server. This is used primarily for Informix Server
                       # system statistics collection.

BLOCKTIMEOUT     3600             # Default timeout for system block
SYSALARMPROGRAM /usr/informix/etc/evidence.sh # System Alarm program path

# Optimization goal: - 1  = ALL_ROWS(Default),  0  = FIRST_ROWS
OPT_GOAL        - 1 

ALLOW_NEWLINE    0                # embedded newlines(Yes =  1 , No =  0  or anything but  1 )

#
# The following are default settings for enabling Java in the database.
# Replace all occurrences of /usr/informix with the value of $INFORMIXDIR.

#VPCLASS        jvp,num= 1        # Number of JVPs to start with

JVPJAVAHOME     /usr/informix/extend/krakatoa/jre
                                # JRE installation root directory
JVPHOME         /usr/informix/extend/krakatoa # Krakatoa installation directory

JVPPROPFILE     /usr/informix/extend/krakatoa/.jvpprops # JVP property file
JVPLOGFILE      /usr/informix/jvp.log # JVP log file.

JDKVERSION       1 . 3              # JDK version supported by this server

# The path to the JRE libraries relative to JVPJAVAHOME
JVPJAVALIB      /lib/i386/
# The JRE libraries to use for the Java VM

JVPJAVAVM       hpi:server:verify:java:net:zip:jpeg

# use JVPARGS to change Java VM configuration
#To display jni call
#JVPARGS        -verbose:jni

# Classpath to use upon Java VM start-up (use _g version for debugging)

#JVPCLASSPATH  /usr/informix/extend/krakatoa/krakatoa_g.jar:/usr/informix/extend/krakatoa/jdbc_g.jar
JVPCLASSPATH    /usr/informix/extend/krakatoa/krakatoa.jar:/usr/informix/extend/krakatoa/jdbc.jar

NOFUZZYCKPT     1 



А это из каких соображений устанавливалось?
NOFUZZYCKPT 1
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34728534
Алексан
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
KyRo

Про железо могу сказать следующее :
Это 4 х Процессорный сервер IBM366 4 Gb Ram . База данных лежит на SCSI дисковой подсистеме

Насчет onconfig вот он :

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
102.
103.
104.
105.
106.
107.
108.
109.
110.
111.
112.
113.
114.
115.
116.
117.
118.
119.
120.
121.
122.
123.
124.
125.
126.
127.
128.
129.
130.
131.
132.
133.
134.
135.
136.
137.
138.
139.
140.
141.
142.
143.
144.
145.
146.
147.
148.
149.
150.
151.
152.
153.
154.
155.
156.
157.
158.
159.
160.
161.
162.
163.
164.
165.
166.
167.
168.
169.
170.
171.
172.
173.
174.
175.
176.
177.
178.
179.
180.
181.
182.
183.
184.
185.
186.
187.
188.
189.
190.
191.
192.
193.
194.
195.
196.
197.
198.
199.
200.
201.
202.
203.
204.
205.
206.
207.
208.
209.
210.
211.
212.
213.
214.
215.
216.
217.
218.
219.
220.
221.
222.
223.
224.
225.
226.
227.
228.
229.
230.
231.
232.
233.
234.
235.
236.
237.
238.
239.
240.
241.
242.
243.
244.
245.
246.
247.
248.
249.
250.
251.
252.
253.
254.
255.
256.
257.
258.
259.
260.
261.
262.
263.
264.
265.
266.
267.
268.
269.
270.
271.
# additional parameter to outcome old page checkpoint error
# CCFLAGS               0x400000

# Root Dbspace Configuration

ROOTNAME        rootdbs         # Root dbspace name
ROOTPATH        /dev/sda1       # Path for device containing root dbspace
ROOTOFFSET       0                # Offset of root dbspace into device (Kbytes)
ROOTSIZE         2000000          # Size of root dbspace (Kbytes)

# Disk Mirroring Configuration Parameters

MIRROR           1                # Mirroring flag (Yes =  1 , No =  0 )
MIRRORPATH      /dev/sdc3       # Path for device containing mirrored root
MIRROROFFSET     0                # Offset into mirrored device (Kbytes)

# Physical Log Configuration

PHYSDBS         rootdbs         # Location (dbspace) of physical log
PHYSFILE         100000  # 25000            # Physical log file size (Kbytes)

# Logical Log Configuration

LOGFILES         50               # Number of logical log files
LOGSIZE          20000            # Logical log size (Kbytes)

# Diagnostics

MSGPATH         /usr/informix/online.log # System message log file path
CONSOLE         /dev/tty08      # System console message path

# To automatically backup logical logs, edit alarmprogram.sh and set
# BACKUPLOGS=Y
ALARMPROGRAM    /usr/informix/etc/alarm.sh      # Alarm program path
TBLSPACE_STATS   0                # Maintain tblspace statistics

# System Archive Tape Device

#TAPEDEV                /dev/st0        # Tape device path
#TAPEDEV                /dev/null       # NULL Tape device path
#TAPEDEV         /sdf/online.bkp
TAPEDEV         /backup/phys.bkp
TAPEBLK          128               # Tape block size (Kbytes)
TAPESIZE         50000000         # Maximum amount of data to put on tape (Kbytes)

# Log Archive Tape Device

LTAPEDEV        /backup/log
#LTAPEDEV       /dev/tapedev    # Log tape device path
#LTAPEDEV        /dev/null       # NULL Log tape device path
#LTAPEDEV       /backup/log.bkp
LTAPEBLK         32               # Log tape block size (Kbytes)
LTAPESIZE        10240000            # Max amount of data to put on log tape (Kbytes)

# Optical

STAGEBLOB                       # Informix Dynamic Server staging area

# System Configuration

SERVERNUM        0                # Unique id corresponding to a OnLine instance
DBSERVERNAME    onlnew          # Name of default database server
DBSERVERALIASES onlnew_tcp      # List of alternate dbservernames
NETTYPE         ipcshm, 2 , 200 ,CPU # Configure poll thread(s) for nettype
NETTYPE         soctcp, 1 , 20 ,NET # Configure poll thread(s) for nettype
DEADLOCK_TIMEOUT  60               # Max time to wait of lock in distributed env.
RESIDENT         2                # Forced residency flag (Yes =  1 , No =  0 )

MULTIPROCESSOR   1                #  0  for single-processor,  1  for multi-processor
NUMCPUVPS        3                # Number of user (cpu) vps
SINGLE_CPU_VP    0                # If non-zero, limit number of cpu vps to one

NOAGE            1                # Process aging
AFF_SPROC        0                # Affinity start processor
AFF_NPROCS       0                # Affinity number of processors

# Shared Memory Parameters

LOCKS            600000           # Maximum number of locks
BUFFERS          256000           # Maximum number of shared buffers
NUMAIOVPS        8                # Number of IO vps
PHYSBUFF         256              # Physical log buffer size (Kbytes)
LOGBUFF          64  # 256              # Logical log buffer size (Kbytes)
CLEANERS         8                # Number of buffer cleaner processes
SHMBASE         0x44000000      # Shared memory base address
SHMVIRTSIZE      65536            # initial virtual shared memory segment size
SHMADD           8192             # Size of new shared memory segments (Kbytes)
SHMTOTAL         0                # Total shared memory (Kbytes).  0 =>unlimited
CKPTINTVL        300              # Check point interval (in sec)
LRUS             127              # Number of LRU queues
LRU_MAX_DIRTY    8 . 000000        # LRU percent dirty begin cleaning limit
LRU_MIN_DIRTY    2 . 000000         # LRU percent dirty end cleaning limit
TXTIMEOUT       0x12c             # Transaction timeout (in sec)
STACKSIZE        32               # Stack size (Kbytes)

# Dynamic Logging
# DYNAMIC_LOGS:
#     2  : server automatically add a new logical log when necessary. (ON)
#     1  : notify DBA to add new logical logs when necessary. (ON)
#     0  : cannot add logical log on the fly. (OFF)
#
# When dynamic logging is on, we can have higher values for LTXHWM/LTXEHWM,
# because the server can add new logical logs during long transaction rollback.
# However, to limit the number of new logical logs being added, LTXHWM/LTXEHWM
# can be set to smaller values.
#
# If dynamic logging is off, LTXHWM/LTXEHWM need to be set to smaller values
# to avoid long transaction rollback hanging the server due to lack of logical
# log space, i.e.  50 / 60  or lower.

DYNAMIC_LOGS     2 
LTXHWM           50 
LTXEHWM          60 

# System Page Size
# BUFFSIZE - OnLine no longer supports this configuration parameter.
#            To determine the page size used by OnLine on your platform
#            see the last line of output from the command, 'onstat -b'.


# Recovery Variables
# OFF_RECVRY_THREADS:
# Number of parallel worker threads during fast recovery or an offline restore.
# ON_RECVRY_THREADS:
# Number of parallel worker threads during an online restore.

OFF_RECVRY_THREADS  10               # Default number of offline worker threads
ON_RECVRY_THREADS  1                # Default number of online worker threads
# Data Replication Variables
DRINTERVAL       30               # DR max time between DR buffer flushes (in sec)
DRTIMEOUT        30               # DR network timeout (in sec)
DRLOSTFOUND     /usr/informix/etc/dr.lostfound # DR lost+found file path

# CDR Variables
CDR_EVALTHREADS  1 , 2              # evaluator threads (per-cpu-vp,additional)
CDR_DSLOCKWAIT   5                # DS lockwait timeout (seconds)
CDR_QUEUEMEM     4096             # Maximum amount of memory for any CDR queue (Kbytes)
CDR_NIFCOMPRESS  0                # Link level compression (- 1  never,  0  none,  9  max)
CDR_SERIAL       0 , 0              # Serial Column Sequence
CDR_DBSPACE                     # dbspace for syscdr database
CDR_QHDR_DBSPACE                 # CDR queue dbspace (default same as catalog)
CDR_QDATA_SBSPACE                 # List of CDR queue smart blob spaces

# CDR_MAX_DYNAMIC_LOGS
# - 1  => unlimited
#   0  => disable dynamic log addition
# > 0  => limit the no. of dynamic log additions with the specified value.
# Max dynamic log requests that CDR can make within one server session.

CDR_MAX_DYNAMIC_LOGS  0                # Dynamic log addition disabled by default

# Backup/Restore variables
BAR_ACT_LOG     /usr/informix/bar_act.log # ON-Bar Log file - not in /tmp please
BAR_DEBUG_LOG   /usr/informix/bar_dbug.log
                                # ON-Bar Debug Log - not in /tmp please
BAR_MAX_BACKUP   0 
BAR_RETRY        1 
BAR_NB_XPORT_COUNT  10 
BAR_XFER_BUF_SIZE  31 
RESTARTABLE_RESTORE on
BAR_PROGRESS_FREQ  0 

# Informix Storage Manager variables
ISM_DATA_POOL   ISMData
ISM_LOG_POOL    ISMLogs

# Read Ahead Variables
RA_PAGES         128                         # Number of pages to attempt to read ahead
RA_THRESHOLD      64                # Number of pages left before next group

# DBSPACETEMP:
# OnLine equivalent of DBTEMP for SE. This is the list of dbspaces
# that the OnLine SQL Engine will use to create temp tables etc.
# If specified it must be a colon separated list of dbspaces that exist
# when the OnLine system is brought online.  If not specified, or if
# all dbspaces specified are invalid, various ad hoc queries will create
# temporary files in /tmp instead.

DBSPACETEMP     tempdbs1        # Default temp dbspaces
# DUMP*:
# The following parameters control the type of diagnostics information which
# is preserved when an unanticipated error condition (assertion failure) occurs
# during OnLine operations.
# For DUMPSHMEM, DUMPGCORE and DUMPCORE  1  means Yes,  0  means No.

DUMPDIR         /tmp            # Preserve diagnostics in this directory
DUMPSHMEM        1                # Dump a copy of shared memory
DUMPGCORE        0                # Dump a core image using 'gcore'
DUMPCORE         0                # Dump a core image (Warning:this aborts OnLine)
DUMPCNT          1                # Number of shared memory or gcore dumps for
                                # a single user's session

FILLFACTOR       90               # Fill factor for building indexes

# method for OnLine to use when determining current time
USEOSTIME        0                #  0 : use internal time(fast),  1 : get time from OS(slow)

# Parallel Database Queries (pdq)
MAX_PDQPRIORITY  100              # Maximum allowed pdqpriority
DS_MAX_QUERIES                  # Maximum number of decision support queries
DS_TOTAL_MEMORY                 # Decision support memory (Kbytes)
DS_MAX_SCANS     1048576          # Maximum number of decision support scans
DATASKIP        off
# OPTCOMPIND
#  0  => Nested loop joins will be preferred (where
#      possible) over sortmerge joins and hash joins.
#  1  => If the transaction isolation mode is not
#      "repeatable read", optimizer behaves as in ( 2 )
#      below.  Otherwise it behaves as in ( 0 ) above.
#  2  => Use costs regardless of the transaction isolation
#      mode.  Nested loop joins are not necessarily
#      preferred.  Optimizer bases its decision purely
#      on costs.
OPTCOMPIND       2                # To hint the optimizer
DIRECTIVES       1                # Optimizer DIRECTIVES ON ( 1 /Default) or OFF ( 0 )

ONDBSPACEDOWN    0                # Dbspace down option:  0  = CONTINUE,  1  = ABORT,  2  = WAIT
OPCACHEMAX       0                # Maximum optical cache size (Kbytes)

# HETERO_COMMIT (Gateway participation in distributed transactions)
#  1  => Heterogeneous Commit is enabled
#  0  (or any other value) => Heterogeneous Commit is disabled
HETERO_COMMIT    0 

SBSPACENAME                     # Default smartblob space name - this is where blobs
                       # go if no sbspace is specified when the smartblob is
                       # created. It is also used by some datablades as
                       # the location to put their smartblobs.
SYSSBSPACENAME                  # Default smartblob space for use by the Informix
                       # Server. This is used primarily for Informix Server
                       # system statistics collection.

BLOCKTIMEOUT     3600             # Default timeout for system block
SYSALARMPROGRAM /usr/informix/etc/evidence.sh # System Alarm program path

# Optimization goal: - 1  = ALL_ROWS(Default),  0  = FIRST_ROWS
OPT_GOAL        - 1 

ALLOW_NEWLINE    0                # embedded newlines(Yes =  1 , No =  0  or anything but  1 )

#
# The following are default settings for enabling Java in the database.
# Replace all occurrences of /usr/informix with the value of $INFORMIXDIR.

#VPCLASS        jvp,num= 1        # Number of JVPs to start with

JVPJAVAHOME     /usr/informix/extend/krakatoa/jre
                                # JRE installation root directory
JVPHOME         /usr/informix/extend/krakatoa # Krakatoa installation directory

JVPPROPFILE     /usr/informix/extend/krakatoa/.jvpprops # JVP property file
JVPLOGFILE      /usr/informix/jvp.log # JVP log file.

JDKVERSION       1 . 3              # JDK version supported by this server

# The path to the JRE libraries relative to JVPJAVAHOME
JVPJAVALIB      /lib/i386/
# The JRE libraries to use for the Java VM

JVPJAVAVM       hpi:server:verify:java:net:zip:jpeg

# use JVPARGS to change Java VM configuration
#To display jni call
#JVPARGS        -verbose:jni

# Classpath to use upon Java VM start-up (use _g version for debugging)

#JVPCLASSPATH  /usr/informix/extend/krakatoa/krakatoa_g.jar:/usr/informix/extend/krakatoa/jdbc_g.jar
JVPCLASSPATH    /usr/informix/extend/krakatoa/krakatoa.jar:/usr/informix/extend/krakatoa/jdbc.jar

NOFUZZYCKPT     1 
Спасибо, что Вы предоставили для анализа фактический материал, а не слова.
Подсистема ввода/вывода настроена не идеально:
RA_PAGES=128 и RA_THRESHOLD=64 - установите из в 32 и 30 соответственно и, после этого, мониторьте использование упреждающего чтения, сравнивая ixda-RA+idx-RA+da-RA и RA-pgsused из выхода onstat -p - они должны быть очень близки. Какими бы большими мы эти параметры не ставили, сервер всё равно считывает за один раз не больше чем 32 страницы. Кроме того, SCSI-шина работает по принципу "один говорит - все молчат", поэтому пытаться ставить такое большое значение - значит наступать себе на хвост.
Если onstat- прав и KAIO не используется, то NUMAIOVPS=8 - это маловато. Присоединяюсь к onstat-'у, начните с числа активных чанков и наблюдайте за значениями io/wup в выходе onstat -g iov - увеличивайте число AIO VP до тех пор, пока хотя бы у одного AIO VP значение не станет меньше 1 (обычно их считают десятками и сотнями; это процессы операционной системы, и каждый стоит около 1,5 Мб памяти, поэтому гораздо лучше использовать KAIO).
Это логично использовать нитей-клинеров столько же, сколько и AIO VP, но проблема в том, что Вы не можете заранее знать, сколько именно их понадобится. Один клинер очищает одну LRU-очередь, поэтому их число также можно поставить в число очередей, т.е в 127. Это может показаться неэффективным, но нить - это лишь небольшая структура в памяти и она не занимает процессорного времени, пока не работает. Недостаток AIO VP, скорее всего, и является тем узким местом, которое вы ищете, но, как только их станет больше, узким местом станет число клинеров.
LRU_MAX_DIRTY=8.000000 и LRU_MIN_DIRTY=2.000000 - нетрадиционные установки. Если бы этих параметров не существовало, то мы рисковали бы на чекпоинте записывать на диск весь пул буферов, если все буфера окажутся грязными. Представляете, 512 Мб (покажите по секрету выход onstat -, если Вы работаете на 64-битной версии, то и весь гигабайт) записать на диск! - это не так уж и быстро! Чтобы как-то ограничить этот объём, придумали записывать часть страниц между чекпоинтами, хотя это и не так эффективно, а именно: как только в LRU-очереди грязных страниц становится больше, чем LRU_MAX_DIRTY процентов, сервер начинает их сбрасывать на диск, и останавливается, когда процент грязных страниц опускается до LRU_MIN_DIRTY. Итого: оставляя в стороне очереди, Вы готовы к записи 8% вашего пула буферов на диск на чекпоинте. Вообще говоря, этот процент можно рассчитать: считается, что в OLTP-приложениях пользователи начинают нервничать, если чекпоинты становятся длиннее 2 секунд. Зная скорость записи на диск, можно вычислить максимальный процент грязных страниц. Это не заменяет мониторинг продолжительности чекпоинта, но даёт некоторый ориентир. А LRU_MIN_DIRTY обычно ставят на 1 процент меньше, чем LRU_MAX_DIRTY, чтобы всё же делать не так много LRU-записей.

NETTYPE=ipcshm,2,200,CPU - скажите, Вы действительно ждёте 400 локальных пользователей? Тогда почему виртуальный сегмерт такой маленький (SHMVIRTSIZE=65536)? Помог бы выход onstat -g seg.
RESIDENT=2 - интересно, конечно, узнать, зачем делать виртуальный сегмент резидентным? Это, кажется, ничему не вредит, но просто любопытно...
DUMPCNT=1 - Вы готовы к тому, что при некоторых обстоятельствах в /tmp свалится дамп разделяемой памяти сервера? В Linux'е /tmp смотрит на физическую память, или нет - кто знает?
Ну, и от fuzzy-чекпоинта (NOFUZZYCKPT=1) я бы отказываться не стал, если только не известно про какие-то ошибки в вашей версии IDS.

Интересно было бы сравнить выходы onstat -g ioa, onstat -p и onstat -F до и после настройки этих параметров.
К слову, а статистику вы обновляете? - PDQ-параметры не настроены, а распределение обычно строят с PDQ >10, чтобы использовать несколько процессоров...
---
Желаю удачи
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34732148
KyRo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
К сожалению все что просите выложить щас не могу.
Чек поинта длинного пока нет . На следующейнеделе попробую его справоцировать загрузив дисковую подсистему.


Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
[root@ix1 ~]# onstat -g ioa

IBM Informix Dynamic Server Version  9 . 40 .UC4     -- On-Line -- Up 8 days 03:29:3                                              3 -- 664692 Kbytes

AIO global info:
    6  aio classes
   26  open files
   64  max global files

AIO I/O queues:
q name/id    len maxlen totalops  dskread dskwrite  dskcopy
  adt    0        0        0          0          0          0          0 
  msc    0        0        2     199708          0          0          0 
  aio    0        0        7   39200004         11   39186893          0 
  pio    0        0        2     208943          0     208942          0 
  lio    0        0        1   13495382          0   13495381          0 
  gfd    3        0        1      20509       7450      13059          0 
  gfd    4        0        1      21694       8635      13059          0 
  gfd    5        0      251    2276608     991413    1285195          0 
  gfd    6        0        2    1353489    1353489          0          0 
  gfd    7        0      497   12723253   10888390    1834863          0 
  gfd    8        0     1376   26576743   25376690    1200053          0 
  gfd    9       12      265   251586457   250961619     624838          0 
  gfd   10        0      373   141318974   140632036     686938          0 
  gfd   11        0     2272   168189435   161333406    6856029          0 
  gfd   12        0      177   34062527   32578165    1484362          0 
  gfd   13        0      273   115646421   115473629     172792          0 
  gfd   14        1      263   204968344   204799431     168913          0 
  gfd   15        0        1         21         21          0          0 
  gfd   16        0        1         21         21          0          0 
  gfd   17        0        2          5          3          2          0 
  gfd   18        0        0          0          0          0          0 
  gfd   19        0        0          0          0          0          0 
  gfd   20        0        0          0          0          0          0 
  gfd   21        0        0          0          0          0          0 
  gfd   22        0        0          0          0          0          0 
  gfd   23        0        0          0          0          0          0 
  gfd   24        0        0          0          0          0          0 
  gfd   25        0        0          0          0          0          0 

AIO I/O vps:
class/vp s  io/s totalops  dskread dskwrite  dskcopy  wakeups  io/wup  errors
  msc   0  i    0 . 3     199708          0          0          0     199285     1 . 0         0 
  aio   0  s  221 . 4   155847253   125796372   30043302          0   146504919     1 . 1         0 
  aio   1  s   92 . 4   65039315   57610357    7426373          0   56619056     1 . 1         0 
  aio   2  s   60 . 5   42545295   39589767    2954485          0   33853977     1 . 3         0 
  aio   3  s   48 . 3   34005472   31838679    2166195          0   25590215     1 . 3         0 
  aio   4  s   42 . 2   29678356   27796947    1880960          0   21557502     1 . 4         0 
  aio   5  s   38 . 0   26762943   25108728    1653871          0   18907622     1 . 4         0 
  aio   6  s   35 . 3   24877851   23390345    1487247          0   17233202     1 . 4         0 
  aio   7  s   29 . 6   20830712   19474103    1356366          0   13313768     1 . 6         0 
  pio   0  i    0 . 2     106771          0     106770          0     105338     1 . 0         0 
  pio   1  i    0 . 1     102172          0     102172          0     103598     1 . 0         0 
  lio   0  i   19 . 2   13495263          0   13495262          0   13495217     1 . 0         0 
  lio   1  i    0 . 0        119          0        119          0        166     0 . 7         0 

AIO global files:
gfd pathname         totalops  dskread dskwrite  io/s
   3  /dev/sda1           124980       7450     117530     0 . 2 
   4  /dev/sdc3           126165       8635     117530     0 . 2 
   5  /dev/sdc1          2057762     938392    1119370     2 . 9 
   6  /dev/sdb1         14848870    1353489   13495381    21 . 1 
   7  /dev/sdd1         10733326    9305713    1427613    15 . 3 
   8  /dev/sdd2         17530792   16598817     931975    24 . 9 
   9  /dev/sde1         78264572   77922852     341720   111 . 2 
  10  /dev/sdf1         57174563   56847147     327416    81 . 2 
  11  /dev/sdd3         48522816   44555835    3966981    68 . 9 
  12  /dev/sde2         33300664   31872505    1428159    47 . 3 
  13  /dev/sdf2         46586335   46492219      94116    66 . 2 
  14  /dev/sdd5         64772227   64683264      88963    92 . 0 
  15  /dev/sde3               21         21          0     0 . 0 
  16  /dev/sdf3               21         21          0     0 . 0 
  17  /dev/sde5                5          3          2     0 . 0 
  18  sqexplain.out
  19  //sqexplain.out
  20  //sqexplain.out
  21  //sqexplain.out
  22  //sqexplain.out
  23  //sqexplain.out
  24  //sqexplain.out
  25  //sqexplain.out

AIO big buffer usage summary:
class                 reads                                   writes
       pages    ops  pgs/op  holes  hl-ops hls/op      pages    ops  pgs/op
 kio       0         0     0 . 00        0         0     0 . 00             0        0     0 . 00 
 adt       0         0     0 . 00        0         0     0 . 00             0        0     0 . 00 
 msc       0         0     0 . 00        0         0     0 . 00             0        0     0 . 00 
 aio  1566169548    350605290     4 . 47   115763577    40798179     2 . 84        22649670   97819                                                06     2 . 32 
 pio       0         0     0 . 00        0         0     0 . 00        23541588   208942   112 . 67 
 lio       0         0     0 . 00        0         0     0 . 00        21592859   13495381     1 . 60 
onstat -p
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
IBM Informix Dynamic Server Version  9 . 40 .UC4     -- On-Line -- Up 8 days 03:30:36 -- 664692 Kbytes

Profile
dskreads pagreads bufreads %cached dskwrits pagwrits bufwrits %cached
 945110368   1568474618   528704182   0 . 00      28045174   56052423   233913215   88 . 01 

isamtot  open     start    read     write    rewrite  delete   commit   rollbk
 1221563457   6952807    106766911   595447322   116892956   7953945    32729036   13404357   65 

gp_read  gp_write gp_rewrt gp_del   gp_alloc gp_free  gp_curs
 0          0          0          0          0          0          0 

ovlock   ovuserthread ovbuff   usercpu  syscpu   numckpts flushes
 0          0              0          38779 . 50   47786 . 92   2389       7134 

bufwaits lokwaits lockreqs deadlks  dltouts  ckpwaits compress seqscans
 17474564   144        1868161200   0          0          1125       1093261    964063 

ixda-RA  idx-RA   da-RA    RA-pgsused lchwaits
 37220134   194257     621554984   658783316    7024043 

onstat -F
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
IBM Informix Dynamic Server Version  9 . 40 .UC4     -- On-Line -- Up 8 days 03:32:00 -- 664692 Kbytes


Fg Writes     LRU Writes    Chunk Writes
 0               4617094         8827935 

address  flusher  state    data
 68755630   0         I         0         = 0X0
68755c48  1         I         0         = 0X0
 68756260   2         I         0         = 0X0
 68756878   3         I         0         = 0X0
68756e90  4         I         0         = 0X0
687574a8  5         I         0         = 0X0
68757ac0  6         I         0         = 0X0
687580d8  7         I         0         = 0X0
      states: Exit Idle Chunk Lru

onstat -g seg

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
root@ix1 ~]# onstat -g seg

IBM Informix Dynamic Server Version  9 . 40 .UC4     -- On-Line -- Up 8 days 03:33:01 -- 664692 Kbytes

Segment Summary:
id       key        addr     size       ovhd     class blkused  blkfree
 65536      1381386241   44000000   609046528    233412    R*     148667     26 
 163843     1381386244  684d5000  67108864     2688      V*     10182      6202 
 196612     1381386245  6c4d5000  2244608      712       M      519        29 
 229381     1381386246  6c6f9000  2244608      712       M      517        31 
Total:   -          -         680644608   -        -      159885     6288 

   (* segment locked in memory)

onstat -g iov

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
IBM Informix Dynamic Server Version  9 . 40 .UC4     -- On-Line -- Up 8 days 03:34:31 -- 664692 Kbytes

AIO I/O vps:
class/vp s  io/s totalops  dskread dskwrite  dskcopy  wakeups  io/wup  errors
  msc   0  i    0 . 3     199920          0          0          0     199497     1 . 0         0 
  aio   0  s  221 . 6   156012331   125955778   30048974          0   146621092     1 . 1         0 
  aio   1  s   92 . 6   65184109   57749466    7432058          0   56718123     1 . 1         0 
  aio   2  s   60 . 6   42671282   39710976    2959263          0   33936303     1 . 3         0 
  aio   3  s   48 . 5   34121097   31949803    2170696          0   25661647     1 . 3         0 
  aio   4  s   42 . 3   29786336   27900297    1885590          0   21621140     1 . 4         0 
  aio   5  s   38 . 2   26863346   25204966    1658036          0   18963114     1 . 4         0 
  aio   6  s   35 . 5   24973375   23482033    1491083          0   17283340     1 . 4         0 
  aio   7  s   29 . 7   20921431   19561056    1360132          0   13358670     1 . 6         0 
  pio   0  i    0 . 2     106816          0     106815          0     105380     1 . 0         0 
  pio   1  i    0 . 1     102209          0     102209          0     103638     1 . 0         0 
  lio   0  i   19 . 2   13498649          0   13498648          0   13498603     1 . 0         0 
  lio   1  i    0 . 0        119          0        119          0        166     0 . 7         0 

Тут вроде все что вы просили , надеюсь эти данные что то прояснят . Сейчас поставлю на крон выгрузки может получится где небуть словить чек поинт.
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34732724
Алексан
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
[root@ix1 ~]# onstat -g ioa

IBM Informix Dynamic Server Version  9 . 40 .UC4     -- On-Line -- Up 8 days 03:29:3                                              3 -- 664692 Kbytes

AIO global info:
    6  aio classes
   26  open files
   64  max global files

AIO I/O queues:
q name/id    len maxlen totalops  dskread dskwrite  dskcopy
...
  gfd    5        0      251    2276608     991413    1285195          0 
  gfd    6        0        2    1353489    1353489          0          0 
  gfd    7        0      497   12723253   10888390    1834863          0 
  gfd    8        0     1376   26576743   25376690    1200053          0 
  gfd    9       12      265   251586457   250961619     624838          0 
  gfd   10        0      373   141318974   140632036     686938          0 
  gfd   11        0     2272   168189435   161333406    6856029          0 
  gfd   12        0      177   34062527   32578165    1484362          0 
  gfd   13        0      273   115646421   115473629     172792          0 
  gfd   14        1      263   204968344   204799431     168913          0 
...
Производительность ввода/вывода не считается хорошей, если длина очередей бывает (столбец maxlen) больше 32, здесь же она меряется в сотнях и тысячах.

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
AIO I/O vps:
class/vp s  io/s totalops  dskread dskwrite  dskcopy  wakeups  io/wup  errors
...
  aio   0  s  221 . 4   155847253   125796372   30043302          0   146504919     1 . 1         0 
  aio   1  s   92 . 4   65039315   57610357    7426373          0   56619056     1 . 1         0 
  aio   2  s   60 . 5   42545295   39589767    2954485          0   33853977     1 . 3         0 
  aio   3  s   48 . 3   34005472   31838679    2166195          0   25590215     1 . 3         0 
  aio   4  s   42 . 2   29678356   27796947    1880960          0   21557502     1 . 4         0 
  aio   5  s   38 . 0   26762943   25108728    1653871          0   18907622     1 . 4         0 
  aio   6  s   35 . 3   24877851   23390345    1487247          0   17233202     1 . 4         0 
  aio   7  s   29 . 6   20830712   19474103    1356366          0   13313768     1 . 6         0 
...
А столбец io/wup > 1 говорит, что когда AIO VP просыпается, у него в очереди уже находится более одного запроса - один он начинает выполнять, а остальные - ждут...

onstat -p
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
IBM Informix Dynamic Server Version  9 . 40 .UC4     -- On-Line -- Up 8 days 03:30:36 -- 664692 Kbytes

Profile
dskreads pagreads bufreads %cached dskwrits pagwrits bufwrits %cached
 945110368   1568474618   528704182   0 . 00      28045174   56052423   233913215   88 . 01 

isamtot  open     start    read     write    rewrite  delete   commit   rollbk
 1221563457   6952807    106766911   595447322   116892956   7953945    32729036   13404357   65 

gp_read  gp_write gp_rewrt gp_del   gp_alloc gp_free  gp_curs
 0          0          0          0          0          0          0 

ovlock   ovuserthread ovbuff   usercpu  syscpu   numckpts flushes
 0          0              0          38779 . 50   47786 . 92   2389       7134 

bufwaits lokwaits lockreqs deadlks  dltouts  ckpwaits compress seqscans
 17474564   144        1868161200   0          0          1125       1093261    964063 

ixda-RA  idx-RA   da-RA    RA-pgsused lchwaits
 37220134   194257     621554984   658783316    7024043 
Довольно много последовательных сканирований таблиц (т.е. доступ к данным производится не через индексы, а перебором всех данных в таблицу) - seqscans=964063; недостаточная эффективность кэширования на чтение (%cached=0.00); вдохновляющая эффективность упреждающего чтения (ixda-RA+idx-RA+da-RA/RA-pgsused = 99.9%). Всё вместе это наводит на мысль, что есть таблицы, которые плохо проиндексированы. Или статистика не обновляется достаточно часто. Посмотрите на http://www.iiug.org/software/software_index.html, там наверняка есть программы по обновлению статистики и скрипты, которые помогут Вам найти плохо проиндексированные таблицы.
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34758623
vasilis
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
onstat- KyRo
Можно ли сделать что бы приоритет доступа к дискам был у чек поинтов ?

Пусть на вам вопрос ответит тот кто ставил параметр NOFUZZYCKPT .
Подозреваю это были не Вы, если задаете этот вопрос.
Не вижу взаимосвязи.
И судя по всему, вы категорически отрицаете установку этого параметра (NOFUZZYCKPT) ?
onstat-Правилный ответ нельзя,
Из этого ответа можно понять, что приоритета нет, но он есть :)
onstat-
Почитайте в руководстве Системного Администратора о том, что происходит вовремя checkpoint,

Совершенно верно. Там ясно видно, что на время выполнения СР приостанавливаются все активные транзакции, кроме тех, которые находятся в критической части кода, ведущего текущий вв/выв (это вполне естественно для этой модели СР).
И длительные СР чаще всего не от объема работы самой СР, а говорят просто о том, что СР ожидает (находится в стадии ожидания) завершения критической части кода одной из транзакций.

onstat-
RESIDENT 2 # Forced residency flag (Yes = 1, No = 0)
Из каких соображений стоит значение 2 ?
А чем это плохо ? У него 4 Гига памяти из которых используется менее четверти. Почему бы не оставить резидентными оба основных сегмента ?
onstat-
CLEANERS 8 # Number of buffer cleaner processes
CLEANERS попробуйте увеличить до количества активно используемых чанков .

Для начала неплохо бы увидеть загрузку этих очистителей (onstat -u после нескольких часов работы). Может оказаться, что их хватает с избытком.

onstat-
LRU_MAX_DIRTY 8.000000 # LRU percent dirty begin cleaning limit
LRU_MIN_DIRTY 2.000000 # LRU percent dirty end cleaning limit

попробуйте значения :
LRU_MAX_DIRTY 1.000000 # LRU percent dirty begin cleaning limit
LRU_MIN_DIRTY 0.000000 # LRU percent dirty end cleaning limit

В данном случае это не нужно.
При его буферном пуле в 500М его 2% составляют всего 10М, что не составит труда для сброса на диск во время СР. А ваши же параметры (1 и 0) заставять все время "лопатить" очереди LRU и непрерывно писать на диск, что не скажется лучшим образом на эффективности системы в целом.
Еще раз повторюсь, что в данном случае работы самому СР по сбросу буферов достаточно мало - длительность происходит из-за ожидания остановки транзакции. Почему так происходит - отдельный вопрос.
onstat-
На основании чего устанавливались такие начения?
RA_PAGES 128 # Number of pages to attempt to read ahead
RA_THRESHOLD 64 # Number of pages left before next group

А что? Нормальные значения. И дальнейшие цифры показывают прекрасную эффективность таких значений.
onstat-
тогда почему так мало в SHMVIRTSIZE ?

Присоединяюсь. Какие то маленькие значения размеров сегментов, хотя памяти на сервере полно.
onstat-
DBSPACETEMP tempdbs1 # Default temp dbspaces

Я бы обязательно добавил еще хотя бы один темповый спейс.
onstat-
А это из каких соображений устанавливалось?
NOFUZZYCKPT 1
Могу сказать свои соображения для частных случаев, о которых я уже не раз писал.
Наблюдая (по Hotline) несколько сот серверов 9.3 на Win2000 в жутких условиях (броски питания без UPS, выключения или перезагрузка серверов рубильником, кеширование диска/RAID на запись, нехватка админов и работа в автономном режиме), изредка (для такого количества) вижу крах системы, когда сервер после такого "выключения" не может поднятся при fast recovery, точнее, не может откатить транзакции из лога. ВО ВСЕХ случаях был фаззи СР. Ни разу не видел, чтобы такая ситуация произошла с сервером, на котором фаззи был бы выключен, т.е. NOFUZZYCKPT 1.
Подозреваю, что на 9.30 механизм "нечеткой" КТ еще не был достаточно вылизан.
Возможно, тут сказываются еще и особенности платформы.
...
Рейтинг: 0 / 0
Длинный чек поинт
    #34758696
vasilis
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Господа, не ленитесь резать процитированные сообщения, выделяя из них только самое нужное.
А то очень тяжело потом искать нужную информацию среди полного вывода onconfig :)
Алексан
Подсистема ввода/вывода настроена не идеально:
RA_PAGES=128 и RA_THRESHOLD=64 - установите из в 32 и 30 соответственно и, после этого, мониторьте использование упреждающего чтения, сравнивая ixda-RA+idx-RA+da-RA и RA-pgsused из выхода onstat -p - они должны быть очень близки.
Дальнешие цифры показали прекрасную эффективность параметров (128 и 64). Так что не надо их уменьшать и уж тем более, до разницы в 2 страницы. Такие примеры (32 и 30) приводились для старых и медленных дисков, сейчас это неактуально.
Алексан
Какими бы большими мы эти параметры не ставили, сервер всё равно считывает за один раз не больше чем 32 страницы.

Если можно - ссылку на такое ограничение, которое я вижу впервые. Возможно, вы путаете с big buffer ?
Алексан
Кроме того, SCSI-шина работает по принципу "один говорит - все молчат", поэтому пытаться ставить такое большое значение - значит наступать себе на хвост.

Если это эффективно, т.е. почти 100% считанных страниц будет использовано в дальнейшем, то какая разница ? Даже лучше, если мы "дернем" один раз, вместо двух.
Алексан
RESIDENT=2 - интересно, конечно, узнать, зачем делать виртуальный сегмент резидентным? Это, кажется, ничему не вредит, но просто любопытно...
например, чтобы гарантировать НЕпопадание в своп.
...
Рейтинг: 0 / 0
25 сообщений из 39, страница 1 из 2
Форумы / Informix [игнор отключен] [закрыт для гостей] / Длинный чек поинт
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]