powered by simpleCommunicator - 2.0.30     © 2024 Programmizd 02
Map
Форумы / Informix [игнор отключен] [закрыт для гостей] / Сервер не дает коннектиться и пропускает чекпойнты
70 сообщений из 70, показаны все 3 страниц
Сервер не дает коннектиться и пропускает чекпойнты
    #38494495
falcon111
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Используется 11.50FC9 x64 на Srv2008R2 x64.
Давно все настроено, работает и есть не просит. Нагрузка не большая - меньше 100 одновременных сессий.

Сегодня вдруг сервер перестал принимать коннекты. Телнетом локально пробовали к нему подключиться - нет коннекта.
Сервер перезагрузили, не помогло.
Вызвонили меня, пока я добрался до сервера - все уже работает.
Посмотрел сервер лог - все чисто, единственное, что бросилось в глаза, когда сервер не отвечал, в логе между чекпойнтами увеличено время.

Начиная с 16:35 время между чекпойнтами растянуто. В 16:55 - то же самое. Начиная с 17:21 все, вроде, ок.
Вопрос, что делать? Как проверить чем сервер занимался в это время, и что надо сделать, чтобы подобное не повторялось?

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
16:05:06  Maximum server connections 12 
16:05:06  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 132, Llog used 1045

16:10:10  Checkpoint Completed:  duration was 0 seconds.
16:10:10  Mon Dec 09 - loguniq 11384, logpos 0x1078018, timestamp: 0xeb18ac8 Interval: 308934

16:10:10  Maximum server connections 12 
16:10:10  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 118, Llog used 724

16:15:14  Checkpoint Completed:  duration was 0 seconds.
16:15:14  Mon Dec 09 - loguniq 11384, logpos 0x1485018, timestamp: 0xeb4b6ac Interval: 308935

16:15:14  Maximum server connections 12 
16:15:14  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 179, Llog used 1037

16:20:18  Checkpoint Completed:  duration was 0 seconds.
16:20:18  Mon Dec 09 - loguniq 11384, logpos 0x1984018, timestamp: 0xeba17b6 Interval: 308936

16:20:18  Maximum server connections 12 
16:20:19  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 217, Llog used 1282

16:25:23  Checkpoint Completed:  duration was 0 seconds.
16:25:23  Mon Dec 09 - loguniq 11384, logpos 0x1ea7018, timestamp: 0xec20171 Interval: 308937

16:25:23  Maximum server connections 12 
16:25:23  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 216, Llog used 1315

16:30:27  Checkpoint Completed:  duration was 0 seconds.
16:30:27  Mon Dec 09 - loguniq 11384, logpos 0x1eaa018, timestamp: 0xec202c9 Interval: 308938

16:30:27  Maximum server connections 12 
16:30:27  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 2, Llog used 3

16:40:35  Checkpoint Completed:  duration was 0 seconds.
16:40:35  Mon Dec 09 - loguniq 11384, logpos 0x1ead018, timestamp: 0xec20570 Interval: 308939

16:40:35  Maximum server connections 12 
16:40:35  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 3, Llog used 3

16:55:48  Checkpoint Completed:  duration was 0 seconds.
16:55:48  Mon Dec 09 - loguniq 11384, logpos 0x1eaf018, timestamp: 0xec2094f Interval: 308940

16:55:48  Maximum server connections 12 
16:55:48  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 2, Llog used 2

17:11:00  Checkpoint Completed:  duration was 0 seconds.
17:11:00  Mon Dec 09 - loguniq 11384, logpos 0x1eb9018, timestamp: 0xec20d98 Interval: 308941

17:11:00  Maximum server connections 12 
17:11:00  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 20, Llog used 10

17:21:09  Checkpoint Completed:  duration was 0 seconds.
17:21:09  Mon Dec 09 - loguniq 11384, logpos 0x1ebf018, timestamp: 0xec21056 Interval: 308942

17:21:09  Maximum server connections 12 
17:21:09  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 9, Llog used 6

17:26:13  Checkpoint Completed:  duration was 0 seconds.
17:26:13  Mon Dec 09 - loguniq 11384, logpos 0x1f95018, timestamp: 0xec25b8d Interval: 308943

17:26:13  Maximum server connections 12 
17:26:13  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 115, Llog used 216

17:28:24  Logical Log 11384 Complete, timestamp: 0xec2d472.
17:31:17  Checkpoint Completed:  duration was 0 seconds.
17:31:17  Mon Dec 09 - loguniq 11385, logpos 0xbd018, timestamp: 0xec3a22d Interval: 308944

17:31:17  Maximum server connections 12 
17:31:17  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 134, Llog used 296

17:36:21  Checkpoint Completed:  duration was 0 seconds.
17:36:21  Mon Dec 09 - loguniq 11385, logpos 0x27f018, timestamp: 0xec53432 Interval: 308945

17:36:21  Maximum server connections 15 
17:36:22  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 107, Llog used 450

17:41:26  Checkpoint Completed:  duration was 0 seconds.
17:41:26  Mon Dec 09 - loguniq 11385, logpos 0x707018, timestamp: 0xecaedac Interval: 308946

17:41:26  Maximum server connections 15 
17:41:26  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 314, Llog used 1160

17:46:30  Checkpoint Completed:  duration was 0 seconds.
17:46:30  Mon Dec 09 - loguniq 11385, logpos 0xbec018, timestamp: 0xed1c726 Interval: 308947

17:46:30  Maximum server connections 15 
17:46:30  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 245, Llog used 1253

17:51:34  Checkpoint Completed:  duration was 0 seconds.
17:51:34  Mon Dec 09 - loguniq 11385, logpos 0x101a018, timestamp: 0xed521de Interval: 308948
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38495118
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
falcon111Сервер перезагрузили, не помогло.


В логе не видно, что сервер перезагружали
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38537485
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Ситуация один-в-один!

Используем IDS 11.70FC4 (Проверяли и на 11.70FC7).
Настроены 2 подключения по olsoctcp и drsoctcp.
В какой-то момент по drda остаются доступны только select`ы. olsoc лежит мертво - ни dbacces, ни esqleditor, ни ilogin не подключаются.

Внешне все выглядит так:
1. onstat - дает online
2. onparams без параметров пишет после таймаута - шаред мемори не инициализирована
3. telnet на оба порта подключается!
4. в log журнале как и у автора - только список чекпоинтов, причем последний 20-30-40 минут назад. хотя до этого каждые 5 минут был отчет.
5. onstat с различными ключами - ничего криминального. все в пределах нормы.
6. В мониторе windows - нет никакой дисковой активности на datadbs. была замечена непродолжительное время и незначительная на tempdbs. Память и CPU на oninit тоже без активности.
7. Во время одного из разбирательств сервер ожил(!) сам. В логе ничего не появилось.
8. Заметили, что все же активнее уходит в себя в моменты пиковой активности в течение рабочего дня. Вечером вроде не проявляется. Хотя в логе за ночь тоже присутствуют окна в 15-25 минут между чекпоинтами.

То есть он уходит сам в себя на достаточно продолжительное время. Внешне никак это не обозначает и выяснить что же там происходит пока не можем. Проблема резко всплыла после новогодних праздников, но и в декабре похоже были звоночки.

До этого как и у автора - работало год-два. А тут две ужасных недели --- каждые час-полтора приходится перестартовывать службу - заказчик уже нервничает. Мы не можем понять причин. Кстати остановка службы при перезапуске происходит минут 5-7.

falcon111, чем все закончилось у вас?

Встречаются еще упоминания о данной ситуации
http://www.dbtalk.net/comp-databases-informix/problems-long-checkpoints-664021.html

но никакой конкретики.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38537927
Возможно не в тему, но как-то вызвали у 11.50FC8W2 задумчивые тормоза и уходы в астрал вот точно с такими же отходняками как включили во встроеном шедулере автоапдейт статистики.

Неделя ахтунга, но как сообразили и отключили - жопа закончилась разом.

Были там пропуски чекпоинтов или не не помню. Но коннектиться давал.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538617
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Яковлев Павел, тоже сталкивались с этим, поэтому его останавливаем

20:49:56 On-Line Mode
20:49:57 SCHAPI: "INFORMIXDIR/etc/sysadmin/stop" file is present.
Bypassing dbScheduler and dbWorker threads startup.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538711
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Что было сделано:
1) в CONFIG включен RTO: RTO_SERVER_RESTART 300
2) у всех клиентов (3 клиента - 2 по olsoctcp, 1 по drda) выставлено время жизни сессии в пуле соединений клиента 30 сек. Было где-то 60 (умолчание), где-то 1800.


Что получили:
1) ухода в себя нет. сервер работает и обслуживает всех клиентов. вроде радость, но:
2) в логе и по onstat -g ckp нет чекпоинтов.

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
AUTO_CKPTS=On   RTO_SERVER_RESTART=300 seconds   Estimated recovery time 102 seconds

                                                                    Critical Sections                          Physical Log    Logical Log
           Clock                                  Total Flush Block #      Ckpt  Wait  Long  # Dirty   Dskflu  Total    Avg    Total    Avg
Interval   Time      Trigger    LSN               Time  Time  Time  Waits  Time  Time  Time  Buffers   /Sec    Pages    /Sec   Pages    /Sec
1778       20:49:56  Startup    4893:0x4c7c0c0    1.0   0.9   0.0   0      0.0   0.0   0.0   5         5       2        0      1        0

Max Plog       Max Llog       Max Dskflush   Avg Dskflush   Avg Dirty      Blocked
pages/sec      pages/sec      Time           pages/sec      pages/sec      Time
480            2532           1              5              0              0



То есть первая половина рабочего дня понедельника не чекпоинтилась.
Решили сделать принудительный сброс onmode -c.
Запустили в 10:45. Сейчас уже 11:10. Команда выполняется. Мы стали волноваться.

onstat -g iof
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
AIO global files:
gfd pathname         bytes read     page reads  bytes write    page writes io/s
3   **D:\IFMXDATA\ol_css2\rootdbs_dat.000 2796646400     682775      681902080      166480      1702.1
        op type     count          avg. time
        seeks       0              N/A
        reads       0              N/A
        writes      0              N/A
        kaio_reads  558151         0.0004
        kaio_writes 89907          0.0016

4   **D:\IFMXDATA\ol_css2\tempdbs_dat.000 19757256704    4823549     19669508096    4802126     1947.0
        op type     count          avg. time
        seeks       0              N/A
        reads       0              N/A
        writes      0              N/A
        kaio_reads  328120         0.0006
        kaio_writes 305291         0.0004



Данные у нас в этом инстансе лежат в root (также как и физ.лог и лог.лог). Значение writes (предпоследняя цифра) у rootdbs растет все это время. В планах есть разделить rootdbs на root, data, plog и llog. А сейчас конечно непонятно по кому идет активность.
Пока писал onmode -c продолжает работать (время 11:30)


Собственно этим постом хотел спросить:
1) Что происходит?
2) Как посмотреть что происходит?
3) Что будет если перезапустить информикс? Архив ночной есть.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538772
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Итак прошел час (11:45) после запуска команды
Код: sql
1.
onmode -c  


и все --- сервер ушел в себя со всеми описанными выше симптомами:
1) телнеты на оба порта (olsoctcp и drsoctcp) подключаются
2) дисковой активности через монитор Windows - 0
3) С начала запуска сервера (вчера вечером) заполнилось 7 логических журналов по 100мб из 51.
4) коннект на порт olsoctcp не идет ни откуда.
5) коннект по drda с клиента идет!
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
C:\Program Files\IBM\IBM DATA SERVER DRIVER\bin>testconn40.exe  "database=css; server=192.168.5.19:9189; userid=portal; password=*****" 

Step 1: Printing version info
	.NET Framework version: 4.0.30319.1
	64-bit
	DB2 .NET provider version: 9.7.4.4
	DB2 .NET file version: 9.7.4.4
	Capability bits: ALLDEFINED
	Build: 20110330
	Factory for invariant name IBM.Data.DB2 verified
	Factory for invariant name IBM.Data.Informix verified
	IBM.Data.Informix from DbFactory is the Common Informix .NET provider
IBM Database Add-ins is not installed properly
        Elapsed: 2.1529104

Step 2: Validating db2dsdriver.cfg against db2dsdriver.xsd schema file
	File C:\ProgramData\IBM\DB2\IBMDBCL1\cfg\db2dsdriver.cfg  missing. Nothing to validate
        Elapsed: 0.0156008

Step 3: Connecting using "database=css; server=192.168.5.19:9189; userid=portal; password=***"
	Server type and version: IDS 11.70.0000
        Elapsed: 1.5912816

Step 4: Selecting rows from informix.systables to validate existence of packages
   SELECT * FROM informix.systables
        Elapsed: 0.4992256

Step 5: Calling GetSchema for tables to validate existence of schema functions
        Elapsed: 0.9672496


Test passed.



Есть снятый лог
Код: sql
1.
onstat -g all

на момент ухода сервера в себя.

Еще примечательный момент - сессии зависли и не освобождаются. Хотя в пуле клиента они уже явно просрочены:

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 15:26:57 -- 1180800 Kbytes

session                                      #RSAM    total      used       dynamic 
id       user     tty      pid      hostname threads  memory     memory     explain 
2234     informix -        0        -        0        16384      12528      off 
2218     informix -        0        -        0        16384      12528      off 
2217     alsuz    TSR_APP  17216    TSR_APP  2        3727360    3720976    off 
2216     dlr      TSR_APP  17216    TSR_APP  1        163840     85792      off 
2215     xisam    TSR_APP  17216    TSR_APP  1        3399680    3333168    off 
2213     shtm     TSR_APP  17216    TSR_APP  1        3592192    3524736    off 
2212     portal   SZAPP-SO 1548     SZAPP-SO 1        700416     679776     off 
2211     portal   SZAPP-SO 1548     SZAPP-SO 1        1355776    1333136    off 
2206     guzeliya TSR_APP  17216    TSR_APP  1        2002944    1918656    off 
2205     ludan    TSR_APP  17216    TSR_APP  1        4329472    4274704    off 
2202     zo       TSR_APP  17216    TSR_APP  2        4583424    4548480    off 
2190     kuleeva  TSR_APP  17216    TSR_APP  3        4714496    4679824    off 
2072     portal   SZAPP-SO 1548     szapp-so 1        2572288    2469168    off 
2061     informix -        0        -        1        45056      41360      off 
2046     portal   SZAPP-SO 1548     szapp-so 2        589824     516256     off 
2035     portal   SZAPP-SO 1548     szapp-so 3        1429504    1202656    off 
1992     portal   SZAPP-SO 1548     szapp-so 4        1822720    1463472    off 
1765     portal   SZAPP-SO 1548     szapp-so 4        2342912    1921296    off 
1741     portal   SZAPP-SO 1548     szapp-so 3        1953792    1711296    off 
1704     portal   SZAPP-SO 1548     szapp-so 4        1286144    1192928    off 
1589     portal   SZAPP-SO 1548     szapp-so 4        720896     445504     off 
1583     portal   SZAPP-SO 1548     szapp-so 3        2457600    2244288    off 
1581     informix -        0        -        1        45056      41360      off 
1563     alfiyab  TSR_APP  17216    TSR_APP  3        4268032    4244640    off 
1527     liliyaga TSR_APP  17216    TSR_APP  3        4653056    4615168    off 
1522     shtm     TSR_APP  17216    TSR_APP  2        4071424    4042976    off 
1438     portal   SZAPP-SO 1548     szapp-so 2        1339392    1133280    off 
1436     informix -        0        -        1        45056      41360      off 
1373     portal   SZAPP-SO 1548     szapp-so 4        2375680    2111888    off 
1368     portal   SZAPP-SO 1548     szapp-so 4        1007616    915504     off 
1366     dlr      TSR_APP  17216    TSR_APP  3        3624960    3594064    off 
1364     2224     TSR_APP  17216    TSR_APP  1        147456     82864      off 
1361     portal   SZAPP-SO 1548     szapp-so 3        1146880    942064     off 
1333     portal   SZAPP-SO 1548     SZAPP-SO 1        1388544    1353120    off 
870      informix TSR_DB   4400     TSR_DB   1        98304      95904      off 
164      portal   SZAPP-SO 1548     szapp-so 4        2854912    2506528    off 
28       informix -        0        -        1        57344      50336      off 
6        informix -        0        -        0        16384      14240      off 
5        informix -        0        -        0        16384      14240      off 
4        informix -        0        -        0        16384      12528      off 
3        informix -        0        -        0        16384      12528      off 
2        informix -        0        -        0        16384      12528      off 
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538779
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torero... Нагрузка не большая - меньше 100 одновременных сессий...
Собственно этим постом хотел спросить:
1) Что происходит?
2) Как посмотреть что происходит?
3) Что будет если перезапустить информикс? Архив ночной есть.

Рискну предположить, что нагрузка таки есть. В процессе синхронизации буферов с чанками данные от клиентов продолжают поступать. Другими словами, скорость поступления данных выше скорости сброса буферов на диск. В какой-то момент данных скапливается так много, и поскольку Informix отдает приоритет процессу обработки контрольной точки, обработка поступающих данных прекращается, становятся возможны только селекты, модификация данных невозможна, что и происходит у вас периодически.
Посмотреть, что происходит, можно командами onstat -d, onstat -F, onstat -g seg, onstat -u, onstat -g ses.
Рекомендую найти сессию, которая активно вставляет или модифицирует данные на сервере.
Инстанс лучше не перезапускать, есть риск потери данных со времени последнего архива.
После завершения чекпоинта надо будет посмотреть onstat -g ckp и вывод из журнала сообщений.
Там должны быть полезные рекомендации. Следовать им необязательно, но определенные выводы сделать можно.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538790
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
дополнительная информация на 12:10
1) в логах клиента который одновременно работает по olsoctcp и drda ошибки на модификацию (транзакцию) пошли сразу после команды onmode -c.
2) подключение по drda все еще идет!
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538813
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
victor16,

1) нагрузки нет. клиенты судя по логам и нашим попыткам зайти в клиентское приложение просто не могут проконнектиться по olsoctcp. По drda при этом коннект проходит. Но по drda идет только выборка без модификаций.
2) Сессии я приводил выше - они заморозились на момент недоступности сервера. Сейчас (12:23) проверил - они все на месте.
3) Запросы неоднократно профилировали и трейсили - система картотечная - нет длинных вставок, удалений или модификаций, свойственных аналитическим задачам. (мы на запросы сразу начали думать, как столкнулись с таким поведением. сейчас тоже допускаем конечно же их вину, но уже гипотетически. )
4) С другой стороны- что может "натворить" запрос? Длинный insert переполнит логи и будет long transaction aborted - но это явное и прогнозируемое поведение. и проблемы будут у конкретной сессии. мы искусственно вызывали такое поведение - сервер стоял как ни в чем ни бывало.

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
D:\>onstat -g sql

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 15:49:06 -- 1180800 Kbytes


Sess       SQL            Current            Iso Lock       SQL  ISAM F.E.
Id         Stmt type      Database           Lvl Mode       ERR  ERR  Vers  Explain
2217       SELECT         css                CR  Wait 10    0    0    3.50. Off
2216       -              css                CR  Wait 10    0    0    3.50. Off
2215       -              css                CR  Wait 10    0    0    3.50. Off
2213       -              css                CR  Wait 10    0    0    3.50. Off
2212       -              css                CR  Not Wait   0    0    -     Off
2211                      css                CR  Not Wait   0    0    -     Off
2206       -              css                CR  Wait 10    0    0    3.50. Off
2205       -              css                CR  Wait 10    0    0    3.50. Off
2202       SELECT         css                CR  Wait 10    0    0    3.50. Off
2190       SELECT         css                CR  Wait 10    0    0    3.50. Off
2072       -              css                CR  Wait 10    0    0    3.50. Off
2046       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
2035       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
1992       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
1765       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
1741       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
1704       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
1589       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
1583       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
1563       SELECT         css                CR  Wait 10    0    0    3.50. Off
1527       SELECT         css                CR  Wait 10    0    0    3.50. Off
1522       SELECT         css                CR  Wait 10    0    0    3.50. Off
1438       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
1373       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
1368       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
1366       SELECT         css                CR  Wait 10    0    0    3.50. Off
1364       -              css                CR  Wait 10    0    0    3.50. Off
1361       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
1333                      css                CR  Not Wait   0    0    -     Off
870        SELECT         css                CR  Not Wait   0    0    9.250 Off
164        CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off


Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
D:\>onstat -F

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 15:49:44 -- 1180800 Kbytes


Fg Writes     LRU Writes    Chunk Writes
0             0             0

address           flusher  state    data     # LRU    Chunk    Wakeups  Idle Tim
b8786858         0        I        0        0        1        133695   135612.078
b8787080         1        I        0        0        1        138162   140295.056
b87878a8         2        I        0        0        0        141355   143380.621
b87880d0         3        I        0        0        0        133694   135612.111
b87888f8         4        I        0        0        0        141387   143380.587
b8789120         5        I        0        0        0        138162   140296.042
b8789948         6        I        0        0        0        141355   143380.643
b878a170         7        I        0        0        0        133694   135612.291
      states: Exit Idle Chunk Lru


Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
D:\>onstat -g seg

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 15:50:17 -- 1180800 Kbytes

Segment Summary:
id         key        addr             size             ovhd     class blkused  blkfree
1381517313 52584801   80000000         940703744        11461456 R     229654   10
1381517314 52584802   b8120000         268435456        3147392  V     40517    25019
Total:     -          -                1209139200       -        -     270171   25029

   (* segment locked in memory)
No reserve memory is allocated


Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
102.
103.
104.
105.
106.
107.
onstat -u
IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 15:51:09 -- 1180800 Kbytes

Userthreads
address          flags   sessid   user     tty      wait             tout locks nreads   nwrites
b8786030         ---P--D 1        informix -        0                0    0     24       10
b8786858         ---P--F 0        informix -        0                0    0     0        1
b8787080         ---P--F 0        informix -        0                0    0     0        4
b87878a8         ---P--F 0        informix -        0                0    0     0        0
b87880d0         ---P--F 0        informix -        0                0    0     0        0
b87888f8         ---P--F 0        informix -        0                0    0     0        0
b8789120         ---P--F 0        informix -        0                0    0     0        0
b8789948         ---P--F 0        informix -        0                0    0     0        0
b878a170         ---P--F 0        informix -        0                0    0     0        0
b878a998         ---P--- 9        informix -        0                0    0     0        0
b878b1c0         ---P--B 10       informix -        0                0    0     85754    1040
b878b9e8         ---P--D 11       informix -        0                0    0     32667    0
b878c210         Y--P--- 28       informix -        b95612e0         0    0     0        0
b878ca38         ---P--D 15       informix -        0                0    0     0        0
b878d260         Y--P--- 1563     alfiyab  TSR_APP  bd576d50         0    1     163      179
b878da88         ---P--D 16       informix -        0                0    0     3        0
b878e2b0         Y--P--D 24       informix -        80b7af08         0    0     0        0
b878ead8         Y--P--- 1765     portal   SZAPP-SO c220c490         0    2     20765    23942
b878fb28         ------- 1373     portal   SZAPP-SO 0                0    2     0        0
b8790350         Y--P--- 1373     portal   SZAPP-SO c0aef800         0    2     10085    11863
b8790b78         ---P--- 1333     portal   SZAPP-SO 0                0    1     13       0
b87913a0         Y--P--- 2215     xisam    TSR_APP  c15d7170         0    1     1        5
b87923f0         Y--P--- 1366     dlr      TSR_APP  bde89c50         0    2     0        5
b8792c18         ------- 1361     portal   SZAPP-SO 0                0    2     0        0
b8793440         Y--P--- 870      informix TSR_DB   bde89a70         0    1     13       0
b8793c68         Y------ 1373     portal   SZAPP-SO bdbd39a0         0    2     0        0
b8794490         Y--P--- 1368     portal   SZAPP-SO bf58bf40         0    2     2        3
b8794cb8         Y--P--- 164      portal   SZAPP-SO ba569870         0    2     146113   185714
b87954e0         ------- 164      portal   SZAPP-SO 0                0    2     0        0
b8795d08         Y------ 1366     dlr      TSR_APP  b9dd1030         0    2     0        0
b8796530         Y------ 164      portal   SZAPP-SO b938a6a0         0    2     0        0
b8796d58         Y--P--- 1361     portal   SZAPP-SO bcbec030         0    2     844      866
b8797580         ------- 1368     portal   SZAPP-SO 0                0    2     0        0
b8797da8         ------- 1361     portal   SZAPP-SO 0                0    2     0        0
b87985d0         Y------ 1361     portal   SZAPP-SO bcc7f490         0    2     0        0
b8798df8         Y------ 1368     portal   SZAPP-SO bce09870         0    2     0        0
b8799620         Y------ 1765     portal   SZAPP-SO c2eb0c00         0    2     0        0
b879a670         Y------ 164      portal   SZAPP-SO ba56e2a0         0    2     0        0
b879ae98         ------- 1366     dlr      TSR_APP  0                0    2     0        0
b879b6c0         Y--P--- 1364     2224     TSR_APP  c0b04210         0    1     1        2
b879bee8         ------- 1368     portal   SZAPP-SO 0                0    2     0        0
b879c710         Y------ 1368     portal   SZAPP-SO bf753030         0    2     0        0
b879cf38         Y--P--- 1741     portal   SZAPP-SO b9413de0         0    2     2864     3304
b879df88         ---P--- 1438     portal   SZAPP-SO 0                0    2     4029     4163
b879e7b0         Y--P--- 1527     liliyaga TSR_APP  bf7538f0         0    1     10825    10856
b879efd8         Y--P--- 1589     portal   SZAPP-SO be548980         0    2     106      109
b879f800         ---P--- 1436     informix -        0                0    0     0        0
b87a0028         Y--P--- 2202     zo       TSR_APP  bcb86170         0    1     10826    11050
b87a0850         Y--P--- 1522     shtm     TSR_APP  bde89bb0         0    2     16       136
b87a1078         ------- 1438     portal   SZAPP-SO 0                0    2     0        0
b87a20c8         Y--P--- 2213     shtm     TSR_APP  c164aa90         0    1     195      225
b87a28f0         Y------ 1373     portal   SZAPP-SO bd6fa350         0    2     0        0
b87a3118         Y--P--- 2072     portal   SZAPP-SO c220c210         0    1     25125    28735
b87a4168         ------- 1373     portal   SZAPP-SO 0                0    2     0        0
b87a4990         Y--P--- 1992     portal   SZAPP-SO c171a0d0         0    2     1530     1560
b87a51b8         Y------ 1527     liliyaga TSR_APP  bd576670         0    1     0        0
b87a59e0         ------- 1527     liliyaga TSR_APP  0                0    1     0        0
b87a6208         Y--P--- 2035     portal   SZAPP-SO c1ee5f70         0    2     4        9
b87a6a30         Y--P--- 1704     portal   SZAPP-SO becdc6a0         0    2     687      790
b87a7258         Y------ 1589     portal   SZAPP-SO c0bd5f50         0    2     0        0
b87a7a80         ------- 1522     shtm     TSR_APP  0                0    2     0        0
b87a82a8         Y--P--- 2217     alsuz    TSR_APP  bf1a1d30         0    2     3        28
b87a8ad0         ------- 1589     portal   SZAPP-SO 0                0    2     0        0
b87a92f8         Y------ 1563     alfiyab  TSR_APP  bfd82e10         0    1     0        0
b87a9b20         ------- 1563     alfiyab  TSR_APP  0                0    1     0        0
b87aa348         Y------ 1589     portal   SZAPP-SO bfd82420         0    2     0        0
b87ab398         ------- 1992     portal   SZAPP-SO 0                0    2     0        0
b87ac3e8         ---P--- 1581     informix -        0                0    0     0        0
b87acc10         Y--P--- 2212     portal   SZAPP-SO bc1a8f60         0    1     0        0
b87ad438         Y--P--- 1583     portal   SZAPP-SO bd576710         0    2     25011    29436
b87adc60         ------- 1589     portal   SZAPP-SO 0                0    2     0        0
b87aecb0         Y--P--- 2216     dlr      TSR_APP  c22a0950         0    1     1        6
b87af4d8         Y------ 1704     portal   SZAPP-SO bd286d00         0    2     0        0
b87b0528         ------- 1765     portal   SZAPP-SO 0                0    2     0        0
b87b0d50         Y------ 1704     portal   SZAPP-SO c153e8a0         0    2     0        0
b87b1578         ------- 1704     portal   SZAPP-SO 0                0    2     0        0
b87b1da0         ------- 1583     portal   SZAPP-SO 0                0    2     0        0
b87b25c8         Y------ 1583     portal   SZAPP-SO c1ee5840         0    2     0        0
b87b2df0         ------- 1583     portal   SZAPP-SO 0                0    2     0        0
b87b3618         ------- 2217     alsuz    TSR_APP  0                0    2     0        0
b87b3e40         ------- 1741     portal   SZAPP-SO 0                0    2     0        0
b87b4668         Y------ 1741     portal   SZAPP-SO c127af90         0    2     0        0
b87b4e90         ------- 1741     portal   SZAPP-SO 0                0    2     0        0
b87b5ee0         ------- 2035     portal   SZAPP-SO 0                0    2     0        0
b87b6708         Y--P--- 2205     ludan    TSR_APP  c205d4c0         0    1     1415     1468
b87b6f30         Y------ 1765     portal   SZAPP-SO bbdf7340         0    2     0        0
b87b7f80         ------- 1765     portal   SZAPP-SO 0                0    2     0        0
b87b87a8         ------- 2202     zo       TSR_APP  0                0    1     0        0
b87b8fd0         Y------ 1992     portal   SZAPP-SO c22a0b30         0    2     0        0
b87b97f8         Y------ 1992     portal   SZAPP-SO b94136a0         0    2     0        0
b87ba020         ------- 1992     portal   SZAPP-SO 0                0    2     0        0
b87ba848         Y--P--- 2046     portal   SZAPP-SO c24e1f20         0    2     2        0
b87bb070         Y------ 2190     kuleeva  TSR_APP  bbd38530         0    1     0        0
b87bb898         ------- 2190     kuleeva  TSR_APP  0                0    1     0        0
b87bc8e8         Y------ 2035     portal   SZAPP-SO c171ae70         0    2     0        0
b87bd110         ------- 2046     portal   SZAPP-SO 0                0    2     0        0
b87bf9d8         ---P--- 2061     informix -        0                0    0     0        0
b87c0200         ---P--- 2211     portal   SZAPP-SO 0                0    1     4        0
b87c0a28         Y--P--- 2206     guzeliya TSR_APP  c07a6f10         0    1     385      426
b87c1250         Y--P--- 2190     kuleeva  TSR_APP  c07a6230         0    1     1167     1655
b87c1a78         ------- 2035     portal   SZAPP-SO 0                0    2     0        0
 101 active, 128 total, 44 maximum concurrent


Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
D:\>onstat -g ses

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 15:52:17 -- 1180800 Kbytes

session                                      #RSAM    total      used       dynamic
id       user     tty      pid      hostname threads  memory     memory     explain
2239     informix -        0        -        0        16384      12528      off
2238     portal   SZAPP-SO 4240     SZAPP-SO 1        348160     342016     off
2218     informix -        0        -        0        16384      12528      off
2217     alsuz    TSR_APP  17216    TSR_APP  2        3727360    3720976    off
2216     dlr      TSR_APP  17216    TSR_APP  1        163840     85792      off
2215     xisam    TSR_APP  17216    TSR_APP  1        3399680    3333168    off
2213     shtm     TSR_APP  17216    TSR_APP  1        3592192    3524736    off
2212     portal   SZAPP-SO 1548     SZAPP-SO 1        700416     679776     off
2211     portal   SZAPP-SO 1548     SZAPP-SO 1        1355776    1333136    off
2206     guzeliya TSR_APP  17216    TSR_APP  1        2002944    1918656    off
2205     ludan    TSR_APP  17216    TSR_APP  1        4329472    4274704    off
2202     zo       TSR_APP  17216    TSR_APP  2        4583424    4548480    off
2190     kuleeva  TSR_APP  17216    TSR_APP  3        4714496    4679824    off
2072     portal   SZAPP-SO 1548     szapp-so 1        2572288    2469168    off
2061     informix -        0        -        1        45056      41360      off
2046     portal   SZAPP-SO 1548     szapp-so 2        589824     516256     off
2035     portal   SZAPP-SO 1548     szapp-so 3        1429504    1202656    off
1992     portal   SZAPP-SO 1548     szapp-so 4        1822720    1463472    off
1765     portal   SZAPP-SO 1548     szapp-so 4        2342912    1921296    off
1741     portal   SZAPP-SO 1548     szapp-so 3        1953792    1711296    off
1704     portal   SZAPP-SO 1548     szapp-so 4        1286144    1192928    off
1589     portal   SZAPP-SO 1548     szapp-so 4        720896     445504     off
1583     portal   SZAPP-SO 1548     szapp-so 3        2457600    2244288    off
1581     informix -        0        -        1        45056      41360      off
1563     alfiyab  TSR_APP  17216    TSR_APP  3        4268032    4244640    off
1527     liliyaga TSR_APP  17216    TSR_APP  3        4653056    4615168    off
1522     shtm     TSR_APP  17216    TSR_APP  2        4071424    4042976    off
1438     portal   SZAPP-SO 1548     szapp-so 2        1339392    1133280    off
1436     informix -        0        -        1        45056      41360      off
1373     portal   SZAPP-SO 1548     szapp-so 4        2375680    2111888    off
1368     portal   SZAPP-SO 1548     szapp-so 4        1007616    915504     off
1366     dlr      TSR_APP  17216    TSR_APP  3        3624960    3594064    off
1364     2224     TSR_APP  17216    TSR_APP  1        147456     82864      off
1361     portal   SZAPP-SO 1548     szapp-so 3        1146880    942064     off
1333     portal   SZAPP-SO 1548     SZAPP-SO 1        1388544    1353120    off
870      informix TSR_DB   4400     TSR_DB   1        98304      95904      off
164      portal   SZAPP-SO 1548     szapp-so 4        2854912    2506528    off
28       informix -        0        -        1        57344      50336      off
6        informix -        0        -        0        16384      14240      off
5        informix -        0        -        0        16384      14240      off
4        informix -        0        -        0        16384      12528      off
3        informix -        0        -        0        16384      12528      off
2        informix -        0        -        0        16384      12528      off



Запросы в висящих сессиях замерли на создании индексов - пытались поиск в системе сделать. Ничего криминального. Поиск сделан через временную таблицу.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538828
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torerob8794cb8 Y--P--- 164 portal SZAPP-SO ba569870 0 2 146113 185714

Аномально высокое по сравнение с другими сессиями значение nwrites. Покажите onstat -g ses 164

_toreroЗапросы в висящих сессиях замерли на создании индексов - пытались поиск в системе сделать. Ничего криминального. Поиск сделан через временную таблицу.
Вы индексы создаете на временную таблицу или постоянную?
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538864
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
victor16,
индексы на временную таблицу.
Мы отключали создание этих индексов - изменений не было (то есть все-равно сервер был недоступен).
Под "Поиск" в предыдущем сообщении - имел ввиду некую прикладную функцию поиска сущностей в базе - набор select и update через временную таблицу.
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
session           effective                            #RSAM    total      used       dynamic
id       user     user      tty      pid      hostname threads  memory     memory     explain
164      portal   -         SZAPP-SO 1548     szapp-so 4        2854912    2506528    off

Program :
-

tid      name     rstcb            flags    curstk   status
2069     sqlexec  b8794cb8         Y--P---  14224    cond wait  opened_up -
33335    xchg_1.0 b879a670         Y------  1088     cond wait  opened_up -
33336    xchg_2.0 b8796530         Y------  1136     cond wait  opened_up -
33337    xchg_3.0 b87954e0         -------  8        ready-

Memory pools    count 3
name         class addr              totalsize  freesize   #allocfrag #freefrag
164          V     bde9a040         2768896    335808     4083       228
164*O0       V     bd3cc040         4096       784        1          1
164_SORT_0   V     bd23e040         81920      11792      8          3

name           free       used           name           free       used
overhead       0          9936           mtmisc         0          1696
scb            0          224            opentable      0          169568
filetable      0          24800          ru             0          608
misc           0          1648           blobio         0          27600
log            0          66176          temprec        0          21696
blob           0          10448          keys           0          45056
ralloc         0          1670304        gentcb         0          3920
ostcb          0          3024           sort           0          67120
sqscb          0          113456         sql            0          25616
srtmembuf      0          208            xchg_desc      0          1616
xchg_port      0          1296           xchg_packet    0          352
xchg_group     0          576            xchg_priv      0          480
scan_desc      0          240            sort_desc      0          3632
btmrg_desc     0          2512           hashfiletab    0          2272
osenv          0          3888           sqtcb          0          49312
fragman        0          144512         shmblklist     0          336
udr            0          13008          rsam_seqscan   0          19392

sqscb info
scb              sqscb            optofc   pdqpriority optcompind  directives
b8d2d0f0         bcb9b030         0        0           2           1

Sess       SQL            Current            Iso Lock       SQL  ISAM F.E.
Id         Stmt type      Database           Lvl Mode       ERR  ERR  Vers  Explain
164        CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off

Current SQL statement (48701) :
  create index ix1_t_citizen on alx_t_keys (citizen_id)

Last parsed SQL statement :
  create index ix1_t_citizen on alx_t_keys (citizen_id)

User-created Temp tables :
  partnum  tabname            rowsize
  200080   alx_t_keys         48
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538874
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torero,

насколько быстро заполняются физический и логический журналы?
покажите onstat -l с интервалом, скажем в 10-15 секунд
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538889
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
victor16, самое главное забыл сказать по 164 сессии:

пользователь portal - это пользователь, под которым подключается пул приложений IIS веб-сервера. То есть за ним стоит работа десятков реальных людей.

Тогда пара слов об архитектуре:
1) Клиентами базы являются 2 клиентских приложения, расположенные на двух разных хостах
2) Первый клиент подключается и работает полностью через olsoctcp - это Winforms клиент, использующий провайдер IBM.Data.Informix.dll. Пользователи этого клиента подключаются к БД каждый своим логином.
3) Второй клиент - это сайт. Использует для подключения и работы два протокола:
- olsoctcp напрямую через провайдер IBM.Data.Informix.dll (в приложении на этом построена прямая работа через SQL: вся модификация данных и часть select-ов)
- drsoctcp для работы EntityFramework через DataServerData package (v9.7fp4_ntx64_dsdriver_ALL_LANG.exe) (в приложении на этом построена только часть выборки данных. модификация данных не производится).
Пользователи второго клиента подключаются к базе от имени пользователя portal. авторизация выполняется не средствами СУБД, а самим приложением.

По лог журналам:
вот вырезка из лога за сегодня 27.01.2014:
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
Mon Jan 27 08:03:04 2014

08:03:04  Logical Log 4893 Complete, timestamp: 0x71ae4a99.
08:45:23  Logical Log 4894 Complete, timestamp: 0x71b9c905.
09:17:10  Logical Log 4895 Complete, timestamp: 0x71c74d5d.
09:54:02  Logical Log 4896 Complete, timestamp: 0x71da636b.
10:18:37  Logical Log 4897 Complete, timestamp: 0x71e569e6.
10:35:52  Logical Log 4898 Complete, timestamp: 0x71ec9221.
11:27:01  Logical Log 4899 Complete, timestamp: 0x71feb994.


Других строчек нет.

По логам сейчас движения нет - клиенты все еще не могут работать по olsoctcp
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
onstat -l
Physical Logging
Buffer bufused  bufsize  numpages   numwrits   pages/io
  P-2  6        32       38669      1267       30.52
      phybegin         physize    phypos     phyused    %used
      1:263            225000     84549      14502      6.45

Logical Logging
Buffer bufused  bufsize  numrecs    numpages   numwrits   recs/pages pages/io
  L-3  0        16       3858225    245370     110207     15.7       2.2
        Subsystem    numrecs    Log Space used
        OLDRSAM      3858225    575683636

address          number   flags    uniqid   begin                size     used    %used
00000000B87E1CE0 1        U-B----  4874     1:225263            25000    25000   100.00
00000000B87E1D50 2        U-B----  4875     1:250263            25000    25000   100.00
00000000B87E1DC0 3        U-B----  4876     1:275263            25000    25000   100.00
00000000B87E1E30 4        U-B----  4877     1:300263            25000    25000   100.00
00000000B87E1EA0 5        U-B----  4878     1:325263            25000    25000   100.00
00000000B87E1F10 6        U-B----  4879     1:350263            25000    25000   100.00
00000000B87E1F80 7        U-B----  4880     1:375263            25000    25000   100.00
00000000B8626ED0 8        U-B----  4881     1:400263            25000    25000   100.00
00000000B8626F40 9        U-B----  4882     1:425263            25000    25000   100.00
00000000B8626FB0 10       U-B----  4883     1:450263            25000    25000   100.00
00000000B8627450 11       U-B----  4884     1:475263            25000    25000   100.00
00000000B86274C0 12       U-B----  4885     1:500263            25000    25000   100.00
00000000B8627530 13       U-B----  4886     1:525263            25000    25000   100.00
00000000B86275A0 14       U-B----  4887     1:550263            25000    25000   100.00
00000000B8627610 15       U-B----  4888     1:575263            25000    25000   100.00
00000000B8627680 16       U-B----  4889     1:600263            25000    25000   100.00
00000000B86276F0 17       U-B----  4890     1:625263            25000    25000   100.00
00000000B8627760 18       U-B----  4891     1:650263            25000    25000   100.00
00000000B86277D0 19       U-B----  4892     1:675263            25000    25000   100.00
00000000B8627840 20       U-B---L  4893     1:700263            25000    25000   100.00
00000000B86278B0 21       U-B----  4894     1:725263            25000    25000   100.00
00000000B8627920 22       U-B----  4895     1:750263            25000    25000   100.00
00000000B8627990 23       U-B----  4896     1:775263            25000    25000   100.00
00000000B8627A00 24       U-B----  4897     1:800263            25000    25000   100.00
00000000B8627A70 25       U-B----  4898     1:825263            25000    25000   100.00
00000000B8627AE0 26       U-B----  4899     1:850263            25000    25000   100.00
00000000B8627B50 27       U---C--  4900     1:875263            25000    17739    70.96
00000000B8627BC0 28       U-B----  4850     1:900263            25000    25000   100.00
00000000B8627C30 29       U-B----  4851     1:925263            25000    25000   100.00
00000000B8627CA0 30       U-B----  4852     1:950263            25000    25000   100.00
00000000B8627D10 31       U-B----  4853     1:975263            25000    25000   100.00
00000000B8627D80 32       U-B----  4854     1:1000263           25000    25000   100.00
00000000B8627DF0 33       U-B----  4855     1:1025263           25000    25000   100.00
00000000B8627E60 34       U-B----  4856     1:1050263           25000    25000   100.00
00000000B8627ED0 35       U-B----  4857     1:1075263           25000    25000   100.00
00000000B8627F40 36       U-B----  4858     1:1100263           25000    25000   100.00
00000000B8627FB0 37       U-B----  4859     1:1125263           25000    25000   100.00
00000000B87C7460 38       U-B----  4860     1:1150263           25000    25000   100.00
00000000B87C74D0 39       U-B----  4861     1:1175263           25000    25000   100.00
00000000B87C7540 40       U-B----  4862     1:1200263           25000    25000   100.00
00000000B87C75B0 41       U-B----  4863     1:1225263           25000    25000   100.00
00000000B87C7620 42       U-B----  4864     1:1250263           25000    25000   100.00
00000000B87C7690 43       U-B----  4865     1:1275263           25000    25000   100.00
00000000B87C7700 44       U-B----  4866     1:1300263           25000    25000   100.00
00000000B87C7770 45       U-B----  4867     1:1325263           25000    25000   100.00
00000000B87C77E0 46       U-B----  4868     1:1350263           25000    25000   100.00
00000000B87C7850 47       U-B----  4869     1:1375263           25000    25000   100.00
00000000B87C78C0 48       U-B----  4870     1:1400263           25000    25000   100.00
00000000B87C7930 49       U-B----  4871     1:1425263           25000    25000   100.00
00000000B87C79A0 50       U-B----  4872     1:1450263           25000    25000   100.00
00000000B87C7A10 51       U-B----  4873     1:1891686           25000    25000   100.00
 51 active, 51 total



По состоянию на 13:20 сервер к нам не вернулся. Решаем вопрос принудительного перезапуска windows службы. Подключение по drda все также работает.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538898
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torero,

а что показывает onstat -g act, onstat -g rea
лучше не один срез во времени, а несколько с интервалом 2-3 сек
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538942
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
victor16,

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
C:\INFORMIX11>onstat -g act

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 17:05:13 -- 1180800 Kbytes

Running threads:
 tid     tcb              rstcb            prty status                vp-class       name
 8       b8ca6bc0         0                1    running                11soc*        soctcppoll
 9       b8cda9c0         0                1    running                12soc*        soctcpio
 10      b8d10710         0                1    running                13soc*        soctcpio
 32531   bf432bc0         b8790b78         1    running                 1cpu*        drdaexec
 53193   c3081300         b87c0200         1    running                 9cpu*        drdaexec

C:\INFORMIX11>onstat -g act

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 17:05:19 -- 1180800 Kbytes

Running threads:
 tid     tcb              rstcb            prty status                vp-class       name
 8       b8ca6bc0         0                1    running                11soc*        soctcppoll
 9       b8cda9c0         0                1    running                12soc*        soctcpio
 10      b8d10710         0                1    running                13soc*        soctcpio
 32531   bf432bc0         b8790b78         1    running                 1cpu*        drdaexec
 53193   c3081300         b87c0200         1    running                 9cpu*        drdaexec

C:\INFORMIX11>onstat -g act

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 17:05:23 -- 1180800 Kbytes

Running threads:
 tid     tcb              rstcb            prty status                vp-class       name
 8       b8ca6bc0         0                1    running                11soc*        soctcppoll
 9       b8cda9c0         0                1    running                12soc*        soctcpio
 10      b8d10710         0                1    running                13soc*        soctcpio
 32531   bf432bc0         b8790b78         1    running                 1cpu*        drdaexec
 53193   c3081300         b87c0200         1    running                 9cpu*        drdaexec

C:\INFORMIX11>onstat -g act

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 17:05:28 -- 1180800 Kbytes

Running threads:
 tid     tcb              rstcb            prty status                vp-class       name
 8       b8ca6bc0         0                1    running                11soc*        soctcppoll
 9       b8cda9c0         0                1    running                12soc*        soctcpio
 10      b8d10710         0                1    running                13soc*        soctcpio
 32531   bf432bc0         b8790b78         1    running                 1cpu*        drdaexec
 53193   c3081300         b87c0200         1    running                 9cpu*        drdaexec



Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
C:\INFORMIX11>onstat -g rea

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 17:06:02 -- 1180800 Kbytes

Ready threads:
 tid     tcb              rstcb            prty status                vp-class       name
 7       b8c28b80         b8786030         3    ready                   1cpu*        main_loop()
 11      b8d44450         0                2    ready                   9cpu*        soctcplst
 13      b8d859a0         b8786858         1    ready                   1cpu*        flush_sub(0)
 14      b8d85d90         b8787080         1    ready                   9cpu*        flush_sub(1)
 16      b8dd06f0         b87880d0         1    ready                   1cpu*        flush_sub(3)
 18      b8e55030         b8789120         1    ready                   9cpu*        flush_sub(5)
 20      b8e8d030         b878a170         1    ready                   1cpu*        flush_sub(7)
 22      b8feb500         b878a998         2    ready                   9cpu*        aslogflush
 24      b9128710         b878b9e8         3    ready                   1cpu*        readahead_0
 42      b9146710         b878ca38         3    ready                   1cpu*        onmode_mon
 33337   c0773c90         b87954e0         1    ready                   8cpu*        xchg_3.0
 33349   c0bd5a50         b879ae98         1    ready                   9cpu*        xchg_2.0
 33352   bde4e5a0         b8792c18         1    ready                   8cpu*        xchg_2.0
 33379   b9462810         b879bee8         1    ready                   8cpu*        xchg_3.0
 33493   bde4ed80         b879f800         1    ready                   8cpu*        listen_authenticate
 33928   c0f0ac00         b87a1078         1    ready                   8cpu*        mb_collector
 35866   be548590         b87a4168         1    ready                   8cpu*        xchg_3.0
 35947   ba3c8a90         b87a59e0         1    ready                   8cpu*        xchg_2.0
 36465   bbb41bb0         b87a7a80         1    ready                   8cpu*        xchg_1.0
 36469   becdc210         b87a9b20         1    ready                   8cpu*        xchg_2.0
 36478   bfe7d7e0         b87ac3e8         1    ready                   9cpu*        listen_authenticate
 36695   bfd827e0         b87adc60         1    ready                   8cpu*        xchg_3.0
 41783   c153ec60         b87b1578         1    ready                   8cpu*        xchg_3.0
 41805   c1e9e030         b87b2df0         1    ready                   8cpu*        xchg_2.0
 42619   c25db800         b87b4e90         1    ready                   8cpu*        xchg_2.0
 48086   c205d030         b87b7f80         1    ready                   9cpu*        xchg_3.0
 48093   bc1a8030         b87ba020         1    ready                   8cpu*        xchg_3.0
 48936   c115d420         b87bd110         1    ready                   8cpu*        xchg_1.0
 48959   bcb86810         b87bf9d8         1    ready                   9cpu*        listen_authenticate
 48963   c07a69e0         b87c1a78         1    ready                   9cpu*        xchg_2.0
 53304   b9462c00         b87b87a8         1    ready                  10cpu*        xchg_1.0
 53306   c22a02b0         b87b3618         1    ready                  10cpu*        xchg_1.0
 53308   bd584d30         b87bb898         1    ready                  10cpu*        xchg_2.0

C:\INFORMIX11>onstat -g rea

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 17:06:27 -- 1180800 Kbytes

Ready threads:
 tid     tcb              rstcb            prty status                vp-class       name
 7       b8c28b80         b8786030         3    ready                   1cpu*        main_loop()
 11      b8d44450         0                2    ready                   9cpu*        soctcplst
 13      b8d859a0         b8786858         1    ready                   1cpu*        flush_sub(0)
 14      b8d85d90         b8787080         1    ready                   9cpu*        flush_sub(1)
 16      b8dd06f0         b87880d0         1    ready                   1cpu*        flush_sub(3)
 18      b8e55030         b8789120         1    ready                   9cpu*        flush_sub(5)
 20      b8e8d030         b878a170         1    ready                   1cpu*        flush_sub(7)
 22      b8feb500         b878a998         2    ready                   9cpu*        aslogflush
 24      b9128710         b878b9e8         3    ready                   1cpu*        readahead_0
 42      b9146710         b878ca38         3    ready                   1cpu*        onmode_mon
 33337   c0773c90         b87954e0         1    ready                   8cpu*        xchg_3.0
 33349   c0bd5a50         b879ae98         1    ready                   9cpu*        xchg_2.0
 33352   bde4e5a0         b8792c18         1    ready                   8cpu*        xchg_2.0
 33379   b9462810         b879bee8         1    ready                   8cpu*        xchg_3.0
 33493   bde4ed80         b879f800         1    ready                   8cpu*        listen_authenticate
 33928   c0f0ac00         b87a1078         1    ready                   8cpu*        mb_collector
 35866   be548590         b87a4168         1    ready                   8cpu*        xchg_3.0
 35947   ba3c8a90         b87a59e0         1    ready                   8cpu*        xchg_2.0
 36465   bbb41bb0         b87a7a80         1    ready                   8cpu*        xchg_1.0
 36469   becdc210         b87a9b20         1    ready                   8cpu*        xchg_2.0
 36478   bfe7d7e0         b87ac3e8         1    ready                   9cpu*        listen_authenticate
 36695   bfd827e0         b87adc60         1    ready                   8cpu*        xchg_3.0
 41783   c153ec60         b87b1578         1    ready                   8cpu*        xchg_3.0
 41805   c1e9e030         b87b2df0         1    ready                   8cpu*        xchg_2.0
 42619   c25db800         b87b4e90         1    ready                   8cpu*        xchg_2.0
 48086   c205d030         b87b7f80         1    ready                   9cpu*        xchg_3.0
 48093   bc1a8030         b87ba020         1    ready                   8cpu*        xchg_3.0
 48936   c115d420         b87bd110         1    ready                   8cpu*        xchg_1.0
 48959   bcb86810         b87bf9d8         1    ready                   9cpu*        listen_authenticate
 48963   c07a69e0         b87c1a78         1    ready                   9cpu*        xchg_2.0
 53304   b9462c00         b87b87a8         1    ready                  10cpu*        xchg_1.0
 53306   c22a02b0         b87b3618         1    ready                  10cpu*        xchg_1.0
 53308   bd584d30         b87bb898         1    ready                  10cpu*        xchg_2.0
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538964
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torero,

стоп, да у вас ничего не выполняется, нет ни одной нити в состоянии running, кроме листенеров.
сколько у вас физических процессоров на сервере?
какое количество процессоров Informix выделено под них (onstat -g cpu)?
привязаны ли они к физическим процессорам (affinity)?

ну и так, на всякий случай:
какое значение параметра LOG_INDEX_BUILDS
выполняется ли периодически команда onmode -F для освобождения неиспользуемой памяти?
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538986
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
victor16,

Да, с 10:45 сервер после onmode -c вот в таком состоянии.

На сервере 2 CPU, 16 ядер.
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
102.
103.
104.
105.
106.
107.
108.
109.
110.
111.
112.
113.
114.
115.
116.
117.
118.
119.
120.
121.
122.
onstat -g cpu

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 17:21:06 -- 1180800 Kbytes

Thread CPU Info:
 tid    name              vp       Last Run           CPU Time     #scheds    status
 2      lio vp 0          3lio*   01/25 20:49:45        0.0000          1    IO Idle
 3      pio vp 0          4pio*   01/25 20:49:46        0.0153          2    IO Idle
 4      aio vp 0          5aio*   01/27 03:59:59        0.0205        117    IO Idle
 5      msc vp 0          6msc*   01/27 14:10:03        2.7640       2284    IO Idle
 6      fifo vp 0         7fifo*  01/25 20:49:49        0.0157          2    IO Idle
 7      main_loop()       1cpu*   01/27 10:30:01        3.1144     133741    ready
 8      soctcppoll       11soc*   01/27 10:24:37   135292.8320          8    running
 9      soctcpio         12soc*   01/25 20:49:51        0.0157          1    running
 10     soctcpio         13soc*   01/25 20:49:51        0.0156          1    running
 11     soctcplst         9cpu*   01/27 11:47:56        0.7398       3516    ready
 12     soctcplst         8cpu*   01/27 14:10:03        1.2244        650    sleeping forever
 13     flush_sub(0)      1cpu*   01/27 10:30:01        0.8191     133699    ready
 14     flush_sub(1)      9cpu*   01/27 11:48:04        0.7634     138165    ready
 15     flush_sub(2)      8cpu*   01/27 14:10:51        1.6359     146762    sleeping secs: 1
 16     flush_sub(3)      1cpu*   01/27 10:30:01        0.7646     133695    ready
 17     flush_sub(4)     10cpu*   01/27 14:10:51        0.9511     146793    sleeping secs: 1
 18     flush_sub(5)      9cpu*   01/27 11:48:04        0.8134     138163    ready
 19     flush_sub(6)      8cpu*   01/27 14:10:51        1.3024     146762    sleeping secs: 1
 20     flush_sub(7)      1cpu*   01/27 10:30:01        0.6006     133697    ready
 21     kaio             10cpu*   01/27 13:31:28       81.8382  256688818    IO Idle
 22     aslogflush        9cpu*   01/27 11:48:04        2.4360     138162    ready
 23     btscanner_0       8cpu*   01/27 14:09:49        1.1144       9748    sleeping secs: 74
 24     readahead_0       1cpu*   01/27 10:28:59        0.2796       4203    ready
 40     defragclean       9cpu*   01/25 20:49:59        0.0593          2    terminated
 41     kaio              1cpu*   01/27 10:30:01        8.0815   26198755    IO Idle
 42     onmode_mon        1cpu*   01/27 10:30:01        2.0944     133693    ready
 43     periodic         10cpu*   01/27 14:10:51        2.7824     146790    sleeping secs: 1
 50     kaio              9cpu*   01/27 11:47:58       42.9988  153051193    IO Idle
 52     bf_priosweep()   10cpu*   01/25 20:49:57        0.0104         21    cond wait  bp_cond
 54     kaio              8cpu*   01/27 11:47:18       28.6730   91885472    IO Idle
 57     encrypt          14encryp 01/27 14:10:03        0.6065       3137    cond wait  sqcrypto
 2069   sqlexec          10cpu*   01/27 10:30:07      161.2849    2271954    cond wait  opened_up
 32531  drdaexec          1cpu*   01/27 10:30:01        3.0303      16633    running
 33064  sqlexec           9cpu*   01/27 10:30:29        0.8432       9713    cond wait  opened_up
 33177  sqlexec           1cpu*   01/27 10:29:42        0.6826        131    cond wait  netnorm
 33335  xchg_1.0         10cpu*   01/27 10:30:07        0.0006          1    cond wait  opened_up
 33336  xchg_2.0          9cpu*   01/27 10:30:07        0.5951          1    cond wait  opened_up
 33337  xchg_3.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 33344  sqlexec          10cpu*   01/27 10:30:27        0.1139        541    cond wait  opened_up
 33346  sqlexec           8cpu*   01/27 10:30:47        0.5876       2849    cond wait  opened_up
 33348  xchg_1.0         10cpu*   01/27 10:30:27        0.1960          1    cond wait  opened_up
 33349  xchg_2.0          9cpu*   01/01 04:00:00        0.0000          0    ready
 33350  mb_collector     10cpu*   01/27 10:30:58        0.2693         31    terminated
 33351  xchg_1.0          9cpu*   01/27 10:30:29        0.2689          1    cond wait  opened_up
 33352  xchg_2.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 33370  sqlexec          10cpu*   01/27 10:42:01       13.7553     200149    cond wait  opened_up
 33376  mb_collector     10cpu*   01/27 10:31:18        0.0552         32    terminated
 33377  xchg_1.0          8cpu*   01/27 10:30:47        0.0661          1    cond wait  opened_up
 33378  xchg_2.0          9cpu*   01/27 10:30:47        0.0001          1    cond wait  opened_up
 33379  xchg_3.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 33493  listen_authenti   8cpu*   01/01 04:00:00        0.0000          0    ready
 33589  sqlexec           8cpu*   01/27 10:33:50        2.7147      18033    join wait  33928
 33928  mb_collector      8cpu*   01/01 04:00:00        0.0000          0    ready
 35763  sqlexec           8cpu*   01/27 10:46:18        2.2033      17948    cond wait  opened_up
 35807  sqlexec           9cpu*   01/27 10:42:19        0.8932      15330    cond wait  opened_up
 35863  mb_collector      9cpu*   01/27 10:42:30        0.0003         30    terminated
 35864  xchg_1.0         10cpu*   01/27 10:42:01        0.0015          1    cond wait  opened_up
 35865  xchg_2.0          9cpu*   01/27 10:42:01        0.1293          1    cond wait  opened_up
 35866  xchg_3.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 35946  xchg_1.0          9cpu*   01/27 10:42:19        0.0012          1    cond wait  opened_up
 35947  xchg_2.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 36312  sqlexec           8cpu*   01/27 10:46:22       10.1838      13050    cond wait  opened_up
 36465  xchg_1.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 36468  xchg_1.0          8cpu*   01/27 10:46:22        0.0002          1    cond wait  opened_up
 36469  xchg_2.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 36478  listen_authenti   9cpu*   01/01 04:00:00        0.0000          0    ready
 36480  sqlexec           9cpu*   01/27 11:05:18       29.0862     677010    cond wait  opened_up
 36488  sqlexec           8cpu*   01/27 10:47:58        0.1761       1101    cond wait  opened_up
 36691  mb_collector      9cpu*   01/27 10:48:29        0.0009         32    terminated
 36692  xchg_1.0          8cpu*   01/27 10:47:58        0.0010          1    cond wait  opened_up
 36694  xchg_2.0         10cpu*   01/27 10:47:58        0.0016          1    cond wait  opened_up
 36695  xchg_3.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 40378  sqlexec          10cpu*   01/27 11:05:13        0.8062       5544    cond wait  opened_up
 41781  xchg_1.0         10cpu*   01/27 11:05:13        0.0001          1    cond wait  opened_up
 41782  xchg_2.0          9cpu*   01/27 11:05:13        0.0977          1    cond wait  opened_up
 41783  xchg_3.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 41792  sqlexec          10cpu*   01/27 11:07:05        5.1087      69750    cond wait  opened_up
 41803  mb_collector     10cpu*   01/27 11:05:47        0.0004         31    terminated
 41804  xchg_1.0          9cpu*   01/27 11:05:18        0.0082          1    cond wait  opened_up
 41805  xchg_2.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 42434  sqlexec           9cpu*   01/27 11:27:19       25.7104     320218    cond wait  opened_up
 42617  mb_collector      9cpu*   01/27 11:07:36        0.0014         32    terminated
 42618  xchg_1.0         10cpu*   01/27 11:07:05        0.0002          1    cond wait  opened_up
 42619  xchg_2.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 47655  sqlexec           8cpu*   01/27 11:27:21        1.1635       9005    cond wait  opened_up
 48083  mb_collector     10cpu*   01/27 11:27:49        0.0010         32    terminated
 48084  xchg_1.0          9cpu*   01/27 11:27:19        0.0010          1    cond wait  opened_up
 48085  xchg_2.0         10cpu*   01/27 11:27:19        0.0011          1    cond wait  opened_up
 48086  xchg_3.0          9cpu*   01/01 04:00:00        0.0000          0    ready
 48090  mb_collector     10cpu*   01/27 11:27:52        0.0005         32    terminated
 48091  xchg_1.0          8cpu*   01/27 11:27:21        0.1395          1    cond wait  opened_up
 48092  xchg_2.0          9cpu*   01/27 11:27:21        0.0001          1    cond wait  opened_up
 48093  xchg_3.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 48701  sqlexec          10cpu*   01/27 11:31:18        0.3596       6877    cond wait  opened_up
 48852  sqlexec           8cpu*   01/27 11:31:19        0.1054         73    cond wait  opened_up
 48934  mb_collector      8cpu*   01/27 11:31:49        0.9592         32    terminated
 48935  xchg_1.0         10cpu*   01/27 11:32:35        0.0002          1    cond wait  opened_up
 48936  xchg_1.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 48959  listen_authenti   9cpu*   01/01 04:00:00        0.0000          0    ready
 48963  xchg_2.0          9cpu*   01/01 04:00:00        0.0000          0    ready
 48984  sqlexec           9cpu*   01/27 11:48:03       25.5361     319293    cond wait  netnorm
 52732  sqlexec          10cpu*   01/27 11:48:15       25.8906      38169    cond wait  opened_up
 53103  sqlexec          10cpu*   01/27 11:48:06        9.2903      28631    cond wait  opened_up
 53107  sqlexec          10cpu*   01/27 11:48:34       16.2802      21783    cond wait  netnorm
 53137  sqlexec          10cpu*   01/27 11:48:33       19.9321      29377    cond wait  netnorm
 53193  drdaexec          9cpu*   01/27 11:48:04        0.8259       3940    running
 53258  sqlexec          10cpu*   01/27 11:48:21        6.3933       6966    cond wait  netnorm
 53264  sqlexec           9cpu*   01/27 11:47:58        0.1278        756    cond wait  netnorm
 53265  sqlexec          10cpu*   01/27 11:48:26        0.0398        339    cond wait  netnorm
 53298  sqlexec          10cpu*   01/27 11:48:11        0.3216       2164    cond wait  opened_up
 53303  drdaexec          9cpu*   01/27 11:48:04        0.1547         19    cond wait  netnorm
 53304  xchg_1.0         10cpu*   01/01 04:00:00        0.0000          0    ready
 53306  xchg_1.0         10cpu*   01/01 04:00:00        0.0000          0    ready
 53307  xchg_1.0         10cpu*   01/27 11:48:15        0.0002          1    cond wait  opened_up
 53308  xchg_2.0         10cpu*   01/01 04:00:00        0.0000          0    ready
 53371  drdaexec         10cpu*   01/27 14:10:22        0.0400         50    cond wait  netnorm



из CONFIG:

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
NETTYPE soctcp,2,150,CPU
LISTEN_TIMEOUT 60
MAX_INCOMPLETE_CONNECTIONS 1024
FASTPOLL 1
NS_CACHE host=900,service=900,user=900,group=900

MULTIPROCESSOR 1
VPCLASS cpu,num=4
VP_MEMORY_CACHE_KB 0
SINGLE_CPU_VP 0

LOG_INDEX_BUILDS



команда onmode -F не выполняется.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539011
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torero,

покажите еще onstat -k, почему-то слишком много wait-еров в выводе onstat -u
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539037
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
В 14:17 перезапустили win службу с инстансом.
В 14:26 служба остановлена. В логе не появилось ни строчки.
Запустили заново.
Вот лог информикса после запуска (захватил предыдущий запуск):
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
102.
Sat Jan 25 20:49:45 2014

20:49:45  Booting Language <c> from module <>
20:49:45  Loading Module <CNULL>
20:49:45  Booting Language <builtin> from module <>
20:49:45  Loading Module <BUILTINNULL>
20:49:51  DR: DRAUTO is 0 (Off)
20:49:51  DR: ENCRYPT_HDR is 0 (HDR encryption Disabled)
20:49:51  IBM Informix Dynamic Server Version 11.70.FC4IE Software Serial Number AAA#B000000
20:49:52  IBM Informix Dynamic Server Initialized -- Shared Memory Initialized.

20:49:52  Started 1 B-tree scanners.
20:49:52  B-tree scanner threshold set at 5000.
20:49:52  B-tree scanner range scan size set to -1.
20:49:52  B-tree scanner ALICE mode set to 6.
20:49:52  B-tree scanner index compression level set to med.
20:49:52  Physical Recovery Started at Page (1:70314).
20:49:52  Physical Recovery Complete: 0 Pages Examined, 0 Pages Restored.
20:49:52  Logical Recovery Started.
20:49:52  10 recovery worker threads will be started.
20:49:53  Logical Recovery has reached the transaction cleanup phase.
20:49:53  Logical Recovery Complete.
	  0 Committed, 0 Rolled Back, 0 Open, 0 Bad Locks

20:49:54  Dataskip is now OFF for all dbspaces
20:49:55  Init operation complete - Mode Online
20:49:56  Checkpoint Completed:  duration was 1 seconds.
20:49:56  Sat Jan 25 - loguniq 4893, logpos 0x4c7c0c0, timestamp: 0x71ab22ea Interval: 1778

20:49:56  Maximum server connections 0 
20:49:56  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 2, Llog used 1

20:49:56  On-Line Mode
20:49:57  SCHAPI: "INFORMIXDIR/etc/sysadmin/stop" file is present.
          Bypassing dbScheduler and dbWorker threads startup.
20:49:59  Defragmenter cleaner thread now running
20:49:59  Defragmenter cleaner thread cleaned:0 partitions
20:50:13  Booting Language <spl> from module <>
20:50:13  Loading Module <SPLNULL>
21:53:41  IBM Global Security Kit (GSKit) version 8.0.15.6.

Mon Jan 27 08:03:04 2014

08:03:04  Logical Log 4893 Complete, timestamp: 0x71ae4a99.
08:45:23  Logical Log 4894 Complete, timestamp: 0x71b9c905.
09:17:10  Logical Log 4895 Complete, timestamp: 0x71c74d5d.
09:54:02  Logical Log 4896 Complete, timestamp: 0x71da636b.
10:18:37  Logical Log 4897 Complete, timestamp: 0x71e569e6.
10:35:52  Logical Log 4898 Complete, timestamp: 0x71ec9221.
11:27:01  Logical Log 4899 Complete, timestamp: 0x71feb994.
14:26:54  IBM Informix Dynamic Server Started.
14:26:54  Warning: The IBM IDS Innovator-C Edition license restriction limits
14:26:54  the total shared memory size for this server to 2097152 KB.
14:26:54  The maximum allowable shared memory was reset to this size to start the database server. 

Mon Jan 27 14:26:54 2014

14:26:54  Booting Language <c> from module <>
14:26:54  Loading Module <CNULL>
14:26:54  Booting Language <builtin> from module <>
14:26:54  Loading Module <BUILTINNULL>
14:27:00  DR: DRAUTO is 0 (Off)
14:27:00  DR: ENCRYPT_HDR is 0 (HDR encryption Disabled)
14:27:01  IBM Informix Dynamic Server Version 11.70.FC4IE Software Serial Number AAA#B000000
14:27:02  IBM Informix Dynamic Server Initialized -- Shared Memory Initialized.

14:27:02  Started 1 B-tree scanners.
14:27:02  B-tree scanner threshold set at 5000.
14:27:02  B-tree scanner range scan size set to -1.
14:27:02  B-tree scanner ALICE mode set to 6.
14:27:02  B-tree scanner index compression level set to med.
14:27:02  Physical Recovery Started at Page (1:70316).
14:27:02  Physical Recovery Complete: 14043 Pages Examined, 14043 Pages Restored.
14:27:02  Logical Recovery Started.
14:27:02  10 recovery worker threads will be started.
14:27:07  Fast Recovery Switching to Log 4894
14:27:18  Fast Recovery Switching to Log 4895
14:27:26  Fast Recovery Switching to Log 4896
14:27:38  Fast Recovery Switching to Log 4897
14:27:47  Fast Recovery Switching to Log 4898
14:27:50  Fast Recovery Switching to Log 4899
14:28:00  Fast Recovery Switching to Log 4900
14:28:06  Logical Recovery has reached the transaction cleanup phase.
14:28:06  Logical Recovery Complete.
	  97932 Committed, 4 Rolled Back, 0 Open, 0 Bad Locks

14:28:06  Dataskip is now OFF for all dbspaces
14:28:06  Init operation complete - Mode Online
14:28:07  Checkpoint Completed:  duration was 0 seconds.
14:28:07  Mon Jan 27 - loguniq 4900, logpos 0x454b0c0, timestamp: 0x7206bd26 Interval: 1779

14:28:07  Maximum server connections 0 
14:28:07  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 14505, Llog used 1

14:28:07  On-Line Mode
14:28:08  SCHAPI: "INFORMIXDIR/etc/sysadmin/stop" file is present.
          Bypassing dbScheduler and dbWorker threads startup.
14:28:09  IBM Global Security Kit (GSKit) version 8.0.15.6.
14:28:11  Defragmenter cleaner thread now running
14:28:11  Defragmenter cleaner thread cleaned:0 partitions
14:28:12  Booting Language <spl> from module <>
14:28:12  Loading Module <SPLNULL>


Сервер накатил 97932 транзакции.
Откатил 4 - видимо те, кому не повезло в момент, когда мы дали onmode -c


Еще дополнительный факт:
Утром был запущен eSQLeditor.
Код: sql
1.
2.
3.
9:40:16	00:00:00.000		Connecting to Server	ol_css2	
9:57:23	00:00:00.218	169789	12 row(s) retrieved.	
11:35:22	00:00:04.446	241677	12 row(s) retrieved.	



То есть начиная с 10:45 подключения по olsoctcp не проходили, но уже подключенный eSQLeditor выполняло запросы select.

Вот ошибки клиентов:
Код: sql
1.
SQL10007N Message "ADP_ConnectTimeoutExpired" could not be retrieved.  Reason code: "4".


Код: sql
1.
2.
3.
4.
5.
6.
ERROR [HY000] [Informix .NET provider][Informix]Read error occurred during connection attempt.

=========================[Informix Error]=========================
Message :[Informix .NET provider][Informix]Read error occurred during connection attempt.
Native error :-27001
SQL state :HY000
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539067
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torero,

вам повезло, что сервер поднялся.

Какой командой глушится сервер?
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539088
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torero,

у Вас, похоже, проблемы связаны с ограничениями для бесплатной версии.
Там есть ограничения и по количеству используемой памяти, и по количеству одновременно открытых сессий
и по размеру пространств. Точнее могут сказать в техсаппорте или те, кто устанавливал Вам эту систему.

Единственное, что могу посоветовать в Вашей ситуации:
1. Сделать апгрейд на 11.70FC8IE
2. Разнести журналы, данные и индексы по разным дискам.
3. Создать временное пространство.
4. Вернуть на место параметр RTO (т.е. отключить)
5. Уменьшить количество используемой памяти
6. Уменьшить значения lru_min_dirty, lru_max_dirty
7. Изменить логику приложений, исключив дорогостоящие операции типа CREATE INDEX.
8. Если п.7 невозможен, рассмотрите возможность создания временных таблиц без журналирования
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539130
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
victor16,

системы ставили мы.

Про ограничения бесплатной версии знаем. И до этого сервер открыто нам говорил об этом.
Вот эксперименты от 20.01.2014:
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
07:54:00  Long Transaction 0x00000000B87DB258 Aborted. Rollback Duration: 7 Seconds
07:59:03  Checkpoint Completed:  duration was 0 seconds.
07:59:03  Tue Jan 21 - loguniq 4849, logpos 0x4b9a018, timestamp: 0x6eea0723 Interval: 1471

07:59:03  Maximum server connections 30 
07:59:03  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 529, Llog used 625

08:52:01  IBM Informix Dynamic Server Started.
08:52:01  Warning: The IBM IDS Innovator-C Edition license restriction limits
08:52:01  the total shared memory size for this server to 2097152 KB.
08:52:01  The maximum allowable shared memory was reset to this size to start the database server. 
08:52:01  shmget: [EEXIST][17]: key 52584801: shared memory already exists
08:52:01  mt_shm_init: can't create resident segment



1. Пытались перейти на 11.70FC7, но остановились после сообщения о баге:
http://www.sql.ru/forum/1072455/ostorozhno-bag

2. Журналы создадим.
3. Что за временное пространство? tempdbs?
4. Отключим
5. Уменьшить количество используемой памяти - то есть уменьшить буферы?
6. Уменьшить значения lru_min_dirty, lru_max_dirty. До каких для примера?
7. Временные таблицы мы всегда создаем с with no log


15:05 Однако сервер опять ушел в себя!
Пошли смотреть, что там
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539191
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torerovictor16,
Пытались перейти на 11.70FC7, но остановились после сообщения о баге:
http://www.sql.ru/forum/1072455/ostorozhno-bag

Workaround здесь очевиден:
1. как можно быстрее закрыть транзакцию в 1-й сессии
2. Не делать insert без открытия транзакции во 2-й сессии


_toreroЧто за временное пространство? tempdbs?
Да, создавать через onspaces с опцией -t

_toreroУменьшить количество используемой памяти - то есть уменьшить буферы?
Уменьшить значения lru_min_dirty, lru_max_dirty. До каких для примера?

Все будет зависеть от длительности контрольной точки. Уменьшать параметры до приемлемой ее длительности.
На сильно нагруженных системах иногда доходило до значений 1-2 а то и меньше.

_torero15:05 Однако сервер опять ушел в себя!
Пошли смотреть, что там

Давайте посмотрим. Для начала нужен снова вывод onstat -d, onstat -g ses, onstat -u, onstat -k, onstat -l, onstat -F, onstat -g act, onstat -g rea
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539292
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Сразу после перезапуска он еще раз ушел в себя достаточно быстро.

Перед запуском внесли изменения в CONFIG:

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
PHYSFILE 225000

RTO_SERVER_RESTART 0
BLOCKTIMEOUT 3600

BUFFERPOOL	default,buffers=50000,lrus=8,lru_min_dirty=50.00,lru_max_dirty=60.00
BUFFERPOOL	size=4K,buffers=50000,lrus=8,lru_min_dirty=50.00,lru_max_dirty=60.00
AUTO_LRU_TUNING 1



На данный момент инстанс работает.

В 15:55 дал команду onmode -c. Чекпоинт прошел только в 16:15. Тут же дал еще раз onmode -c --- чекпоинт прошел быстро.

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
C:\INFORMIX11>onmode -c

C:\INFORMIX11>onstat -g ckp

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 00:42:38 -- 542208 Kbytes

AUTO_CKPTS=On   RTO_SERVER_RESTART=Off

                                                                    Critical Sections                          Physical Log    Logical Log
           Clock                                  Total Flush Block #      Ckpt  Wait  Long  # Dirty   Dskflu  Total    Avg    Total    Avg
Interval   Time      Trigger    LSN               Time  Time  Time  Waits  Time  Time  Time  Buffers   /Sec    Pages    /Sec   Pages    /Sec
1785       15:34:00  Startup    4901:0x4a140c0    0.8   0.7   0.0   0      0.0   0.0   0.0   52        52      51       0      1        0
1786       15:39:04  CKPTINTVL  4901:0x5239018    0.0   0.0   0.0   0      0.0   0.0   0.0   843       843     684      2      2085     6
1787       15:44:55  CKPTINTVL  4901:0x5b54018    0.0   0.0   0.0   0      0.0   0.0   0.0   1040      1040    932      2      2331     6
1788       16:15:48 *User       4902:0x37ae018    0.4   0.0   0.0   1      0.0   0.4   0.4   60        60      2447     1      15874    8
1789       16:16:24 *User       4902:0x38ee018    0.0   0.0   0.0   1      0.0   0.0   0.0   10        10      310      8      320      8

Max Plog       Max Llog       Max Dskflush   Avg Dskflush   Avg Dirty      Blocked
pages/sec      pages/sec      Time           pages/sec      pages/sec      Time
200            200            1              400            0              0
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539308
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
victor16,
Для начала нужен снова вывод onstat -d, onstat -g ses, onstat -u, onstat -k, onstat -l, onstat -F, onstat -g act, onstat -g rea

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
C:\INFORMIX11>onstat -d

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 00:51:10 -- 542208 Kbytes

Dbspaces
address          number   flags      fchunk   nchunks  pgsize   flags    owner    name
0000000091687030 1        0x60001    1        1        4096     N  BA    informix rootdbs
00000000917B2C50 2        0x42001    2        1        4096     N TBA    informix tempdbs
 2 active, 2047 maximum

Chunks
address          chunk/dbs     offset     size       free       bpages     flags pathname
00000000916871E0 1      1      0          5242880    2902888               PO-B-D D:\IFMXDATA\ol_css2\rootdbs_dat.000
00000000917B2E00 2      2      0          2621440    2621273               PO-B-D D:\IFMXDATA\ol_css2\tempdbs_dat.000
 2 active, 32766 maximum

NOTE: The values in the "size" and "free" columns for DBspace chunks are
      displayed in terms of "pgsize" of the DBspace to which they belong.


Expanded chunk capacity mode: always


Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
C:\INFORMIX11>onstat -g ses

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 00:51:38 -- 542208 Kbytes

session                                      #RSAM    total      used       dynamic
id       user     tty      pid      hostname threads  memory     memory     explain
599      informix -        0        -        0        16384      12528      off
598      tetzma   TSR_APP  13516    TSR_APP  1        823296     709024     off
597      mensaa   TSR_APP  13516    TSR_APP  1        1789952    1646496    off
596      hjvfirf  TSR_APP  13516    TSR_APP  1        1802240    1646880    off
595      kirxnm   TSR_APP  13516    TSR_APP  1        1101824    1011888    off
594      informix -        0        -        0        16384      12528      off
593      09021986 TSR_APP  13516    TSR_APP  1        204800     174352     off
592      elbsca   TSR_APP  13516    TSR_APP  1        770048     673264     off
591      aznmga   TSR_APP  13516    TSR_APP  1        3096576    3066528    off
590      guzeliya TSR_APP  13516    TSR_APP  1        315392     208144     off
589      ahmetshi TSR_APP  13516    TSR_APP  1        3383296    3323200    off
588      natat    TSR_APP  13516    TSR_APP  1        3805184    3783024    off
587      firdaniy TSR_APP  13516    TSR_APP  1        1724416    1468272    off
585      alfiyab  TSR_APP  13516    TSR_APP  1        4595712    4537488    off
583      09021986 TSR_APP  13516    TSR_APP  1        3461120    3309504    off
579      portal   SZAPP-SO 4240     SZAPP-SO 1        1122304    1093936    off
570      portal   SZAPP-SO 4240     SZAPP-SO 1        851968     816176     off
565      kuleeva  TSR_APP  13516    TSR_APP  1        4296704    4088688    off
564      liliyaga TSR_APP  13516    TSR_APP  1        4726784    4644592    off
479      portal   SZAPP-SO 4240     szapp-so 1        2150400    1903664    off
347      informix TSR_DB   6044     TSR_DB   1        69632      63200      off
34       informix -        0        -        1        57344      50336      off
8        informix -        0        -        0        16384      14240      off
7        informix -        0        -        0        16384      14240      off
6        informix -        0        -        0        16384      12528      off
5        informix -        0        -        0        16384      12528      off
4        informix -        0        -        0        16384      12528      off
3        informix -        0        -        0        16384      12528      off
2        informix -        0        -        0        16384      12528      off




Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
C:\INFORMIX11>onstat -u

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 00:51:58 -- 542208 Kbytes

Userthreads
address          flags   sessid   user     tty      wait             tout locks nreads   nwrites
91771030         ---P--D 1        informix -        0                0    0     169      592
91771858         ---P--F 0        informix -        0                0    0     0        5567
91772080         ---P--F 0        informix -        0                0    0     0        820
917728a8         ---P--F 0        informix -        0                0    0     0        0
917730d0         ---P--F 0        informix -        0                0    0     0        0
917738f8         ---P--F 0        informix -        0                0    0     0        0
91774120         ---P--F 0        informix -        0                0    0     0        0
91774948         ---P--F 0        informix -        0                0    0     0        0
91775170         ---P--F 0        informix -        0                0    0     0        0
91775998         ---P--- 11       informix -        0                0    0     0        5
917761c0         ---P--B 12       informix -        0                0    0     12579    160
917769e8         Y--P--D 13       informix -        9216f580         0    0     34221    0
91777a38         ---P--D 22       informix -        0                0    0     0        17
91778260         ---P--D 23       informix -        0                0    0     2        0
91778a88         Y--P--- 598      tetzma   TSR_APP  990eeba0         0    1     5        11
917792b0         Y--P--- 600      elenaz   TSR_APP  97d86490         0    1     0        1
9177a300         Y--P--- 564      liliyaga TSR_APP  9654a5d0         0    1     27318    27488
9177ab28         Y--P--D 31       informix -        8042bf08         0    0     0        0
9177b350         Y--P--- 34       informix -        921a4820         0    0     0        0
9177dc18         Y--P--- 588      natat    TSR_APP  98269630         0    1     16       30
917804e0         Y--P--- 585      alfiyab  TSR_APP  9399ccd0         0    1     18320    18363
91781530         Y--P--- 590      guzeliya TSR_APP  95e764c0         0    1     14       4
91781d58         Y--P--- 599      liliyaga TSR_APP  9859e0e0         0    1     0        0
91783df8         Y--P--- 595      kirxnm   TSR_APP  9777a8e0         0    1     117      110
91787f38         Y--P--- 570      portal   SZAPP-SO 9334cd60         0    1     40       0
91788f88         Y--P--- 593      09021986 TSR_APP  9654ac10         0    1     0        0
9178b850         Y--P--D 493      informix -        9216f580         0    0     276      0
91791a30         Y--P--- 565      kuleeva  TSR_APP  942d8b70         0    1     10322    10706
91792258         Y--P--- 589      ahmetshi TSR_APP  92490f00         0    1     27       191
91792a80         Y--P--- 347      informix TSR_DB   986a9860         0    1     1        0
917942f8         Y--P--- 591      aznmga   TSR_APP  9749f8c0         0    1     5        98
917973e8         Y--P--- 587      firdaniy TSR_APP  93198bb0         0    1     2758     2759
91798c60         Y--P--- 583      09021986 TSR_APP  985b2a80         0    1     2423     2456
9179bd50         Y--P--- 579      portal   SZAPP-SO 96a0d9f0         0    1     45       0
9179c578         Y--P--- 597      mensaa   TSR_APP  93f35e40         0    1     8229     8231
9179ee40         Y--P--- 479      portal   SZAPP-SO 99615a60         0    1     5386     5101
 36 active, 128 total, 89 maximum concurrent



Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
C:\INFORMIX11>onstat -k

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 00:52:25 -- 542208 Kbytes

Locks
address          wtlist           owner            lklist           type     tblsnum  rowid    key#/bsiz
8067e580         0                91778a88           0                    S    100002   206         0
80693d80         0                917973e8           0                    S    100002   206         0
815c4400         0                91791a30           0                    S    100002   206         0
824fe800         0                91781530           0                HDR+S    100002   206         0
824fe980         0                91783df8           0                    S    100002   206         0
82500500         0                917942f8           0                    S    100002   206         0
82500c00         0                91787f38           0                    S    100002   206         0
82501a00         0                91792258           0                    S    100002   206         0
82501e00         0                9179c578           0                    S    100002   206         0
82504600         0                91781d58           0                    S    100002   206         0
83441300         0                91792a80           0                    S    100002   206         0
83444380         0                9179ee40           0                    S    100002   206         0
83445580         0                917866c0           0                    S    100002   206         0
83446500         0                9177a300           0                    S    100002   206         0
83446680         0                917804e0           0                    S    100002   206         0
 15 active, 500000 total, 65536 hash buckets, 0 lock table overflows



Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
onstat -l

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 00:52:54 -- 542208 Kbytes

Physical Logging
Buffer bufused  bufsize  numpages   numwrits   pages/io
  P-2  31       32       6026       190        31.72
      phybegin         physize    phypos     phyused    %used
      1:263            225000     96502      117        0.05

Logical Logging
Buffer bufused  bufsize  numrecs    numpages   numwrits   recs/pages pages/io
  L-2  0        16       376589     22277      17240      16.9       1.3
        Subsystem    numrecs    Log Space used
        OLDRSAM      376575     85334752
        HA           14         616

address          number   flags    uniqid   begin                size     used    %used
00000000917CCCE0 1        U-B----  4874     1:225263            25000    25000   100.00
00000000917CCD50 2        U-B----  4875     1:250263            25000    25000   100.00
00000000917CCDC0 3        U-B----  4876     1:275263            25000    25000   100.00
00000000917CCE30 4        U-B----  4877     1:300263            25000    25000   100.00
00000000917CCEA0 5        U-B----  4878     1:325263            25000    25000   100.00
00000000917CCF10 6        U-B----  4879     1:350263            25000    25000   100.00
00000000917CCF80 7        U-B----  4880     1:375263            25000    25000   100.00
0000000091686ED0 8        U-B----  4881     1:400263            25000    25000   100.00
0000000091686F40 9        U-B----  4882     1:425263            25000    25000   100.00
0000000091686FB0 10       U-B----  4883     1:450263            25000    25000   100.00
0000000091687450 11       U-B----  4884     1:475263            25000    25000   100.00
00000000916874C0 12       U-B----  4885     1:500263            25000    25000   100.00
0000000091687530 13       U-B----  4886     1:525263            25000    25000   100.00
00000000916875A0 14       U-B----  4887     1:550263            25000    25000   100.00
0000000091687610 15       U-B----  4888     1:575263            25000    25000   100.00
0000000091687680 16       U-B----  4889     1:600263            25000    25000   100.00
00000000916876F0 17       U-B----  4890     1:625263            25000    25000   100.00
0000000091687760 18       U-B----  4891     1:650263            25000    25000   100.00
00000000916877D0 19       U-B----  4892     1:675263            25000    25000   100.00
0000000091687840 20       U-B----  4893     1:700263            25000    25000   100.00
00000000916878B0 21       U-B----  4894     1:725263            25000    25000   100.00
0000000091687920 22       U-B----  4895     1:750263            25000    25000   100.00
0000000091687990 23       U-B----  4896     1:775263            25000    25000   100.00
0000000091687A00 24       U-B----  4897     1:800263            25000    25000   100.00
0000000091687A70 25       U-B----  4898     1:825263            25000    25000   100.00
0000000091687AE0 26       U-B----  4899     1:850263            25000    25000   100.00
0000000091687B50 27       U-B----  4900     1:875263            25000    25000   100.00
0000000091687BC0 28       U-B----  4901     1:900263            25000    25000   100.00
0000000091687C30 29       U---C-L  4902     1:925263            25000    19884    79.54
0000000091687CA0 30       U-B----  4852     1:950263            25000    25000   100.00
0000000091687D10 31       U-B----  4853     1:975263            25000    25000   100.00
0000000091687D80 32       U-B----  4854     1:1000263           25000    25000   100.00
0000000091687DF0 33       U-B----  4855     1:1025263           25000    25000   100.00
0000000091687E60 34       U-B----  4856     1:1050263           25000    25000   100.00
0000000091687ED0 35       U-B----  4857     1:1075263           25000    25000   100.00
0000000091687F40 36       U-B----  4858     1:1100263           25000    25000   100.00
0000000091687FB0 37       U-B----  4859     1:1125263           25000    25000   100.00
00000000917B2460 38       U-B----  4860     1:1150263           25000    25000   100.00
00000000917B24D0 39       U-B----  4861     1:1175263           25000    25000   100.00
00000000917B2540 40       U-B----  4862     1:1200263           25000    25000   100.00
00000000917B25B0 41       U-B----  4863     1:1225263           25000    25000   100.00
00000000917B2620 42       U-B----  4864     1:1250263           25000    25000   100.00
00000000917B2690 43       U-B----  4865     1:1275263           25000    25000   100.00
00000000917B2700 44       U-B----  4866     1:1300263           25000    25000   100.00
00000000917B2770 45       U-B----  4867     1:1325263           25000    25000   100.00
00000000917B27E0 46       U-B----  4868     1:1350263           25000    25000   100.00
00000000917B2850 47       U-B----  4869     1:1375263           25000    25000   100.00
00000000917B28C0 48       U-B----  4870     1:1400263           25000    25000   100.00
00000000917B2930 49       U-B----  4871     1:1425263           25000    25000   100.00
00000000917B29A0 50       U-B----  4872     1:1450263           25000    25000   100.00
00000000917B2A10 51       U-B----  4873     1:1891686           25000    25000   100.00
 51 active, 51 total


Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
C:\INFORMIX11>onstat -F

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 00:53:37 -- 542208 Kbytes


Fg Writes     LRU Writes    Chunk Writes
0             0             4489

address           flusher  state    data     # LRU    Chunk    Wakeups  Idle Tim
91771858         0        I        0        0        9        1377     3207.291
91772080         1        I        0        0        8        3170     3206.600
917728a8         2        I        0        0        0        3163     3207.393
917730d0         3        I        0        0        0        1368     3207.398
917738f8         4        I        0        0        0        3163     3207.394
91774120         5        I        0        0        0        3163     3207.396
91774948         6        I        0        0        0        3163     3207.395
91775170         7        I        0        0        0        1368     3207.399
      states: Exit Idle Chunk Lru



Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
C:\INFORMIX11>onstat -g act

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 00:53:57 -- 542208 Kbytes

Running threads:
 tid     tcb              rstcb            prty status                vp-class       name
 8       91c91bc0         0                1    running                11soc*        soctcppoll
 9       91cc59c0         0                1    running                12soc*        soctcpio
 10      91cfb710         0                1    running                13soc*        soctcpio
 11      91d2f450         0                1    running                14soc*        soctcpio
 12      91d64190         0                1    running                15soc*        soctcpio
 11463   9356bd10         91792258         1    running                 1cpu*        sqlexec
 11702   97b670e0         917973e8         1    running                10cpu*        sqlexec



Код: sql
1.
2.
3.
4.
5.
6.
7.
C:\INFORMIX11>onstat -g rea

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 00:54:17 -- 542208 Kbytes

Ready threads:
 tid     tcb              rstcb            prty status                vp-class       name
 11315   97eddc60         91783df8         1    ready                  10cpu*        sqlexec




Уже конец рабочего дня - активности нет как днем.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539348
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torero,

радует уже, что onmode -c смог завершиться в приемлемое время.

Далее:
уменьшить интервал между контрольными точками, для начала до 3 минут.
уменьшить lru_min_dirty/lru_max_dirty для начала 30/40.

В onstat -g ckp четко виден резкий рост количества грязных буферов, что говорит о нарастании транзакционной активности во времени.

покажите еще onstat -P
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539352
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
102.
103.
104.
105.
106.
107.
108.
109.
110.
111.
112.
113.
114.
115.
116.
117.
118.
119.
120.
121.
122.
123.
124.
125.
126.
127.
128.
129.
130.
131.
132.
133.
134.
135.
136.
137.
138.
139.
140.
141.
142.
143.
144.
145.
146.
147.
148.
149.
150.
151.
152.
153.
154.
155.
156.
157.
158.
159.
160.
161.
162.
163.
164.
165.
166.
167.
168.
169.
170.
171.
172.
173.
174.
175.
176.
177.
178.
179.
180.
181.
182.
183.
184.
185.
186.
187.
188.
189.
190.
191.
192.
193.
194.
195.
196.
197.
198.
199.
200.
201.
202.
203.
204.
205.
206.
207.
208.
209.
210.
211.
212.
213.
214.
215.
216.
217.
218.
219.
220.
221.
222.
223.
224.
225.
226.
227.
228.
229.
230.
231.
232.
233.
234.
235.
236.
237.
238.
239.
240.
241.
242.
243.
244.
245.
246.
247.
248.
249.
250.
251.
252.
253.
254.
255.
256.
257.
258.
259.
260.
261.
262.
263.
264.
265.
266.
267.
268.
269.
270.
271.
272.
273.
274.
275.
276.
277.
278.
279.
280.
281.
282.
283.
284.
285.
286.
287.
288.
289.
290.
291.
292.
293.
294.
295.
296.
297.
298.
299.
300.
301.
302.
303.
304.
305.
306.
307.
308.
309.
310.
311.
312.
313.
314.
315.
316.
317.
318.
319.
320.
321.
322.
323.
324.
325.
326.
327.
328.
329.
330.
331.
332.
333.
334.
335.
336.
337.
338.
339.
340.
341.
342.
343.
344.
345.
346.
347.
348.
349.
350.
351.
352.
353.
354.
355.
356.
357.
358.
359.
360.
361.
362.
363.
364.
365.
onstat -P

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 01:14:56 -- 542208 Kbytes

Buffer pool page size: 4096
partnum  total    btree    data     other    dirty   
0        73       0        2        71       1       
1048577  185      0        177      8        17      
1048578  2        1        1        0        0       
1049588  18       7        10       1        0       
1049593  10       4        6        0        0       
1049594  24       7        17       0        0       
1049595  3        2        1        0        0       
1049596  1        1        0        0        0       
1049598  12       3        9        0        0       
1049599  41       24       17       0        0       
1049605  14       4        10       0        0       
1049606  3        2        1        0        0       
1049608  1        1        0        0        0       
1049610  31       11       20       0        0       
1049611  68       20       48       0        0       
1049612  149      22       126      1        9       
1049614  1        1        0        0        0       
1049615  1        1        0        0        0       
1049616  1        1        0        0        0       
1049618  121      22       99       0        0       
1049619  5        5        0        0        0       
1049621  2        1        1        0        0       
1049627  7        4        3        0        0       
1049640  3        3        0        0        0       
1049665  1        0        1        0        0       
1049666  1        0        1        0        0       
1049669  1485     0        1484     1        9       
1049671  262      0        261      1        0       
1049672  3        0        2        1        0       
1049673  1        0        1        0        0       
1049674  152      0        151      1        0       
1049676  685      0        685      0        0       
1049677  1        0        1        0        0       
1049678  55       0        55       0        0       
1049679  113      0        113      0        0       
1049680  323      0        322      1        0       
1049681  571      0        570      1        0       
1049682  14       0        14       0        0       
1049683  1        0        1        0        0       
1049684  1        0        1        0        0       
1049685  9        0        9        0        0       
1049686  3        0        2        1        0       
1049692  1632     0        1631     1        0       
1049693  34       0        33       1        0       
1049694  9        0        8        1        0       
1049695  144      0        144      0        0       
1049696  260      0        260      0        0       
1049697  1333     0        1332     1        0       
1049698  289      0        289      0        0       
1049699  666      0        665      1        1       
1049700  615      0        614      1        0       
1049701  705      0        704      1        0       
1049702  19       19       0        0        0       
1049703  39       0        38       1        0       
1049705  28       0        28       0        0       
1049707  31       0        30       1        8       
1049708  1        0        1        0        0       
1049709  178      0        178      0        8       
1049710  1104     0        1103     1        10      
1049713  8258     0        8256     2        18      
1049715  19       0        18       1        6       
1049716  5        0        4        1        3       
1049721  1        0        1        0        0       
1049722  1        0        1        0        0       
1049724  5        0        5        0        0       
1049725  1        0        1        0        0       
1049726  5708     0        5707     1        13      
1049727  1        0        1        0        0       
1049728  1        0        1        0        0       
1049732  1        0        1        0        0       
1049733  1        0        1        0        0       
1049734  2        0        2        0        0       
1049738  4        0        4        0        0       
1049740  9        0        9        0        0       
1049741  127      0        127      0        0       
1049742  375      0        374      1        1       
1049743  9        0        9        0        0       
1049745  97       0        96       1        0       
1049749  89       0        88       1        28      
1049750  2001     0        2000     1        1       
1049751  97       0        96       1        26      
1049752  1        0        1        0        0       
1049753  1        0        1        0        0       
1049754  45       0        45       0        0       
1049755  1        0        1        0        0       
1049757  1        0        1        0        0       
1049758  1        0        1        0        0       
1049763  3        0        2        1        0       
1049764  1011     0        1010     1        2       
1049765  429      0        428      1        0       
1049766  231      0        230      1        0       
1049767  13720    0        13718    2        1       
1049768  22       0        22       0        0       
1049769  150      0        150      0        0       
1049770  844      0        843      1        1       
1049771  23       0        23       0        0       
1049773  82       0        81       1        0       
1049775  129      0        128      1        0       
1049777  35       0        34       1        1       
1049793  1        1        0        0        0       
1049797  4        4        0        0        1       
1049798  152      150      0        2        50      
1049799  13       13       0        0        2       
1049801  14       14       0        0        0       
1049803  15       15       0        0        0       
1049804  2        2        0        0        0       
1049806  26       26       0        0        0       
1049808  1        1        0        0        0       
1049811  1        1        0        0        0       
1049813  1        1        0        0        0       
1049815  12       12       0        0        0       
1049816  2        2        0        0        0       
1049818  12       12       0        0        0       
1049819  1        1        0        0        0       
1049826  10       10       0        0        0       
1049829  1        1        0        0        0       
1049831  10       10       0        0        0       
1049832  17       17       0        0        0       
1049834  10       10       0        0        0       
1049835  36       36       0        0        0       
1049836  2        2        0        0        0       
1049837  2        2        0        0        0       
1049838  21       21       0        0        0       
1049839  112      112      0        0        0       
1049840  3        3        0        0        0       
1049841  2        2        0        0        0       
1049842  24       24       0        0        0       
1049843  274      274      0        0        0       
1049845  5        5        0        0        0       
1049852  1        1        0        0        0       
1049853  1        1        0        0        0       
1049855  1        1        0        0        0       
1049856  9        9        0        0        0       
1049857  3        3        0        0        0       
1049858  3        3        0        0        0       
1049859  1        1        0        0        0       
1049863  2        2        0        0        0       
1049881  3        3        0        0        0       
1049882  3        3        0        0        0       
1049883  3        3        0        0        0       
1049884  3        3        0        0        0       
1049885  3        3        0        0        0       
1049886  3        3        0        0        0       
1049887  21       21       0        0        0       
1049888  3        3        0        0        0       
1049889  3        3        0        0        0       
1049890  73       73       0        0        0       
1049891  2        2        0        0        0       
1049892  17       17       0        0        0       
1049893  11       11       0        0        0       
1049894  3        3        0        0        0       
1049895  5        5        0        0        0       
1049896  5        5        0        0        0       
1049897  4        4        0        0        0       
1049898  1        1        0        0        0       
1049900  2        2        0        0        0       
1049902  14       14       0        0        0       
1049904  16       16       0        0        0       
1049905  2        2        0        0        0       
1049908  18       18       0        0        0       
1049927  7        7        0        0        0       
1049928  100      100      0        0        0       
1049929  42       42       0        0        0       
1049931  34       34       0        0        0       
1049932  30       30       0        0        0       
1049937  21       21       0        0        0       
1049938  5        5        0        0        1       
1049939  7        7        0        0        2       
1049940  60       60       0        0        2       
1049941  9        9        0        0        1       
1049942  6        6        0        0        2       
1049943  2        2        0        0        0       
1049944  98       98       0        0        0       
1049945  3        3        0        0        0       
1049946  7        7        0        0        0       
1049947  3        3        0        0        0       
1049948  3        3        0        0        0       
1049949  3        3        0        0        0       
1049950  109      109      0        0        0       
1049951  3        3        0        0        0       
1049952  4        4        0        0        0       
1049953  194      194      0        0        0       
1049954  4        4        0        0        0       
1049955  10       10       0        0        0       
1049956  40       40       0        0        0       
1049957  23       23       0        0        0       
1049958  10       10       0        0        0       
1049959  10       10       0        0        0       
1049964  8        8        0        0        0       
1049974  8        7        0        1        5       
1049975  20       20       0        0        10      
1049976  9        9        0        0        5       
1049977  9        9        0        0        5       
1049978  8        8        0        0        4       
1049979  19       19       0        0        11      
1049980  19       17       0        2        15      
1049981  109      109      0        0        21      
1049982  15       14       0        1        7       
1049984  1        1        0        0        0       
1049986  17       17       0        0        0       
1049989  6        6        0        0        0       
1049991  7        7        0        0        4       
1049992  208      208      0        0        23      
1049993  21       19       0        2        16      
1049994  5        5        0        0        3       
1049995  162      161      0        1        6       
1049998  4        4        0        0        0       
1049999  38       38       0        0        0       
1050000  10       10       0        0        5       
1050003  9        9        0        0        0       
1050004  5        5        0        0        0       
1050007  16       8        0        8        2       
1050008  7        6        0        1        2       
1050009  5        4        0        1        2       
1050010  3        3        0        0        1       
1050022  1        1        0        0        0       
1050026  1        1        0        0        0       
1050036  4        4        0        0        0       
1050041  1        1        0        0        0       
1050042  109      109      0        0        5       
1050043  5        5        0        0        2       
1050044  14       14       0        0        1       
1050045  1        1        0        0        0       
1050047  1        1        0        0        0       
1050051  1        1        0        0        0       
1050053  1        1        0        0        0       
1050054  1        1        0        0        0       
1050056  1        1        0        0        0       
1050063  1        1        0        0        0       
1050069  2        2        0        0        0       
1050070  1        1        0        0        0       
1050079  2        2        0        0        0       
1050081  3        3        0        0        0       
1050085  4        4        0        0        0       
1050088  11       11       0        0        0       
1050089  9        9        0        0        0       
1050090  4        4        0        0        0       
1050091  9        9        0        0        0       
1050092  3        3        0        0        0       
1050093  3        3        0        0        0       
1050094  2        2        0        0        0       
1050095  15       15       0        0        0       
1050097  2        2        0        0        0       
1050109  5        5        0        0        0       
1050110  4        4        0        0        0       
1050115  2        2        0        0        0       
1050116  7        7        0        0        0       
1050126  17       16       0        1        8       
1050127  55       54       0        1        18      
1050128  22       20       0        2        15      
1050129  112      112      0        0        46      
1050130  17       16       0        1        7       
1050131  89       88       0        1        29      
1050132  42       41       0        1        21      
1050133  9        9        0        0        0       
1050134  50       50       0        0        1       
1050135  420      319      0        101      0       
1050136  35       34       0        1        0       
1050137  64       64       0        0        0       
1050138  24       24       0        0        2       
1050139  7        7        0        0        0       
1050140  21       20       0        1        0       
1050141  30       29       0        1        10      
1050142  11       10       0        1        5       
1050143  60       46       0        14       25      
1050144  21       17       0        4        15      
1050145  1        1        0        0        0       
1050149  1        1        0        0        0       
1050153  13       13       0        0        0       
1050156  1        1        0        0        0       
1050157  1        1        0        0        0       
1050164  1        1        0        0        0       
1050168  1        1        0        0        0       
1050183  2        2        0        0        1       
1050184  3        3        0        0        1       
1050185  16       16       0        0        2       
1050186  3        3        0        0        1       
1050187  11       11       0        0        2       
1050188  13       13       0        0        2       
1050189  14       14       0        0        3       
1050190  2        2        0        0        0       
1050191  13       13       0        0        0       
1050192  45       45       0        0        0       
1050193  3        3        0        0        0       
1050194  7        7        0        0        0       
1050195  30       30       0        0        0       
1050196  8        8        0        0        0       
1050197  4        4        0        0        0       
1050198  4        4        0        0        0       
1050199  4        4        0        0        0       
1050200  4        4        0        0        0       
1050202  13       13       0        0        0       
1050203  100      100      0        0        4       
1050204  22       22       0        0        4       
1050205  3        3        0        0        1       
1050206  4        4        0        0        0       
1050208  2        2        0        0        0       
1050209  2        2        0        0        0       
1050212  8        8        0        0        0       
1050213  10       10       0        0        0       
1050214  15       15       0        0        1       
1050215  3        3        0        0        1       
1050216  20       20       0        0        3       
1050217  23       23       0        0        1       
1050218  5        5        0        0        1       
1050219  12       11       0        1        2       
1050221  3        3        0        0        0       
1050222  5        5        0        0        0       
1050225  5        5        0        0        0       
1050226  3        3        0        0        0       
1050231  15       15       0        0        0       
1050232  4        4        0        0        0       
1050233  5        5        0        0        0       
1050236  3        3        0        0        0       
1050237  5        5        0        0        0       
1050239  3        3        0        0        0       
1050244  12       12       0        0        0       
1050245  3        3        0        0        0       
1050246  2        2        0        0        0       
1050247  2        2        0        0        0       
1050248  10       10       0        0        0       
1050249  6        6        0        0        2       
1050250  16       16       0        0        2       
1050251  6        6        0        0        2       
1050252  5        5        0        0        3       
1050259  4        4        0        0        0       
1050261  3        3        0        0        0       
1050262  17       17       0        0        0       
1050264  13       13       0        0        0       
1050265  3        3        0        0        1       
1050266  51       51       0        0        0       
1050267  3        3        0        0        0       
1050268  4        4        0        0        0       
1050272  4        0        3        1        0       
1050273  12       2        9        1        0       
1050274  6        4        0        2        0       
1050275  9        4        2        3        0       
1050276  6        4        0        2        0       
1050277  6        4        0        2        0       
1050278  3        2        0        1        0       
2097153  199      0        7        192      97      
2097312  4        2        1        1        3       
2097313  3        2        0        1        3       
2097314  2        0        1        1        2       
2097315  3        2        0        1        3       
2097316  3        2        0        1        3       
2097317  4        2        1        1        4       
2097318  3        2        0        1        3       
2097319  5        2        2        1        5       
2097320  4        2        1        1        4       
2097321  3        1        1        1        3       
2097322  9        4        3        2        9       

Totals:  49987    4671     44832    484      761     

Percentages:
Data  89.69 
Btree 9.34  
Other 0.97  
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539356
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
victor16_torero,

В onstat -g ckp четко виден резкий рост количества грязных буферов, что говорит о нарастании транзакционной активности во времени.

Это может быть вызвано массовым обращением пользователей после недоступности системы - кинулись вводить данные, пока система работает.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539376
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torero,

можно еще раз показать onstat -g ckp, onstat -F, onstat -P (последние строки)
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539406
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
C:\INFORMIX11\etc>onstat -g ckp

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 01:38:59 -- 542208 Kbytes

AUTO_CKPTS=On   RTO_SERVER_RESTART=Off

                                                                    Critical Sections                          Physical Log    Logical Log
           Clock                                  Total Flush Block #      Ckpt  Wait  Long  # Dirty   Dskflu  Total    Avg    Total    Avg
Interval   Time      Trigger    LSN               Time  Time  Time  Waits  Time  Time  Time  Buffers   /Sec    Pages    /Sec   Pages    /Sec
1785       15:34:00  Startup    4901:0x4a140c0    0.8   0.7   0.0   0      0.0   0.0   0.0   52        52      51       0      1        0
1786       15:39:04  CKPTINTVL  4901:0x5239018    0.0   0.0   0.0   0      0.0   0.0   0.0   843       843     684      2      2085     6
1787       15:44:55  CKPTINTVL  4901:0x5b54018    0.0   0.0   0.0   0      0.0   0.0   0.0   1040      1040    932      2      2331     6
1788       16:15:48 *User       4902:0x37ae018    0.4   0.0   0.0   1      0.0   0.4   0.4   60        60      2447     1      15874    8
1789       16:16:24 *User       4902:0x38ee018    0.0   0.0   0.0   1      0.0   0.0   0.0   10        10      310      8      320      8
1790       16:21:32  CKPTINTVL  4902:0x4376018    0.1   0.0   0.0   0      0.0   0.0   0.0   971       971     833      2      2696     8
1791       16:26:36  CKPTINTVL  4902:0x4d8a018    0.1   0.0   0.0   1      0.0   0.0   0.0   854       854     817      2      2586     8
1792       16:31:40  CKPTINTVL  4903:0x3785018    0.1   0.0   0.0   0      0.0   0.0   0.0   3644      3644    672      2      19363    63
1793       16:36:44  CKPTINTVL  4903:0x42f6018    0.3   0.0   0.0   0      0.0   0.0   0.0   1085      1085    929      3      2929     9
1794       16:41:49  CKPTINTVL  4903:0x4e5759c    0.2   0.0   0.0   1      0.0   0.0   0.0   1172      1172    996      3      2914     9
1795       16:46:53  CKPTINTVL  4903:0x5b470f8    0.7   0.3   0.0   0      0.0   0.0   0.0   2133      2133    1761     5      3317     10
1796       16:51:57  CKPTINTVL  4904:0x7d9018     0.2   0.1   0.0   0      0.0   0.0   0.0   2525      2525    2328     7      3642     11
1797       16:57:01  CKPTINTVL  4904:0x10d3018    0.1   0.0   0.0   0      0.0   0.0   0.0   958       958     798      2      2298     7
1798       17:02:05  CKPTINTVL  4904:0x1639018    0.0   0.0   0.0   1      0.0   0.0   0.0   828       828     676      2      1387     4
1799       17:07:10  CKPTINTVL  4904:0x17ee018    0.0   0.0   0.0   0      0.0   0.0   0.0   407       407     285      0      437      1
1800       17:12:14  CKPTINTVL  4906:0x1332018    0.1   0.0   0.0   0      0.0   0.0   0.0   3310      3310    312      1      48788    160

Max Plog       Max Llog       Max Dskflush   Avg Dskflush   Avg Dirty      Blocked
pages/sec      pages/sec      Time           pages/sec      pages/sec      Time
567            3148           1              1240           1              0


Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
C:\INFORMIX11\etc>onstat -F

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 01:39:25 -- 542208 Kbytes


Fg Writes     LRU Writes    Chunk Writes
0             0             39960

address           flusher  state    data     # LRU    Chunk    Wakeups  Idle Tim
91771858         0        I        0        0        19       4097     5954.790
91772080         1        I        0        0        17       5840     5954.570
917728a8         2        I        0        0        0        5873     5955.429
917730d0         3        I        0        0        0        4078     5955.434
917738f8         4        I        0        0        0        5873     5955.432
91774120         5        I        0        0        0        5824     5955.435
91774948         6        I        0        0        0        5873     5955.432
91775170         7        I        0        0        0        4078     5955.439
      states: Exit Idle Chunk Lru



Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
onstat -P
...
1050226  2        2        0        0        0
1050231  5        5        0        0        0
1050232  3        3        0        0        0
1050236  3        3        0        0        0
1050237  2        2        0        0        0
1050239  2        2        0        0        0
1050244  12       12       0        0        0
1050248  12       12       0        0        0
1050249  4        4        0        0        0
1050250  17       17       0        0        0
1050251  7        7        0        0        0
1050252  7        6        0        1        0
1050262  16       16       0        0        0
1050264  12       12       0        0        0
1050265  3        3        0        0        0
1050266  51       51       0        0        0
1050267  2        2        0        0        0
1050268  3        3        0        0        0
1050272  28       0        27       1        2
1050273  61       14       45       2        0
1050274  16       14       0        2        0
1050275  2783     12       2769     2        2770
1050276  18       14       2        2        15
1050277  13       11       0        2        10
1050278  16       14       0        2        13
1050279  3        2        0        1        0
2097153  199      0        0        199      163
2097158  3        2        0        1        3
2097159  1        1        0        0        1
2097160  1        1        0        0        1
2097216  1        0        1        0        0
2097280  5        1        3        1        5
2097281  4        3        0        1        4
2097282  1        0        0        1        1
2097283  2        1        0        1        2
2097284  2        1        0        1        2
2097285  2        1        0        1        2
2097286  2        1        0        1        2

Totals:  49993    4019     45603    371      3034

Percentages:
Data  91.22
Btree 8.04
Other 0.74
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539445
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torero,

еще раз
onstat -p (p маленькое) плюс еще раз команды:
onstat -g ckp, onstat -F (начальные строки до address), onstat -P (последние строки, начиная с Totals:)

Хотя уже сейчас можно сказать, похоже, что с такой нагрузкой сервер справляется.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539483
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
C:\INFORMIX11\etc>onstat -p

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 02:00:55 -- 542208 Kbytes

Profile
dskreads   pagreads   bufreads   %cached dskwrits   pagwrits   bufwrits   %cached
318853     2740513    276856966  99.89   197011     2678916    8221448    99.17

isamtot    open       start      read       write      rewrite    delete     commit     rollbk
485042532  1893158    1311497    262066864  5906668    255902     47303      45660      0

gp_read    gp_write   gp_rewrt   gp_del     gp_alloc   gp_free    gp_curs
0          0          0          0          0          0          0

ovlock     ovuserthread ovbuff     usercpu  syscpu   numckpts   flushes
0          0            0          5766.88  148.50   40         41

bufwaits   lokwaits   lockreqs   deadlks    dltouts    ckpwaits   compress   seqscans
4460       14         508240321  0          0          9          980598     53608

ixda-RA    idx-RA     da-RA      logrec-RA  RA-pgsused lchwaits
0          365713     217695     0          147964     339350


Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
C:\INFORMIX11\etc>onstat -g ckp

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 02:01:23 -- 542208 Kbytes

AUTO_CKPTS=On   RTO_SERVER_RESTART=Off

                                                                    Critical Sections                          Physical Log    Logical Log
           Clock                                  Total Flush Block #      Ckpt  Wait  Long  # Dirty   Dskflu  Total    Avg    Total    Avg
Interval   Time      Trigger    LSN               Time  Time  Time  Waits  Time  Time  Time  Buffers   /Sec    Pages    /Sec   Pages    /Sec
1785       15:34:00  Startup    4901:0x4a140c0    0.8   0.7   0.0   0      0.0   0.0   0.0   52        52      51       0      1        0
1786       15:39:04  CKPTINTVL  4901:0x5239018    0.0   0.0   0.0   0      0.0   0.0   0.0   843       843     684      2      2085     6
1787       15:44:55  CKPTINTVL  4901:0x5b54018    0.0   0.0   0.0   0      0.0   0.0   0.0   1040      1040    932      2      2331     6
1788       16:15:48 *User       4902:0x37ae018    0.4   0.0   0.0   1      0.0   0.4   0.4   60        60      2447     1      15874    8
1789       16:16:24 *User       4902:0x38ee018    0.0   0.0   0.0   1      0.0   0.0   0.0   10        10      310      8      320      8
1790       16:21:32  CKPTINTVL  4902:0x4376018    0.1   0.0   0.0   0      0.0   0.0   0.0   971       971     833      2      2696     8
1791       16:26:36  CKPTINTVL  4902:0x4d8a018    0.1   0.0   0.0   1      0.0   0.0   0.0   854       854     817      2      2586     8
1792       16:31:40  CKPTINTVL  4903:0x3785018    0.1   0.0   0.0   0      0.0   0.0   0.0   3644      3644    672      2      19363    63
1793       16:36:44  CKPTINTVL  4903:0x42f6018    0.3   0.0   0.0   0      0.0   0.0   0.0   1085      1085    929      3      2929     9
1794       16:41:49  CKPTINTVL  4903:0x4e5759c    0.2   0.0   0.0   1      0.0   0.0   0.0   1172      1172    996      3      2914     9
1795       16:46:53  CKPTINTVL  4903:0x5b470f8    0.7   0.3   0.0   0      0.0   0.0   0.0   2133      2133    1761     5      3317     10
1796       16:51:57  CKPTINTVL  4904:0x7d9018     0.2   0.1   0.0   0      0.0   0.0   0.0   2525      2525    2328     7      3642     11
1797       16:57:01  CKPTINTVL  4904:0x10d3018    0.1   0.0   0.0   0      0.0   0.0   0.0   958       958     798      2      2298     7
1798       17:02:05  CKPTINTVL  4904:0x1639018    0.0   0.0   0.0   1      0.0   0.0   0.0   828       828     676      2      1387     4
1799       17:07:10  CKPTINTVL  4904:0x17ee018    0.0   0.0   0.0   0      0.0   0.0   0.0   407       407     285      0      437      1
1800       17:12:14  CKPTINTVL  4906:0x1332018    0.1   0.0   0.0   0      0.0   0.0   0.0   3310      3310    312      1      48788    160
1801       17:17:18  CKPTINTVL  4906:0x52cb018    0.1   0.0   0.0   0      0.0   0.0   0.0   3248      3248    3133     10     16281    53
1802       17:22:22  CKPTINTVL  4906:0x54ac018    0.1   0.0   0.0   0      0.0   0.0   0.0   512       512     306      1      481      1
1803       17:27:26  CKPTINTVL  4908:0xed0018     0.1   0.1   0.0   0      0.0   0.0   0.0   3123      3123    151      0      32116    105
1804       17:32:31  CKPTINTVL  4908:0x102a018    0.1   0.0   0.0   0      0.0   0.0   0.0   197       197     131      0      346      1

Max Plog       Max Llog       Max Dskflush   Avg Dskflush   Avg Dirty      Blocked
pages/sec      pages/sec      Time           pages/sec      pages/sec      Time
567            3148           1              1345           0              0


Код: sql
1.
2.
3.
4.
C:\INFORMIX11\etc>onstat -F

Fg Writes     LRU Writes    Chunk Writes
0             0             45671


Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
onstat -P

Totals:  49966    4170     45429    367      78

Percentages:
Data  90.92
Btree 8.35
Other 0.73



все ушли домой.
самое интересное начнется с утра и ближе к обеду.
вечером перестартую инстанс, чтобы задействовать 3х минутный чекпоинт и lru 30|40
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539506
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_toreroсамое интересное начнется с утра и ближе к обеду.
вечером перестартую инстанс, чтобы задействовать 3х минутный чекпоинт и lru 30|40

Удачи Вам завтра, следите, чтобы не рос процент занятости физического журнала (onstat -l).
Подумайте также, как вынести физический и логические журналы на отдельные диски, желательно пошустрее, желательно в центр диска (подбирается смещением с начала диска), не беда, если края дисков совсем не будут использоваться.
Неплохо также разделить данные и индексы.
Еще мне кажется не совсем верным архитектурным решением создавать крупные индексы в приложении.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539660
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
victor16, спасибо за участие!
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539709
bk0010
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
falcon111В 15:55 дал команду onmode -c. Чекпоинт прошел только в 16:15. Тут же дал еще раз onmode -c --- чекпоинт прошел быстро.
Диски не проверяли? Если rootdbs не очень большой, то попробуйте остановить сервер, сделать копию файла с rootdbs (вряд-ли под windows вы использовали raw dbs), переименовать исходный, переименовать копию в исходный, запустить сервер. Проверьте сообщения от raid-а: может он в это время регенерирует.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539993
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
bk0010,

Хронология событий:
1. После НГ в первый день нас завалили звонками - не работает.
2. Разбирались несколько дней - таких симптомов раньше не видели. Только на второй-третий день обратили внимание на низкую дисковую скорость.
3. В утилите контроллера было сообщение "не работает аккумулятор контроллера". Поменяли с другой идентичной железки на заранее исправную. Ошибка не исчезла. В то же время на втором ошибка не появилась.
4. Поменяли контроллеры местами - ошибка исчезла на обоих серверах.
5. Выгрузили БД.
6. Переинициализировали инстанс, тк на фоне непонимания происходящего было недоверие в корректности содержимого чанков.
7. Сейчас вторая неделя поиска причин.
8. Параллельно на этой же машине создан второй инстанс для другой системы. С ним проблем нет и близко таких. Пользовательская нагрузка на эту систему на порядок ниже. Настройки config для обеих систем одинаковые. Сейчас немного разошлись, но не принципиально.


Сейчас через планировщик windows настроил каждые 5 минут запись с файл результата команд:
onstat -g ckp >> %fn%
onstat -P >> %fn%
onstat -p >> %fn%
onstat -F >> %fn%
onstat -g seg >> %fn%
onstat -u >> %fn%
onstat -g sql >> %fn%
onstat -g ses >> %fn%
onstat -l >> %fn%
onstat -g act >> %fn%
onstat -g rea >> %fn%
onstat -g cpu >> %fn%
onstat -k >> %fn%
onstat -g glo >> %fn%
onstat -g iof >> %fn%
onstat -d >> %fn%
onstat -m >> %fn%
onparams >> %fn%

Пока все работает. Ждем зависания.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38540554
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Последние новости:
Сегодня до 13:50 работал не падал. Активность была ниже, чем обычно, но все же.

Обнаружили, что один запрос в новом обновлении от 24.01.2014 был с into temp без with no log;

Добавили в config TEMPTAB_NOLOG 1
и перезапустили инстанс.

Он завис через 10 минут с теми же симптомами! То есть работал с утра и не дрогнул, а тут после перезагрузки не вытерпел и 10 минут. До перезапуска с ночи есть логи выполнения ряда команд через каждые 5 минут.
Например вот:
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
28.01.2014 13:50:00.03 
-------------------------------------------------------------- 
onstat -g ckp 
-------------------------------------------------------------- 

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line (CKPT INP) -- Up 15:55:49 -- 542208 Kbytes

AUTO_CKPTS=On   RTO_SERVER_RESTART=Off   

                                                                    Critical Sections                          Physical Log    Logical Log    
           Clock                                  Total Flush Block #      Ckpt  Wait  Long  # Dirty   Dskflu  Total    Avg    Total    Avg   
Interval   Time      Trigger    LSN               Time  Time  Time  Waits  Time  Time  Time  Buffers   /Sec    Pages    /Sec   Pages    /Sec  
1972       12:46:39  CKPTINTVL  4919:0x4555018    0.0   0.0   0.0   0      0.0   0.0   0.0   369       369     201      1      411      2     
1973       12:49:42  CKPTINTVL  4919:0x4803018    0.0   0.0   0.0   0      0.0   0.0   0.0   591       591     348      1      686      3     
1974       12:52:44  CKPTINTVL  4919:0x4a25018    0.1   0.0   0.0   2      0.0   0.0   0.0   298       298     268      1      548      3     
1975       12:55:47  CKPTINTVL  4919:0x4c27018    0.0   0.0   0.0   0      0.0   0.0   0.0   471       471     218      1      514      2     
1976       12:58:49  CKPTINTVL  4919:0x5059018    0.0   0.0   0.0   0      0.0   0.0   0.0   363       363     236      1      1074     5     
1977       13:01:52  CKPTINTVL  4920:0x1693018    0.3   0.0   0.0   0      0.0   0.0   0.0   1772      1772    1688     9      10210    55    
1978       13:04:54  CKPTINTVL  4920:0x19d7018    0.1   0.0   0.0   0      0.0   0.0   0.0   364       364     285      1      836      4     
1979       13:07:57  CKPTINTVL  4920:0x1ed1018    0.1   0.1   0.0   0      0.0   0.0   0.0   533       533     431      2      1274     6     
1980       13:10:59  CKPTINTVL  4920:0x22a9018    0.1   0.0   0.0   0      0.0   0.0   0.0   545       545     317      1      984      5     
1981       13:14:02  CKPTINTVL  4920:0x260e018    0.2   0.1   0.0   1      0.0   0.0   0.0   557       557     392      2      870      4     
1982       13:17:04  CKPTINTVL  4920:0x2b24018    0.1   0.0   0.0   0      0.0   0.0   0.0   563       563     472      2      1302     7     
1983       13:20:07  CKPTINTVL  4920:0x3065018    0.2   0.1   0.0   0      0.0   0.0   0.0   553       553     421      2      1345     7     
1984       13:23:09  CKPTINTVL  4920:0x333c018    0.0   0.0   0.0   0      0.0   0.0   0.0   322       322     299      1      727      3     
1985       13:26:12  CKPTINTVL  4921:0x14c4018    0.2   0.1   0.0   1      0.0   0.0   0.0   3591      3591    536      2      17201    93    
1986       13:29:14  CKPTINTVL  4921:0x1e96018    0.1   0.0   0.0   0      0.0   0.0   0.0   795       795     476      2      2514     13    
1987       13:32:17  CKPTINTVL  4921:0x2171018    0.1   0.0   0.0   0      0.0   0.0   0.0   492       492     476      2      731      3     
1988       13:35:19  CKPTINTVL  4921:0x265f018    0.2   0.1   0.0   0      0.0   0.0   0.0   741       741     550      3      1262     6     
1989       13:38:22  CKPTINTVL  4921:0x295a018    0.1   0.0   0.0   1      0.0   0.1   0.1   680       680     488      2      765      4     
1990       13:41:24  CKPTINTVL  4921:0x2d20018    0.2   0.0   0.0   0      0.0   0.0   0.0   615       615     493      2      968      5     
1991       13:44:34  CKPTINTVL  4921:0x3285018    7.8   7.8   0.0   0      0.0   0.0   0.0   577       74      474      2      1385     7     

Max Plog       Max Llog       Max Dskflush   Avg Dskflush   Avg Dirty      Blocked      
pages/sec      pages/sec      Time           pages/sec      pages/sec      Time         
573            3148           8              615            0              0            
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38540722
Ikir
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
_toreroНапример вот:
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
28.01.2014 13:50:00.03 
-------------------------------------------------------------- 
onstat -g ckp 
-------------------------------------------------------------- 

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line (CKPT INP) -- Up 15:55:49 -- 542208 Kbytes

AUTO_CKPTS=On   RTO_SERVER_RESTART=Off   

                                                                    Critical Sections                          Physical Log    Logical Log    
           Clock                                  Total Flush Block #      Ckpt  Wait  Long  # Dirty   Dskflu  Total    Avg    Total    Avg   
Interval   Time      Trigger    LSN               Time  Time  Time  Waits  Time  Time  Time  Buffers   /Sec    Pages    /Sec   Pages    /Sec  
1972       12:46:39  CKPTINTVL  4919:0x4555018    0.0   0.0   0.0   0      0.0   0.0   0.0   369       369     201      1      411      2     
1973       12:49:42  CKPTINTVL  4919:0x4803018    0.0   0.0   0.0   0      0.0   0.0   0.0   591       591     348      1      686      3     
1974       12:52:44  CKPTINTVL  4919:0x4a25018    0.1   0.0   0.0   2      0.0   0.0   0.0   298       298     268      1      548      3     
1975       12:55:47  CKPTINTVL  4919:0x4c27018    0.0   0.0   0.0   0      0.0   0.0   0.0   471       471     218      1      514      2     
1976       12:58:49  CKPTINTVL  4919:0x5059018    0.0   0.0   0.0   0      0.0   0.0   0.0   363       363     236      1      1074     5     
1977       13:01:52  CKPTINTVL  4920:0x1693018    0.3   0.0   0.0   0      0.0   0.0   0.0   1772      1772    1688     9      10210    55    
1978       13:04:54  CKPTINTVL  4920:0x19d7018    0.1   0.0   0.0   0      0.0   0.0   0.0   364       364     285      1      836      4     
1979       13:07:57  CKPTINTVL  4920:0x1ed1018    0.1   0.1   0.0   0      0.0   0.0   0.0   533       533     431      2      1274     6     
1980       13:10:59  CKPTINTVL  4920:0x22a9018    0.1   0.0   0.0   0      0.0   0.0   0.0   545       545     317      1      984      5     
1981       13:14:02  CKPTINTVL  4920:0x260e018    0.2   0.1   0.0   1      0.0   0.0   0.0   557       557     392      2      870      4     
1982       13:17:04  CKPTINTVL  4920:0x2b24018    0.1   0.0   0.0   0      0.0   0.0   0.0   563       563     472      2      1302     7     
1983       13:20:07  CKPTINTVL  4920:0x3065018    0.2   0.1   0.0   0      0.0   0.0   0.0   553       553     421      2      1345     7     
1984       13:23:09  CKPTINTVL  4920:0x333c018    0.0   0.0   0.0   0      0.0   0.0   0.0   322       322     299      1      727      3     
1985       13:26:12  CKPTINTVL  4921:0x14c4018    0.2   0.1   0.0   1      0.0   0.0   0.0   3591      3591    536      2      17201    93    
1986       13:29:14  CKPTINTVL  4921:0x1e96018    0.1   0.0   0.0   0      0.0   0.0   0.0   795       795     476      2      2514     13    
1987       13:32:17  CKPTINTVL  4921:0x2171018    0.1   0.0   0.0   0      0.0   0.0   0.0   492       492     476      2      731      3     
1988       13:35:19  CKPTINTVL  4921:0x265f018    0.2   0.1   0.0   0      0.0   0.0   0.0   741       741     550      3      1262     6     
1989       13:38:22  CKPTINTVL  4921:0x295a018    0.1   0.0   0.0   1      0.0   0.1   0.1   680       680     488      2      765      4     
1990       13:41:24  CKPTINTVL  4921:0x2d20018    0.2   0.0   0.0   0      0.0   0.0   0.0   615       615     493      2      968      5     
1991       13:44:34  CKPTINTVL  4921:0x3285018    7.8   7.8   0.0   0      0.0   0.0   0.0   577       74      474      2      1385     7     

Max Plog       Max Llog       Max Dskflush   Avg Dskflush   Avg Dirty      Blocked      
pages/sec      pages/sec      Time           pages/sec      pages/sec      Time         
573            3148           8              615            0              0            



Следующий чекпоинт по интервалу у вас должен был быть в ~ 13:47:34, но его нет в 13:50:00.
При этом сервер находится в состоянии CKPT INP.
В этот момент хорошо бы посмотреть количество грязных страниц ( несколько раз ) onstat -R ( в конце).
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38540783
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Ikir,
в последний раз мы слишком быстро его перезапустили - он успел ожить!
вот сейчас в 16:12 он завис со всеми обычными симптомами, но мы решили не спешить и посмотреть. Он жил(!) через 2 минуты:

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
28.01.2014 16:18:20.51 
-------------------------------------------------------------- 
onstat -g ckp 
-------------------------------------------------------------- 

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 02:02:28 -- 542208 Kbytes

AUTO_CKPTS=On   RTO_SERVER_RESTART=Off   

                                                                    Critical Sections                          Physical Log    Logical Log    
           Clock                                  Total Flush Block #      Ckpt  Wait  Long  # Dirty   Dskflu  Total    Avg    Total    Avg   
Interval   Time      Trigger    LSN               Time  Time  Time  Waits  Time  Time  Time  Buffers   /Sec    Pages    /Sec   Pages    /Sec  
2018       15:19:54  CKPTINTVL  4922:0x255d018    0.1   0.0   0.0   0      0.0   0.0   0.0   322       322     380      2      358      1     
2019       15:22:57  CKPTINTVL  4922:0x29f3018    0.0   0.0   0.0   0      0.0   0.0   0.0   471       471     517      2      1174     6     
2020       15:25:59  CKPTINTVL  4922:0x2e86c08    0.2   0.1   0.0   1      0.0   0.0   0.0   673       673     618      3      1172     6     
2021       15:29:02  CKPTINTVL  4922:0x34342fc    0.1   0.0   0.0   0      0.0   0.0   0.0   959       959     912      4      1454     7     
2022       15:32:04  CKPTINTVL  4922:0x39bb0f8    0.1   0.1   0.0   0      0.0   0.0   0.0   931       931     845      4      1416     7     
2023       15:35:07  CKPTINTVL  4922:0x3b91018    0.1   0.0   0.0   0      0.0   0.0   0.0   606       606     592      3      470      2     
2024       15:38:09  CKPTINTVL  4922:0x41e4f5c    0.1   0.0   0.0   0      0.0   0.0   0.0   989       989     874      4      1619     8     
2025       15:41:12  CKPTINTVL  4922:0x4891018    0.1   0.0   0.0   0      0.0   0.0   0.0   873       873     778      4      1709     9     
2026       15:44:14  CKPTINTVL  4922:0x4e18018    0.2   0.1   0.0   0      0.0   0.0   0.0   1400      1400    818      4      1415     7     
2027       15:47:17  CKPTINTVL  4922:0x55c719c    0.1   0.0   0.0   0      0.0   0.0   0.0   741       741     725      3      1967     10    
2028       15:50:19  CKPTINTVL  4922:0x5acf018    0.3   0.1   0.0   0      0.0   0.0   0.0   3806      3806    641      3      1288     7     
2029       15:53:22  CKPTINTVL  4923:0xb5018      0.2   0.0   0.0   0      0.0   0.0   0.0   907       907     792      4      1935     10    
2030       15:56:25  CKPTINTVL  4923:0x993018     0.1   0.0   0.0   0      0.0   0.0   0.0   907       907     906      4      2270     12    
2031       15:59:27  CKPTINTVL  4923:0xf4d018     0.1   0.0   0.0   0      0.0   0.0   0.0   917       917     755      4      1466     8     
2032       16:02:32  CKPTINTVL  4923:0x14fc018    2.6   2.5   0.0   0      0.0   0.0   0.0   988       399     857      4      1457     7     
2033       16:05:34  CKPTINTVL  4923:0x1b90018    0.2   0.1   0.0   1      0.0   0.0   0.0   963       963     769      4      1685     9     
2034       16:08:37  CKPTINTVL  4923:0x1dc2018    0.2   0.0   0.0   0      0.0   0.0   0.0   715       715     516      2      562      3     
2035       16:13:33  CKPTINTVL  4923:0x1de6018    114.2 114.2 0.0   0      0.0   0.0   0.0   252       2       241      1      36       0     
2036       16:15:04  CKPTINTVL  4923:0x225a018    0.2   0.1   0.0   0      0.0   0.0   0.0   739       739     421      2      1140     5     
2037       16:18:07  CKPTINTVL  4923:0x25e6018    0.2   0.0   0.0   0      0.0   0.0   0.0   1004      1004    732      4      908      4     

Max Plog       Max Llog       Max Dskflush   Avg Dskflush   Avg Dirty      Blocked      
pages/sec      pages/sec      Time           pages/sec      pages/sec      Time         
200            200            114            732            1              0            



Вот чем он интересно занимался до 16:13:33?! Есть в логах все снимки команд с интервалом 5 минут до и после. Команды onstat -R не было еще до этого - добавил сейчас.

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
-------------------------------------------------------------- 
onstat -R 
-------------------------------------------------------------- 

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 02:00:42 -- 542208 Kbytes

Buffer pool page size: 4096

8 buffer LRU queue pairs              priority levels
# f/m   pair total     % of    length       LOW      HIGH
 0 F       6249      99.2%     6202       5187       1015
 1 m                  0.8%       47         17         30
 2 f       6251      99.1%     6194       5179       1015
 3 m                  0.9%       57         12         45
 4 f       6249      99.2%     6202       5187       1015
 5 m                  0.8%       47         18         29
 6 f       6251      98.9%     6183       5168       1015
 7 m                  1.1%       68         23         45
 8 f       6250      99.2%     6203       5188       1015
 9 m                  0.8%       47         17         30
10 f       6250      99.0%     6189       5174       1015
11 m                  1.0%       61         24         37
12 f       6250      98.9%     6184       5169       1015
13 m                  1.1%       66         21         45
14 f       6250      99.1%     6193       5178       1015
15 m                  0.9%       57         18         39
450 dirty, 50000 queued, 50000 total, 65536 hash buckets, 4096 buffer size
start clean at  40.000% (of pair total) dirty, or 2500 buffs dirty, stop at
  30.000%


Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
-------------------------------------------------------------- 
onstat -R 
-------------------------------------------------------------- 

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 02:02:28 -- 542208 Kbytes

Buffer pool page size: 4096

8 buffer LRU queue pairs              priority levels
# f/m   pair total     % of    length       LOW      HIGH
 0 f       6251      99.7%     6235       5220       1015
 1 m                  0.3%       16         10          6
 2 f       6250      99.8%     6240       5225       1015
 3 m                  0.2%       10          3          7
 4 f       6250      99.8%     6237       5222       1015
 5 m                  0.2%       13          4          9
 6 F       6251      99.7%     6233       5218       1015
 7 m                  0.3%       18         10          8
 8 f       6248      99.8%     6234       5219       1015
 9 m                  0.2%       14          4         10
10 f       6251      99.8%     6240       5225       1015
11 m                  0.2%       11          2          9
12 f       6250      99.7%     6230       5215       1015
13 m                  0.3%       20          6         14
14 f       6249      99.8%     6236       5221       1015
15 m                  0.2%       13          4          9
115 dirty, 50000 queued, 50000 total, 65536 hash buckets, 4096 buffer size
start clean at  40.000% (of pair total) dirty, or 2500 buffs dirty, stop at
  30.000%



А вот в логе ostat -m интересную ошибку заметили:
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
Message Log File: C:\INFORMIX11\ol_css2.log
16:05:34  Checkpoint Completed:  duration was 0 seconds.
16:05:34  Tue Jan 28 - loguniq 4923, logpos 0x1b90018, timestamp: 0x72daf793 Interval: 2033

16:05:34  Maximum server connections 33 
16:05:34  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 1, Plog used 769, Llog used 1685

16:08:37  Checkpoint Completed:  duration was 0 seconds.
16:08:37  Tue Jan 28 - loguniq 4923, logpos 0x1dc2018, timestamp: 0x72dba31d Interval: 2034

16:08:37  Maximum server connections 33 
16:08:37  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 516, Llog used 562

16:13:33  ASF Echo-Thread Server: asfcode = -25582: oserr = 0: errstr = : Network connection is broken.

16:13:33  Checkpoint Completed:  duration was 114 seconds.
16:13:33  Tue Jan 28 - loguniq 4923, logpos 0x1de6018, timestamp: 0x72dbc83f Interval: 2035

16:13:33  Maximum server connections 33 
16:13:33  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 241, Llog used 36
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38540812
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_toreroВот чем он интересно занимался до 16:13:33?!
Все ж показано. Чекпоионт длился 114.2 секунд, из них сброс буферного пула 114.2 секунд.
Причем количество сброшенных буферов меньше чем при обычной нагрузке - 252
Скорость сброса тоже резко ниже, чем обычно.
Ищите причину в дисковой подсистеме. Можно было бы посмотреть onstat -g ioq,
но смысла большого нет, у Вас всего два чанка.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38540826
Ikir
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
_toreroВот чем он интересно занимался до 16:13:33?!

Так понятно чем - отрабатывал чекпоинт.
2034 16:08:37 CKPTINTVL 4923:0x1dc2018 0.2 0.0 0.0 0 0.0 0.0 0.0 715 715 516 2 562 3
2035 16:13:33 CKPTINTVL 4923:0x1de6018 114.2 114.2 0.0 0 0.0 0.0 0.0 252 2 241 1 36 0

Чекпоинт 2035 у вас должен был быть в ~ 16.11.37 . Сервер честно начал его отрабатывать, грязных страниц немного - 252, НО скорость сброса упала до 2 страниц в секунду!!! Вот он и отрабатывал его почти 2 минуты.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38540860
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Я имел ввиду чем он занимался во время чекпоинта, что он длился так долго в сравнении с другими.

Ну или другими словами, кто виноват и что делать?

Пробовать съехать на другие сервера?

Есть другие системы, но под 11.50. Имеет смысл делать даунгрейд с 11.70 на 11.50 и проверить там? В 11.70 уже задействовали новые диалекты SQL, но при желании можно от них уйти.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38541261
bk0010
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
_toreroПробовать съехать на другие сервера?
Сначала попробуйте съехать на другой диск или на другое место на этом диске: возможно у вас есть бэдблоки. Попробуйте вынести Logical log и PhysLog в отдельные dbspace-ы. Попробуйте деинсталлировать антивирус (именно деинсталлировать: некоторые из них продолжают гадить и после отключения) или отключить программу shadow copy, если таковые есть на сервере. Наконец шаманский совет: дайте команду update statistics на рабочие БД, я сталкивался с тем, что после нее Informix переставал чудить. Это все гораздо быстрее, чем переход на новый сервер. Еще вариант: средствами VMWare сделайте виртуальный образ вашего сервера и пусть пользователи работают с ним, пока вы решаете проблемы с самим сервером. Потом ontape-ом все быстро перенесете.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38541335
С запозданием, но немного теории контроллеро-строения.

"Батарейка" у вас может быть

- или набором суперконденсаторов (в свежих моделях) и тогда оно или работает или не работает и его надо менять

- или аккумулятором и тогда цирк усложняется

Если аккумулятор реально сдох, то производительность будет постоянно низкой (ниже напишу почему).

Но контроллеры ныне умные и они переодически треннеруют аккумулятор специально разряжая его до минимума и заряжая обратно - и аккумулятору разминка и контроллер понимаем его реальный объем.

Так вот на время "треннировки" производительность тоже падает.

А падает она за счёт того, то при работающем аккумуляторе и правильной настройке контроллера (и даже каждого тома на нём) запись идёт в режите Write-Back - контроллер отчитывается ОС что данные записал, а сам их в кэш (для сохранности которого при пропаже питания и нужен аккумулятор) и на диски сбросит потом (несколько секунд спустя и более оптимальным образом).

Когда же на аккумулятор рассчитывать нельзя, контроллер автоматически на это время переходит в режим Write-Through - ответ о записи уйдёт в ОС только после реальной записи на диски (кэши самих дисков должены быть всегда выключены в любом случае !!!).

Вот от этого и бывает адская разница в производительности вообще и при больших записях в частности.

Но в картину не укладывается тем, что проблемы у вас часто - треннеровку батарей контроллеры (с которыми имею дело) производят где-то раз в месяц и это настраивается пользователям.

В целом стоит посмотреть логи контроллера на предмет треннировки батареи, патрульного чтения и проверки целостности рейда, тайм-аутов операций (контроллер при этом ещё считает диск живым хотя это тормозит работу системы).

Напишите что за контроллер и что за батарейка и какое точно сообщение было.

Напишите что в логах контроллера (при этом проверьте что время на контроллере синхронно с системы. а то часто оно там своей жизнью живёт).
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38541354
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
bk0010,
виртуальную машину уже подняли.

готовим переезд.
сначала протестируем - осмотримся.

потом перекинем на нее нагрузку.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38541363
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Яковлев Павел,

Контроллер
Smart Array P410i in Embedded Slot

Сервер покупался в 2011 году.

вот весь лог
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
HP ProLiant Integrated Management Log Viewer:  TSR_DB
Description,Class,Code,Severity,Count,Update Time,Initial Time
"Maintenance note: IML cleared through hpasmcli",Maintenance,2,Informational,1,19.03.2011 6:39,19.03.2011 6:39
"POST Error: 1794-Slot X Drive Array - Array Accelerator Battery is charging. The Array Accelerator Cache will be enabled once the battery has been charged. No action is required.",POST Messages,1,Caution,1,19.03.2011 14:33,19.03.2011 14:33
"POST Error: 1785-Drive Array not Configured",POST Messages,1,Caution,1,28.01.2011 0:02,28.01.2011 0:02
"System Power Supply: General Failure (Power Supply 2)",Power Subsystem,1,Caution,1,Invalid: 0/0/0 0:00,Invalid: 0/0/0 0:00
"POST Error: 1615-Power Supply Failure or Power Supply Unplugged in Bay 2",POST Messages,1,Caution,2,05.06.2011 5:11,05.06.2011 5:08
"POST Error: 1794-Slot X Drive Array - Array Accelerator Battery is charging. The Array Accelerator Cache will be enabled once the battery has been charged. No action is required.",POST Messages,1,Caution,2,05.06.2011 5:11,05.06.2011 5:09
"System Power Supply: General Failure (Power Supply 2)",Power Subsystem,1,Caution,1,05.06.2011 5:11,05.06.2011 5:11
"POST Error: 1794-Slot X Drive Array - Array Accelerator Battery is charging. The Array Accelerator Cache will be enabled once the battery has been charged. No action is required.",POST Messages,1,Caution,1,23.09.2011 0:41,23.09.2011 0:41
"POST Error: 1729-Background Parity Initialization Not Yet Complete",POST Messages,1,Caution,2,12.11.2011 14:49,12.11.2011 14:43
"POST Error: 1729-Background Parity Initialization Not Yet Complete",POST Messages,1,Caution,1,12.11.2011 15:12,12.11.2011 15:12
"POST Error: 1794-Slot X Drive Array - Array Accelerator Battery is charging. The Array Accelerator Cache will be enabled once the battery has been charged. No action is required.",POST Messages,1,Caution,2,12.11.2011 16:14,12.11.2011 16:03
"POST Error: 1794-Slot X Drive Array - Array Accelerator Battery is charging. The Array Accelerator Cache will be enabled once the battery has been charged. No action is required.",POST Messages,1,Caution,1,14.11.2011 13:05,14.11.2011 13:05
"POST Error: 1794-Slot X Drive Array - Array Accelerator Battery is charging. The Array Accelerator Cache will be enabled once the battery has been charged. No action is required.",POST Messages,1,Caution,1,16.11.2011 8:36,16.11.2011 8:36
"POST Error: 1794-Slot X Drive Array - Array Accelerator Battery is charging. The Array Accelerator Cache will be enabled once the battery has been charged. No action is required.",POST Messages,1,Caution,1,14.03.2012 7:04,14.03.2012 7:04
"POST Error: 1794-Slot X Drive Array - Array Accelerator Battery is charging. The Array Accelerator Cache will be enabled once the battery has been charged. No action is required.",POST Messages,1,Caution,1,17.12.2012 7:58,17.12.2012 7:58
"POST Error: 1794-Slot X Drive Array - Array Accelerator Battery is charging. The Array Accelerator Cache will be enabled once the battery has been charged. No action is required.",POST Messages,1,Caution,1,18.02.2013 9:09,18.02.2013 9:09
"POST Error: 1794-Slot X Drive Array - Array Accelerator Battery is charging. The Array Accelerator Cache will be enabled once the battery has been charged. No action is required.",POST Messages,1,Caution,1,06.04.2013 6:30,06.04.2013 6:30
"POST Error: 1792-Drive Array Reports Valid Data Found in Array Accelerator",POST Messages,1,Caution,1,24.07.2013 16:25,24.07.2013 16:25
"System Power Supply: General Failure (Power Supply 2)",Power Subsystem,1,Repaired,1,01.08.2013 9:29,01.08.2013 9:29
"System Power Supplies Not Redundant",Power Subsystem,6,Repaired,1,01.08.2013 9:29,01.08.2013 9:29
"System Power Supply: General Failure (Power Supply 1)",Power Subsystem,1,Repaired,1,01.08.2013 9:30,01.08.2013 9:30
"System Power Supplies Not Redundant",Power Subsystem,6,Repaired,1,01.08.2013 9:30,01.08.2013 9:30
"POST Error: 1794-Slot X Drive Array - Array Accelerator Battery is charging. The Array Accelerator Cache will be enabled once the battery has been charged. No action is required.",POST Messages,1,Caution,1,25.12.2013 9:57,25.12.2013 9:57
"POST Error: 1794-Slot X Drive Array - Array Accelerator Battery is charging. The Array Accelerator Cache will be enabled once the battery has been charged. No action is required.",POST Messages,1,Caution,1,09.01.2014 9:58,09.01.2014 9:58
"POST Error: 1794-Slot X Drive Array - Array Accelerator Battery is charging. The Array Accelerator Cache will be enabled once the battery has been charged. No action is required.",POST Messages,1,Caution,1,09.01.2014 10:14,09.01.2014 10:14
"POST Error: 1794-Slot X Drive Array - Array Accelerator Battery is charging. The Array Accelerator Cache will be enabled once the battery has been charged. No action is required.",POST Messages,1,Caution,1,10.01.2014 14:55,10.01.2014 14:55
"POST Error: 1794-Slot X Drive Array - Array Accelerator Battery is charging. The Array Accelerator Cache will be enabled once the battery has been charged. No action is required.",POST Messages,1,Caution,1,13.01.2014 9:37,13.01.2014 9:37
"POST Error: 1794-Slot X Drive Array - Array Accelerator Battery is charging. The Array Accelerator Cache will be enabled once the battery has been charged. No action is required.",POST Messages,1,Caution,1,15.01.2014 8:36,15.01.2014 8:36
"POST Error: 1794-Slot X Drive Array - Array Accelerator Battery is charging. The Array Accelerator Cache will be enabled once the battery has been charged. No action is required.",POST Messages,1,Caution,1,15.01.2014 11:34,15.01.2014 11:34
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38541672
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Сейчас в 10:48 опять замер чекпоинт
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
29.01.2014 10:48:08.56 
-------------------------------------------------------------- 
onstat -g ckp 
-------------------------------------------------------------- 

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 20:32:15 -- 542208 Kbytes

AUTO_CKPTS=On   RTO_SERVER_RESTART=Off   

                                                                    Critical Sections                          Physical Log    Logical Log    
           Clock                                  Total Flush Block #      Ckpt  Wait  Long  # Dirty   Dskflu  Total    Avg    Total    Avg   
Interval   Time      Trigger    LSN               Time  Time  Time  Waits  Time  Time  Time  Buffers   /Sec    Pages    /Sec   Pages    /Sec  
2184       09:45:11  CKPTINTVL  4926:0x1896f34    0.1   0.1   0.0   0      0.0   0.0   0.0   1197      1197    923      5      1472     8     
2185       09:48:14  CKPTINTVL  4926:0x207f018    0.4   0.1   0.0   1      0.0   0.0   0.0   2590      2590    808      4      2029     11    
2186       09:51:16  CKPTINTVL  4926:0x26ed018    0.2   0.1   0.0   0      0.0   0.0   0.0   1195      1195    929      5      1646     9     
2187       09:54:19  CKPTINTVL  4926:0x2f847d0    0.5   0.2   0.0   1      0.0   0.1   0.1   1725      1725    1227     6      2202     12    
2188       09:57:21  CKPTINTVL  4926:0x3679924    0.2   0.1   0.0   0      0.0   0.0   0.0   1140      1140    914      5      1781     9     
2189       10:00:24  CKPTINTVL  4926:0x3dca0bc    0.1   0.0   0.0   0      0.0   0.0   0.0   1035      1035    911      4      1873     10    
2190       10:03:26  CKPTINTVL  4926:0x4141018    0.2   0.0   0.0   0      0.0   0.0   0.0   703       703     634      3      887      4     
2191       10:06:29  CKPTINTVL  4926:0x4528018    0.2   0.0   0.0   1      0.0   0.1   0.1   621       621     492      2      1009     5     
2192       10:09:31  CKPTINTVL  4926:0x4a1e018    0.0   0.0   0.0   0      0.0   0.0   0.0   918       918     661      3      1270     6     
2193       10:12:34  CKPTINTVL  4926:0x5060018    0.1   0.0   0.0   1      0.0   0.0   0.0   869       869     742      4      1615     8     
2194       10:15:36  CKPTINTVL  4926:0x561a018    0.2   0.1   0.0   1      0.0   0.0   0.0   931       931     677      3      1467     8     
2195       10:18:39  CKPTINTVL  4926:0x5dc1018    0.2   0.0   0.0   0      0.0   0.0   0.0   1188      1188    876      4      1959     10    
2196       10:21:41  CKPTINTVL  4927:0x12c630     0.4   0.1   0.0   1      0.0   0.1   0.1   640       640     579      3      1301     7     
2197       10:24:44  CKPTINTVL  4927:0x790018     0.2   0.0   0.0   1      0.0   0.0   0.0   791       791     611      3      1646     8     
2198       10:27:46  CKPTINTVL  4927:0xec70f8     0.2   0.0   0.0   0      0.0   0.0   0.0   1366      1366    1002     5      1847     10    
2199       10:30:49  CKPTINTVL  4927:0x1833018    0.2   0.1   0.0   0      0.0   0.0   0.0   1141      1141    966      5      2412     13    
2200       10:33:51  CKPTINTVL  4927:0x211beb0    0.2   0.1   0.0   1      0.0   0.0   0.0   1282      1282    1013     5      2282     12    
2201       10:36:54  CKPTINTVL  4927:0x2653018    0.1   0.0   0.0   0      0.0   0.0   0.0   819       819     661      3      1336     7     
2202       10:45:55  CKPTINTVL  4927:0x2fdc018    359.1 359.0 0.0   0      0.0   0.0   0.0   1874      5       1315     7      2464     13    
2203       10:46:26  CKPTINTVL  4927:0x3084018    0.1   0.0   0.0   0      0.0   0.0   0.0   266       266     199      0      168      0     

Max Plog       Max Llog       Max Dskflush   Avg Dskflush   Avg Dirty      Blocked      
pages/sec      pages/sec      Time           pages/sec      pages/sec      Time         
200            281            359            491            0              0            



В CONFIG стоит сейчас
BUFFERPOOL default,buffers=50000,lrus=8,lru_min_dirty=30.00,lru_max_dirty=40.00
BUFFERPOOL size=4K,buffers=50000,lrus=8,lru_min_dirty=30.00,lru_max_dirty=40.00

Хотим поставить
BUFFERPOOL default,buffers=50000,lrus=8,lru_min_dirty=10.00,lru_max_dirty=15.00
BUFFERPOOL size=4K,buffers=50000,lrus=8,lru_min_dirty=10.00,lru_max_dirty=15.00

Потому что это пока единственный параметр, который уменьшил время чекпоинта и позволил системе оставаться на ногах.

И опять у нас непонимание, почему ни с того ни с сего возникли проблемы именно в этом месте. До этого сегодня были и более объемные чекпоинты. И все это на фоне успешно работающего второго инстанса.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38541758
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torero,

Вам уже несколько раз объясняли, что момент зависания объясняется слишком медленным сбросом буферного пула на диск во время выполнения контрольной точки.
Вариантов два:
1. Уменьшить объем работы, другими словами уменьшить количество грязных страниц. Это достигается не только уменьшением lru_max_dirty/lru_min_dirty но и другими методами, можно погуглить на тему "уменьшение времени контрольной точки".
2. Более кардинальный способ, разобраться с дисковой подсистемой, почему запись на диск временами у Вас идет столь медленно.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38541937
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
victor16,

последний вопрос был уже скорее риторический.
Сейчас чанки перемещены на другой логический диск, то есть в другую физическую часть диска - нужно в этих условиях понаблюдать.

Оба предложения понятны и очевидны, но
1) Количество грязных страниц в длинном чекпоинте не сильно отличается и даже меньше некоторых чекпоинтов ранее. Тут происходит именно резкое снижение скорости сброса на диск. Понятно, что чем больше грязных страниц, тем дольше будет чекпоинт, но ведь не должна скорость сброса на диск зависеть от числа грязных буферов. Я ведь правильно понимаю?
2) С контроллером готовимся разобраться глобально - уехать на виртуалку. Но уже сейчас тоже противоречие: с одной стороны резкое падение скорости сброса грязных страниц, которое длится 2-3 минуты (это сейчас, а раньше часы). То есть предположение, что контроллер виноват. Тогда это общесистемная проблема всего хоста и вся работа должна быть парализована? Но второй инстанс, на котором работает другая клиентская программа, в этот момент полностью доступен и потери производительности замечено не было. И смотрели дисковую активность в журнале Windows на oninit.exe - она нулевая.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38542031
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
перенос на другой диск не помог. Уже 13:52, а чекпоинт ожидался в 13:21

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
29.01.2014 13:50:00.05 
-------------------------------------------------------------- 
onstat -g ckp 
-------------------------------------------------------------- 

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line (CKPT INP) -- Up 01:17:22 -- 542208 Kbytes

AUTO_CKPTS=On   RTO_SERVER_RESTART=Off   

                                                                    Critical Sections                          Physical Log    Logical Log    
           Clock                                  Total Flush Block #      Ckpt  Wait  Long  # Dirty   Dskflu  Total    Avg    Total    Avg   
Interval   Time      Trigger    LSN               Time  Time  Time  Waits  Time  Time  Time  Buffers   /Sec    Pages    /Sec   Pages    /Sec  
2231       12:32:49  Startup    4928:0x3c5c0c0    0.9   0.8   0.0   0      0.0   0.0   0.0   14        14      12       0      1        0     
2232       12:35:51  CKPTINTVL  4928:0x3d08018    0.1   0.0   0.0   0      0.0   0.0   0.0   57        57      26       0      172      0     
2233       12:38:53  CKPTINTVL  4928:0x3e60018    0.1   0.0   0.0   0      0.0   0.0   0.0   230       230     169      0      344      1     
2234       12:41:56  CKPTINTVL  4928:0x3ee7018    0.1   0.1   0.0   0      0.0   0.0   0.0   3031      3031    96       0      135      0     
2235       12:44:58  CKPTINTVL  4928:0x4230018    0.0   0.0   0.0   0      0.0   0.0   0.0   270       270     224      1      841      4     
2236       12:48:01  CKPTINTVL  4928:0x43d4018    0.1   0.0   0.0   0      0.0   0.0   0.0   305       305     206      1      420      2     
2237       12:51:04  CKPTINTVL  4928:0x4796018    0.1   0.0   0.0   1      0.0   0.1   0.1   257       257     155      0      963      5     
2238       12:54:06  CKPTINTVL  4928:0x4b23018    0.1   0.0   0.0   0      0.0   0.0   0.0   390       390     240      1      909      4     
2239       12:57:09  CKPTINTVL  4928:0x4c70018    0.1   0.0   0.0   0      0.0   0.0   0.0   349       349     195      1      333      1     
2240       13:00:11  CKPTINTVL  4928:0x4f85018    0.1   0.0   0.0   0      0.0   0.0   0.0   299       299     226      1      789      4     
2241       13:03:14  CKPTINTVL  4928:0x521b018    0.1   0.1   0.0   0      0.0   0.0   0.0   455       455     338      1      662      3     
2242       13:06:16  CKPTINTVL  4928:0x53ad018    0.1   0.0   0.0   0      0.0   0.0   0.0   540       540     383      2      402      2     
2243       13:09:19  CKPTINTVL  4928:0x5734018    0.0   0.0   0.0   0      0.0   0.0   0.0   665       665     540      2      903      4     
2244       13:12:21  CKPTINTVL  4928:0x5c4f018    0.2   0.1   0.0   1      0.0   0.1   0.1   715       715     657      3      1318     7     
2245       13:15:24  CKPTINTVL  4928:0x60a0018    0.1   0.0   0.0   0      0.0   0.0   0.0   2364      2364    700      3      1105     6     
2246       13:18:26  CKPTINTVL  4929:0x2ef018     0.1   0.0   0.0   0      0.0   0.0   0.0   532       532     472      2      1015     5     

Max Plog       Max Llog       Max Dskflush   Avg Dskflush   Avg Dirty      Blocked      
pages/sec      pages/sec      Time           pages/sec      pages/sec      Time         
200            200            1              650            1              0            

-------------------------------------------------------------- 
onparams 
-------------------------------------------------------------- 
shared memory not initialized for INFORMIXSERVER 'ol_css2'



Код: sql
1.
2.
3.
4.
5.
Chunks
address          chunk/dbs     offset     size       free       bpages     flags pathname
00000000916871E0 1      1      0          5242880    2902208               PO-B-D C:\IFMXDATA\ol_css2\rootdbs_dat.000
00000000917B2E00 2      2      0          2621440    2621229               PO-B-D C:\IFMXDATA\ol_css2\tempdbs_dat.000
 2 active, 32766 maximum
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38542094
Ikir
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
_torero,

А вот эти сообщения вас не смущают? причем дважды в течении дня
Код: html
1.
2.
"POST Error: 1794-Slot X Drive Array - Array Accelerator Battery is charging. The Array Accelerator Cache will be enabled once the battery has been charged. No action is required.",POST Messages,1,Caution,1,15.01.2014 8:36,15.01.2014 8:36
"POST Error: 1794-Slot X Drive Array - Array Accelerator Battery is charging. The Array Accelerator Cache will be enabled once the battery has been charged. No action is required.",POST Messages,1,Caution,1,15.01.2014 11:34,15.01.2014 11:34
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38542113
Фотография aist-psk
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
пока батарейку не замените , кеширование на запись не будет
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38542464
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torerobk0010,

Хронология событий:
1. После НГ в первый день нас завалили звонками - не работает.
2. Разбирались несколько дней - таких симптомов раньше не видели. Только на второй-третий день обратили внимание на низкую дисковую скорость.
3. В утилите контроллера было сообщение "не работает аккумулятор контроллера". Поменяли с другой идентичной железки на заранее исправную. Ошибка не исчезла. В то же время на втором ошибка не появилась.
4. Поменяли контроллеры местами - ошибка исчезла на обоих серверах.
5. Выгрузили БД.
6. Переинициализировали инстанс, тк на фоне непонимания происходящего было недоверие в корректности содержимого чанков.
7. Сейчас вторая неделя поиска причин.
8. Параллельно на этой же машине создан второй инстанс для другой системы. С ним проблем нет и близко таких. Пользовательская нагрузка на эту систему на порядок ниже. Настройки config для обеих систем одинаковые. Сейчас немного разошлись, но не принципиально.



15.01.2014 проблема с контроллером решена заменой на аналогичный. В логах больше ничего не появилось
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38542877
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Проблема найдена. Всем спасибо за участие в ее решении.
На фоне явных проблем с железом и попыток исключить эту составляющую нами не прекращались поиски проблем в самой программе. Найден запрос, который валит сервер:
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
102.
103.
104.
105.
106.
107.
108.
109.
110.
111.
112.
113.
114.
115.
116.
117.
118.
119.
120.
121.
122.
123.
124.
125.
126.
127.
128.
129.
130.
131.
132.
133.
134.
135.
136.
137.
138.
139.
140.
141.
142.
143.
144.
145.
146.
147.
148.
149.
150.
151.
152.
153.
154.
155.
156.
157.
158.
159.
160.
161.
162.
163.
164.
165.
166.
167.
168.
169.
170.
171.
172.
173.
174.
175.
176.
177.
178.
179.
180.
181.
182.
183.
184.
185.
186.
  SELECT   Extent3.css_id AS css_id,   Extent2.rehab_service_id AS
    rehab_service_id,   Extent8.rehab_group_id AS rehab_group_id,  
    Extent9.rehab_block_id AS rehab_block_id,   Extent1.ipr_service_fact_id AS
    ipr_service_fact_id,   Extent1.performed_by AS performed_by,   Extent3.fam
    AS fam,   Extent3.name AS name,   Extent3.fname AS fname,   Extent3.phone
    AS phone,   Extent4.css_name AS css_name,   Extent5.department AS
    department,   Extent6.village AS village,   Extent2.ipr_service_plan_id AS
    ipr_service_plan_id,   CAST('t' AS boolean) AS C1,   Extent7.rehab_service
    AS rehab_service,    CAST(Extent1.service_date AS datetime year to
    fraction(5)) AS C2,   Extent8.rehab_group AS rehab_group,  
    Extent9.rehab_block AS rehab_block,   Extent1.assistance AS assistance,  
    Extent10.appointment AS appointment  FROM          
    "informix".sop_ipr_service_fact AS Extent1  INNER JOIN
    "informix".sop_ipr_service_plan AS Extent2 ON Extent1.ipr_service_plan_id
    = Extent2.ipr_service_plan_id  INNER JOIN "informix".cs_user_ AS Extent3
    ON Extent1.performed_by = Extent3.user_id  INNER JOIN "informix".css_ AS
    Extent4 ON Extent3.css_id = Extent4.css_id  INNER JOIN
    "informix".department AS Extent5 ON Extent4.dept_id = Extent5.dept_id 
    INNER JOIN "informix".village AS Extent6 ON Extent4.vill_id =
    Extent6.vill_id  INNER JOIN (SELECT       
    sop_d_rehab_service.rehab_service_id AS rehab_service_id,       
    sop_d_rehab_service.rehab_group_id AS rehab_group_id,       
    sop_d_rehab_service.rehab_service AS rehab_service,       
    sop_d_rehab_service.ordering AS ordering       FROM
    "informix".sop_d_rehab_service AS sop_d_rehab_service) AS Extent7 ON
    Extent2.rehab_service_id = Extent7.rehab_service_id  INNER JOIN (SELECT   
        sop_d_rehab_group.rehab_group_id AS rehab_group_id,       
    sop_d_rehab_group.rehab_block_id AS rehab_block_id,       
    sop_d_rehab_group.rehab_group AS rehab_group,       
    sop_d_rehab_group.ordering AS ordering       FROM
    "informix".sop_d_rehab_group AS sop_d_rehab_group) AS Extent8 ON
    Extent7.rehab_group_id = Extent8.rehab_group_id  INNER JOIN (SELECT       
    sop_d_rehab_block.rehab_block_id AS rehab_block_id,       
    sop_d_rehab_block.rehab_block AS rehab_block,       
    sop_d_rehab_block.ordering AS ordering       FROM
    "informix".sop_d_rehab_block AS sop_d_rehab_block) AS Extent9 ON
    Extent8.rehab_block_id = Extent9.rehab_block_id  INNER JOIN (SELECT       
    cs_d_appointment.appointment_id AS appointment_id,       
    cs_d_appointment.appointment AS appointment       FROM
    "informix".cs_d_appointment AS cs_d_appointment) AS Extent10 ON
    Extent3.appointment_dict_id = Extent10.appointment_id  INNER JOIN  (SELECT
       UnionAll34.C1 AS C1   FROM  (SELECT     UnionAll33.C1 AS C1    FROM 
    (SELECT      UnionAll32.C1 AS C1     FROM  (SELECT       UnionAll31.C1 AS
    C1      FROM  (SELECT        UnionAll30.C1 AS C1       FROM  (SELECT      
      UnionAll29.C1 AS C1        FROM  (SELECT          UnionAll28.C1 AS C1   
         FROM  (SELECT           UnionAll27.C1 AS C1          FROM  (SELECT   
            UnionAll26.C1 AS C1           FROM  (SELECT            
    UnionAll25.C1 AS C1            FROM  (SELECT              UnionAll24.C1 AS
    C1             FROM  (SELECT               UnionAll23.C1 AS C1            
     FROM  (SELECT                UnionAll22.C1 AS C1               FROM 
    (SELECT                 UnionAll21.C1 AS C1                FROM  (SELECT  
                   UnionAll20.C1 AS C1                 FROM  (SELECT          
            UnionAll19.C1 AS C1                  FROM  (SELECT                
       UnionAll18.C1 AS C1                   FROM  (SELECT                    
    UnionAll17.C1 AS C1                    FROM  (SELECT                     
    UnionAll16.C1 AS C1                     FROM  (SELECT                     
     UnionAll15.C1 AS C1                      FROM  (SELECT                   
        UnionAll14.C1 AS C1                       FROM  (SELECT               
             UnionAll13.C1 AS C1                        FROM  (SELECT         
                    UnionAll12.C1 AS C1                         FROM  (SELECT 
                             UnionAll11.C1 AS C1                          FROM
     (SELECT                            UnionAll10.C1 AS C1                   
           FROM  (SELECT                             UnionAll9.C1 AS C1       
                        FROM  (SELECT                             
    UnionAll8.C1 AS C1                             FROM  (SELECT              
                    UnionAll7.C1 AS C1                              FROM 
    (SELECT                                UnionAll6.C1 AS C1                 
                 FROM  (SELECT                                 UnionAll5.C1 AS
    C1                                FROM  (SELECT                           
          UnionAll4.C1 AS C1                                 FROM  (SELECT    
                                  UnionAll3.C1 AS C1                          
           FROM  (SELECT                                    UnionAll2.C1 AS C1
                                      FROM  (SELECT                           
             UnionAll1.C1 AS C1                                    FROM 
    (SELECT                                      340000002048 AS C1           
                             FROM  ( SELECT CAST(1 AS int) AS X FROM
    INFORMIX.SYSTABLES WHERE TABID=1 ) AS SingleRowTable1                     
                  UNION ALL                                     SELECT        
                                 340000002054 AS C1                           
             FROM  ( SELECT CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE
    TABID=1 ) AS SingleRowTable2) AS UnionAll1                                
      UNION ALL                                    SELECT                     
                   340000002059 AS C1                                    FROM 
    ( SELECT CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE TABID=1 ) AS
    SingleRowTable3) AS UnionAll2                                  UNION ALL  
                                    SELECT                                   
    340000002063 AS C1                                   FROM  ( SELECT CAST(1
    AS int) AS X FROM INFORMIX.SYSTABLES WHERE TABID=1 ) AS SingleRowTable4)
    AS UnionAll3                                 UNION ALL                    
                 SELECT                                   340000002089 AS C1  
                                   FROM  ( SELECT CAST(1 AS int) AS X FROM
    INFORMIX.SYSTABLES WHERE TABID=1 ) AS SingleRowTable5) AS UnionAll4       
                            UNION ALL                                 SELECT  
                                   340000002171 AS C1                         
           FROM  ( SELECT CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE
    TABID=1 ) AS SingleRowTable6) AS UnionAll5                              
    UNION ALL                                SELECT                           
         340000002146 AS C1                                FROM  ( SELECT
    CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE TABID=1 ) AS
    SingleRowTable7) AS UnionAll6                              UNION ALL      
                            SELECT                                340000002153
    AS C1                               FROM  ( SELECT CAST(1 AS int) AS X
    FROM INFORMIX.SYSTABLES WHERE TABID=1 ) AS SingleRowTable8) AS UnionAll7  
                              UNION ALL                              SELECT   
                               340000002604 AS C1                             
    FROM  ( SELECT CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE TABID=1 )
    AS SingleRowTable9) AS UnionAll8                            UNION ALL     
                           SELECT                              340000002605 AS
    C1                             FROM  ( SELECT CAST(1 AS int) AS X FROM
    INFORMIX.SYSTABLES WHERE TABID=1 ) AS SingleRowTable10) AS UnionAll9      
                        UNION ALL                            SELECT           
                     340000017960 AS C1                            FROM  (
    SELECT CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE TABID=1 ) AS
    SingleRowTable11) AS UnionAll10                          UNION ALL        
                      SELECT                            340000002151 AS C1    
                          FROM  ( SELECT CAST(1 AS int) AS X FROM
    INFORMIX.SYSTABLES WHERE TABID=1 ) AS SingleRowTable12) AS UnionAll11     
                       UNION ALL                          SELECT              
                340000001062 AS C1                          FROM  ( SELECT
    CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE TABID=1 ) AS
    SingleRowTable13) AS UnionAll12                        UNION ALL          
                  SELECT                          340000002607 AS C1          
                  FROM  ( SELECT CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES
    WHERE TABID=1 ) AS SingleRowTable14) AS UnionAll13                      
    UNION ALL                        SELECT                        
    340000017953 AS C1                        FROM  ( SELECT CAST(1 AS int) AS
    X FROM INFORMIX.SYSTABLES WHERE TABID=1 ) AS SingleRowTable15) AS
    UnionAll14                      UNION ALL                       SELECT    
                       340000017956 AS C1                       FROM  ( SELECT
    CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE TABID=1 ) AS
    SingleRowTable16) AS UnionAll15                     UNION ALL             
            SELECT                       340000002589 AS C1                   
      FROM  ( SELECT CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE TABID=1
    ) AS SingleRowTable17) AS UnionAll16                    UNION ALL         
               SELECT                      340000002091 AS C1                 
       FROM  ( SELECT CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE
    TABID=1 ) AS SingleRowTable18) AS UnionAll17                   UNION ALL  
                     SELECT                     340000002096 AS C1            
           FROM  ( SELECT CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE
    TABID=1 ) AS SingleRowTable19) AS UnionAll18                  UNION ALL   
                   SELECT                    340000002099 AS C1               
       FROM  ( SELECT CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE
    TABID=1 ) AS SingleRowTable20) AS UnionAll19                 UNION ALL    
                 SELECT                   340000002175 AS C1                 
    FROM  ( SELECT CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE TABID=1 )
    AS SingleRowTable21) AS UnionAll20                UNION ALL               
     SELECT                  340000017952 AS C1                 FROM  ( SELECT
    CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE TABID=1 ) AS
    SingleRowTable22) AS UnionAll21               UNION ALL               
    SELECT                 340000017957 AS C1                FROM  ( SELECT
    CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE TABID=1 ) AS
    SingleRowTable23) AS UnionAll22              UNION ALL              
    SELECT                340000017955 AS C1               FROM  ( SELECT
    CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE TABID=1 ) AS
    SingleRowTable24) AS UnionAll23             UNION ALL              SELECT 
                 340000002053 AS C1              FROM  ( SELECT CAST(1 AS int)
    AS X FROM INFORMIX.SYSTABLES WHERE TABID=1 ) AS SingleRowTable25) AS
    UnionAll24            UNION ALL             SELECT             
    340000002056 AS C1             FROM  ( SELECT CAST(1 AS int) AS X FROM
    INFORMIX.SYSTABLES WHERE TABID=1 ) AS SingleRowTable26) AS UnionAll25     
         UNION ALL            SELECT             340000002147 AS C1           
    FROM  ( SELECT CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE TABID=1 )
    AS SingleRowTable27) AS UnionAll26          UNION ALL           SELECT    
           340000002150 AS C1           FROM  ( SELECT CAST(1 AS int) AS X
    FROM INFORMIX.SYSTABLES WHERE TABID=1 ) AS SingleRowTable28) AS UnionAll27
            UNION ALL          SELECT           340000011667 AS C1         
    FROM  ( SELECT CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE TABID=1 )
    AS SingleRowTable29) AS UnionAll28        UNION ALL         SELECT        
     340000011636 AS C1         FROM  ( SELECT CAST(1 AS int) AS X FROM
    INFORMIX.SYSTABLES WHERE TABID=1 ) AS SingleRowTable30) AS UnionAll29     
     UNION ALL        SELECT         340000017958 AS C1        FROM  ( SELECT
    CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE TABID=1 ) AS
    SingleRowTable31) AS UnionAll30      UNION ALL       SELECT       
    340000017959 AS C1       FROM  ( SELECT CAST(1 AS int) AS X FROM
    INFORMIX.SYSTABLES WHERE TABID=1 ) AS SingleRowTable32) AS UnionAll31    
    UNION ALL      SELECT       340000020810 AS C1      FROM  ( SELECT CAST(1
    AS int) AS X FROM INFORMIX.SYSTABLES WHERE TABID=1 ) AS SingleRowTable33)
    AS UnionAll32    UNION ALL     SELECT      340000000482 AS C1     FROM  (
    SELECT CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE TABID=1 ) AS
    SingleRowTable34) AS UnionAll33   UNION ALL    SELECT     340000017961 AS
    C1    FROM  ( SELECT CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE
    TABID=1 ) AS SingleRowTable35) AS UnionAll34  UNION ALL   SELECT   
    340000002061 AS C1   FROM  ( SELECT CAST(1 AS int) AS X FROM
    INFORMIX.SYSTABLES WHERE TABID=1 ) AS SingleRowTable36) AS UnionAll35 ON
    Extent1.ipr_service_plan_id = UnionAll35.C1  WHERE
    ((Extent1.ipr_service_fact_id = 0) AND (0 > 0)) OR (0 = 0)



Этот запрос сгенерирован ORM EntityFramework из linq
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
                var res =
                    (
                        from f in entitiesFactory.sopDbContext.sop_ipr_service_fact
                        join p in entitiesFactory.sopDbContext.sop_ipr_service_plan on f.ipr_service_plan_id equals p.ipr_service_plan_id
                        join u in entitiesFactory.sopDbContext.cs_user_ on f.performed_by equals u.user_id
                        join css in entitiesFactory.sopDbContext.css_ on u.css_id equals css.css_id
                        join dep in entitiesFactory.sopDbContext.department on css.dept_id equals dep.dept_id
                        join vill in entitiesFactory.sopDbContext.village on css.vill_id equals vill.vill_id
                        join service_ in entitiesFactory.sopDbContext.sop_d_rehab_service on p.rehab_service_id equals service_.rehab_service_id
                        join group_ in entitiesFactory.sopDbContext.sop_d_rehab_group on service_.rehab_group_id equals group_.rehab_group_id
                        join block_ in entitiesFactory.sopDbContext.sop_d_rehab_block on group_.rehab_block_id equals block_.rehab_block_id
                        join appointment in entitiesFactory.sopDbContext.cs_d_appointment on u.appointment_dict_id equals appointment.appointment_id
                        join pln in plans on f.ipr_service_plan_id equals pln.Value
                        where
                            (f.ipr_service_fact_id == 0 && request.keyID > 0 || request.keyID == 0)



Помимо объектов из контекста базы данных в join соединении участвует список ключей plans.
ORM его преобразовала в множество подзапросов к systables.
Причем чем больше мощность множества, тем больше подзапросов к systables.
После этого запроса сервер останавливается 10 минут. Умирает сразу.

Чекпоинт попал под внимание, тк он выполняется часто и первым попадал под зависание.
Свою часть темы закрываю.
За эти дни я и мои коллеги узнали что-то новое за более чем 15 лет работы с информиксом.
Было интересно. Еще раз спасибо!

ps. и все таки странно, что informix позволил пользовательскому запросу так глубоко парализовать работу субд, что даже подключиться к БД в новой сессии невозможно.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38542878
Однако я угадал :)

_torero15.01.2014 проблема с контроллером решена заменой на аналогичный. В логах больше ничего не появилось


Круть :) Но достаточно было только батарейку :)

Производительность вернулась ?

Надо заказывать новую батарейку, так как раз он так часто начал её заряжать, то каюк.

Вообще "батарейки" которые аккумуляторы имеют срок жизни всего 2-3 года. Я бы провёл переучёт и заменил все пожилые батарейки.

Не нашёл с ходу чей контроллер HP выдаёт за свой - наверняка LSI или Adaptec. Если напишите pci-id (lspci и lspci -n), то можно посмотреть чья батарейка вам подойдёт ибо "фирменная" от HP должна стоить дофига :)

И ещё немного про контроллеры - на случай когда вы готовы рискнуть целостностью данных в большинстве контроллеров есть настройка "не переключаться на Write-Through при отсутстивии батарейки". Но включать без совсем крайней нужны не стоит.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38542895
Фотография aist-psk
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
"ps. и все таки странно, что informix позволил пользовательскому запросу так глубоко парализовать работу субд, что даже подключиться к БД в новой сессии невозможно. "
ужас какой-то ! изучайте материальную часть , и не фиг пинать на зеркало , что фейсбук кривой.
у вас железо дохнет , субд не оптимизирован - а вы всё зеркало пинаете .
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38542897
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Яковлев Павел,
сначала меняли батарейку на заведомо исправную.
"неисправную" поставили на донора.
В результате на доноре "неисправная" стала нормальной.
А новая исправная тоже стала "неисправной".

Поменяли контроллеры между двумя одинаковыми серверами - ошибка везде исчезла.

Мы уже рекомендовали заказчику закупить в запас этих батареек. Серверам действительно уже третий год.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38542904
_toreroЯковлев Павел,
сначала меняли батарейку на заведомо исправную.
"неисправную" поставили на донора.
В результате на доноре "неисправная" стала нормальной.
А новая исправная тоже стала "неисправной".

Поменяли контроллеры между двумя одинаковыми серверами - ошибка везде исчезла.

опаааа так быть не должно, может и правда контроллер... или контакт отходит из-за микротрещин.... ну или барабашка...

А контроллер на базе чипа PMC-Sierra pm8011. Их продукцию ни разу не использовал.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38542905
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
aist-psk, почему сразу ужас.
во-первых, с железом проблем нет. была проблема с зарядкой батарейки. Сейчас не диагностируется. Различные тесты не выявили ни то что ошибок, даже предупреждений. Учитывая найденный проблемный запрос, версию о проблемах с железом можно полностью из рассмотрения убрать.

во-вторых, субд была оптимизирована достаточно, для конкретно этой задачи. ни с быстродействием, ни с обслуживанием, ни с надежностью проблем близко не было.

в-третьих, мы любим информикс и на него не пиняем.

мне было бы интереснее услышать от вас предположении, почему такой запрос привел к невозможности новых подключений.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38542910
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Яковлев Павел, мы между собой решили, что проблема контактов - окислились, запылились. За последние две недели проблем на обоих серверах нет.
Говорить о более серьезных проблемах пока оснований нет.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38542922
ildr
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_toreroЗа эти дни я и мои коллеги узнали что-то новое за более чем 15 лет работы с информиксом.
Было интересно. Еще раз спасибо!


Это еще раз доказывает простоту и надежность в эксплуатации informix. Мы бед с ним реальных не знали так долго, что он нам не давал повода его глубоко изучать. Хотя и вправду это очень интересно!
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38543403
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
_torerops. и все таки странно, что informix позволил пользовательскому запросу так глубоко парализовать работу субд, что даже подключиться к БД в новой сессии невозможно.скорее всего баг в оптимизаторе, при построении плана лочит что-то, выделяя кучу памяти. Можно попробовать перед запросом выполнить set optimization low.

Завалить можно любую субд, банальным запросом:
select * from огромная_таблица,огромная_таблица,огромная_таблица,огромная_таблица,огромная_таблица order by 1,2,3,4,5,6
защититься от такого сложно.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38543409
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
SELECT CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE
TABID=1

это не обращение к системной таблице, это просто способ создать множество из одной строки, типа select 1 from table(set{1}) или select 1 from dual
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38543426
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Drive Array - Array Accelerator Battery is charging. The Array Accelerator Cache will be enabled once the battery has been charged.
это сообщение может быть если электричество выключить на час. Т.е. это нормально если у вас проблемы с питанием.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38543604
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Журавлев ДенисЗавалить можно любую субд, банальным запросом:
select * from огромная_таблица,огромная_таблица,огромная_таблица,огромная_таблица,огромная_таблица order by 1,2,3,4,5,6
защититься от такого сложно.
Этот запрос не валит сервер. Он ожидаемо его грузит и потребляет ресурсы.
При этом:
- новые соединения проходят,
- onparams выводит справку по себе (в нашем случае просто запуск onparams давал shared memory not initialized)
- и достаточно быстро получаем -567 SQL error: Cannot write sorted rows.-179 ISAM error: no free disk space for sort

То есть все контролируемо, все ожидаемо и мы получаем вполне конкретный ответ от СУБД, что ей не понравилось.
В каждый момент времени можно диагностировать потребление ресурсов.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38544292
Выбегалло
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Журавлев ДенисSELECT CAST(1 AS int) AS X FROM INFORMIX.SYSTABLES WHERE
TABID=1

это не обращение к системной таблице, это просто способ создать множество из одной строки, типа select 1 from table(set{1}) или select 1 from dual

И тем не менее это таки обращение к системной таблице. Если хочется получить 1 as integer, то лучше использовать
select 1 from table(set{1})
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38544534
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Журавлев ДенисМожно попробовать перед запросом выполнить set optimization low.
Результат тот же - завис.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38544954
Ikir
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Выбегалло Если хочется получить 1 as integer, то лучше использовать
select 1 from table(set{1})

Кто бы это рассказал ORM EntityFramework из linq ))))))))

А во время выполнения этого запроса, что говорит onstat -k?
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38545718
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
IkirА во время выполнения этого запроса, что говорит onstat -k?
например так
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
-------------------------------------------------------------- 
onstat -k 
-------------------------------------------------------------- 

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line (CKPT INP) -- Up 01:22:22 -- 542208 Kbytes

Locks
address          wtlist           owner            lklist           type     tblsnum  rowid    key#/bsiz
815bc400         0                9177fcb8           0                HDR+S    100002   206         0       
815bc980         0                91781530           0                    S    100002   206         0       
815c1d80         0                91777210           0                    S    100002   206         0       
815c1e80         0                9177d3f0           0                    S    100002   206         0       
82500180         0                9177bb78           0                    S    100002   206         0       
 5 active, 500000 total, 65536 hash buckets, 0 lock table overflows


или так
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
-------------------------------------------------------------- 
onstat -k 
-------------------------------------------------------------- 

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line (CKPT INP) -- Up 01:18:25 -- 542208 Kbytes

Locks
address          wtlist           owner            lklist           type     tblsnum  rowid    key#/bsiz
8067a000         0                9177cbc8           0                    S    100002   206         0       
8067ad80         0                9177ec68           0                    S    100002   206         0       
815bc480         0                9177b350           0                    S    100002   206         0       
815bc500         0                9177f490           0                    S    100002   206         0       
815bd000         0                917835d0           0                    S    100002   206         0       
824fe880         0                9177dc18           0                    S    100002   206         0       
824fe980         0                9177fcb8           824fec80         HDR+X    200016   0           0       
824fec80         0                9177fcb8           0                    S    100002   206         0       
824ff580         0                91783df8           0                    S    100002   206         0       
83440c00         0                9177d3f0           0                HDR+S    100002   206         0       
83440c80         0                91778260           0                    S    100002   206         0       
83442980         0                9177f490           815bc500         HDR+IS   100412   0           0       
83445980         0                9177a300           0                    S    100002   206         0       
83445d00         0                91778260           83440c80         HDR+X    200081   0           0       
83445e00         0                9177a300           83445980         HDR+X    200086   0           0       
 15 active, 500000 total, 65536 hash buckets, 0 lock table overflows
...
Рейтинг: 0 / 0
70 сообщений из 70, показаны все 3 страниц
Форумы / Informix [игнор отключен] [закрыт для гостей] / Сервер не дает коннектиться и пропускает чекпойнты
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]