powered by simpleCommunicator - 2.0.30     © 2024 Programmizd 02
Map
Форумы / Informix [игнор отключен] [закрыт для гостей] / Сервер не дает коннектиться и пропускает чекпойнты
25 сообщений из 70, страница 1 из 3
Сервер не дает коннектиться и пропускает чекпойнты
    #38494495
falcon111
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Используется 11.50FC9 x64 на Srv2008R2 x64.
Давно все настроено, работает и есть не просит. Нагрузка не большая - меньше 100 одновременных сессий.

Сегодня вдруг сервер перестал принимать коннекты. Телнетом локально пробовали к нему подключиться - нет коннекта.
Сервер перезагрузили, не помогло.
Вызвонили меня, пока я добрался до сервера - все уже работает.
Посмотрел сервер лог - все чисто, единственное, что бросилось в глаза, когда сервер не отвечал, в логе между чекпойнтами увеличено время.

Начиная с 16:35 время между чекпойнтами растянуто. В 16:55 - то же самое. Начиная с 17:21 все, вроде, ок.
Вопрос, что делать? Как проверить чем сервер занимался в это время, и что надо сделать, чтобы подобное не повторялось?

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
16:05:06  Maximum server connections 12 
16:05:06  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 132, Llog used 1045

16:10:10  Checkpoint Completed:  duration was 0 seconds.
16:10:10  Mon Dec 09 - loguniq 11384, logpos 0x1078018, timestamp: 0xeb18ac8 Interval: 308934

16:10:10  Maximum server connections 12 
16:10:10  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 118, Llog used 724

16:15:14  Checkpoint Completed:  duration was 0 seconds.
16:15:14  Mon Dec 09 - loguniq 11384, logpos 0x1485018, timestamp: 0xeb4b6ac Interval: 308935

16:15:14  Maximum server connections 12 
16:15:14  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 179, Llog used 1037

16:20:18  Checkpoint Completed:  duration was 0 seconds.
16:20:18  Mon Dec 09 - loguniq 11384, logpos 0x1984018, timestamp: 0xeba17b6 Interval: 308936

16:20:18  Maximum server connections 12 
16:20:19  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 217, Llog used 1282

16:25:23  Checkpoint Completed:  duration was 0 seconds.
16:25:23  Mon Dec 09 - loguniq 11384, logpos 0x1ea7018, timestamp: 0xec20171 Interval: 308937

16:25:23  Maximum server connections 12 
16:25:23  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 216, Llog used 1315

16:30:27  Checkpoint Completed:  duration was 0 seconds.
16:30:27  Mon Dec 09 - loguniq 11384, logpos 0x1eaa018, timestamp: 0xec202c9 Interval: 308938

16:30:27  Maximum server connections 12 
16:30:27  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 2, Llog used 3

16:40:35  Checkpoint Completed:  duration was 0 seconds.
16:40:35  Mon Dec 09 - loguniq 11384, logpos 0x1ead018, timestamp: 0xec20570 Interval: 308939

16:40:35  Maximum server connections 12 
16:40:35  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 3, Llog used 3

16:55:48  Checkpoint Completed:  duration was 0 seconds.
16:55:48  Mon Dec 09 - loguniq 11384, logpos 0x1eaf018, timestamp: 0xec2094f Interval: 308940

16:55:48  Maximum server connections 12 
16:55:48  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 2, Llog used 2

17:11:00  Checkpoint Completed:  duration was 0 seconds.
17:11:00  Mon Dec 09 - loguniq 11384, logpos 0x1eb9018, timestamp: 0xec20d98 Interval: 308941

17:11:00  Maximum server connections 12 
17:11:00  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 20, Llog used 10

17:21:09  Checkpoint Completed:  duration was 0 seconds.
17:21:09  Mon Dec 09 - loguniq 11384, logpos 0x1ebf018, timestamp: 0xec21056 Interval: 308942

17:21:09  Maximum server connections 12 
17:21:09  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 9, Llog used 6

17:26:13  Checkpoint Completed:  duration was 0 seconds.
17:26:13  Mon Dec 09 - loguniq 11384, logpos 0x1f95018, timestamp: 0xec25b8d Interval: 308943

17:26:13  Maximum server connections 12 
17:26:13  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 115, Llog used 216

17:28:24  Logical Log 11384 Complete, timestamp: 0xec2d472.
17:31:17  Checkpoint Completed:  duration was 0 seconds.
17:31:17  Mon Dec 09 - loguniq 11385, logpos 0xbd018, timestamp: 0xec3a22d Interval: 308944

17:31:17  Maximum server connections 12 
17:31:17  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 134, Llog used 296

17:36:21  Checkpoint Completed:  duration was 0 seconds.
17:36:21  Mon Dec 09 - loguniq 11385, logpos 0x27f018, timestamp: 0xec53432 Interval: 308945

17:36:21  Maximum server connections 15 
17:36:22  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 107, Llog used 450

17:41:26  Checkpoint Completed:  duration was 0 seconds.
17:41:26  Mon Dec 09 - loguniq 11385, logpos 0x707018, timestamp: 0xecaedac Interval: 308946

17:41:26  Maximum server connections 15 
17:41:26  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 314, Llog used 1160

17:46:30  Checkpoint Completed:  duration was 0 seconds.
17:46:30  Mon Dec 09 - loguniq 11385, logpos 0xbec018, timestamp: 0xed1c726 Interval: 308947

17:46:30  Maximum server connections 15 
17:46:30  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 245, Llog used 1253

17:51:34  Checkpoint Completed:  duration was 0 seconds.
17:51:34  Mon Dec 09 - loguniq 11385, logpos 0x101a018, timestamp: 0xed521de Interval: 308948
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38495118
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
falcon111Сервер перезагрузили, не помогло.


В логе не видно, что сервер перезагружали
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38537485
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Ситуация один-в-один!

Используем IDS 11.70FC4 (Проверяли и на 11.70FC7).
Настроены 2 подключения по olsoctcp и drsoctcp.
В какой-то момент по drda остаются доступны только select`ы. olsoc лежит мертво - ни dbacces, ни esqleditor, ни ilogin не подключаются.

Внешне все выглядит так:
1. onstat - дает online
2. onparams без параметров пишет после таймаута - шаред мемори не инициализирована
3. telnet на оба порта подключается!
4. в log журнале как и у автора - только список чекпоинтов, причем последний 20-30-40 минут назад. хотя до этого каждые 5 минут был отчет.
5. onstat с различными ключами - ничего криминального. все в пределах нормы.
6. В мониторе windows - нет никакой дисковой активности на datadbs. была замечена непродолжительное время и незначительная на tempdbs. Память и CPU на oninit тоже без активности.
7. Во время одного из разбирательств сервер ожил(!) сам. В логе ничего не появилось.
8. Заметили, что все же активнее уходит в себя в моменты пиковой активности в течение рабочего дня. Вечером вроде не проявляется. Хотя в логе за ночь тоже присутствуют окна в 15-25 минут между чекпоинтами.

То есть он уходит сам в себя на достаточно продолжительное время. Внешне никак это не обозначает и выяснить что же там происходит пока не можем. Проблема резко всплыла после новогодних праздников, но и в декабре похоже были звоночки.

До этого как и у автора - работало год-два. А тут две ужасных недели --- каждые час-полтора приходится перестартовывать службу - заказчик уже нервничает. Мы не можем понять причин. Кстати остановка службы при перезапуске происходит минут 5-7.

falcon111, чем все закончилось у вас?

Встречаются еще упоминания о данной ситуации
http://www.dbtalk.net/comp-databases-informix/problems-long-checkpoints-664021.html

но никакой конкретики.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38537927
Возможно не в тему, но как-то вызвали у 11.50FC8W2 задумчивые тормоза и уходы в астрал вот точно с такими же отходняками как включили во встроеном шедулере автоапдейт статистики.

Неделя ахтунга, но как сообразили и отключили - жопа закончилась разом.

Были там пропуски чекпоинтов или не не помню. Но коннектиться давал.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538617
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Яковлев Павел, тоже сталкивались с этим, поэтому его останавливаем

20:49:56 On-Line Mode
20:49:57 SCHAPI: "INFORMIXDIR/etc/sysadmin/stop" file is present.
Bypassing dbScheduler and dbWorker threads startup.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538711
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Что было сделано:
1) в CONFIG включен RTO: RTO_SERVER_RESTART 300
2) у всех клиентов (3 клиента - 2 по olsoctcp, 1 по drda) выставлено время жизни сессии в пуле соединений клиента 30 сек. Было где-то 60 (умолчание), где-то 1800.


Что получили:
1) ухода в себя нет. сервер работает и обслуживает всех клиентов. вроде радость, но:
2) в логе и по onstat -g ckp нет чекпоинтов.

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
AUTO_CKPTS=On   RTO_SERVER_RESTART=300 seconds   Estimated recovery time 102 seconds

                                                                    Critical Sections                          Physical Log    Logical Log
           Clock                                  Total Flush Block #      Ckpt  Wait  Long  # Dirty   Dskflu  Total    Avg    Total    Avg
Interval   Time      Trigger    LSN               Time  Time  Time  Waits  Time  Time  Time  Buffers   /Sec    Pages    /Sec   Pages    /Sec
1778       20:49:56  Startup    4893:0x4c7c0c0    1.0   0.9   0.0   0      0.0   0.0   0.0   5         5       2        0      1        0

Max Plog       Max Llog       Max Dskflush   Avg Dskflush   Avg Dirty      Blocked
pages/sec      pages/sec      Time           pages/sec      pages/sec      Time
480            2532           1              5              0              0



То есть первая половина рабочего дня понедельника не чекпоинтилась.
Решили сделать принудительный сброс onmode -c.
Запустили в 10:45. Сейчас уже 11:10. Команда выполняется. Мы стали волноваться.

onstat -g iof
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
AIO global files:
gfd pathname         bytes read     page reads  bytes write    page writes io/s
3   **D:\IFMXDATA\ol_css2\rootdbs_dat.000 2796646400     682775      681902080      166480      1702.1
        op type     count          avg. time
        seeks       0              N/A
        reads       0              N/A
        writes      0              N/A
        kaio_reads  558151         0.0004
        kaio_writes 89907          0.0016

4   **D:\IFMXDATA\ol_css2\tempdbs_dat.000 19757256704    4823549     19669508096    4802126     1947.0
        op type     count          avg. time
        seeks       0              N/A
        reads       0              N/A
        writes      0              N/A
        kaio_reads  328120         0.0006
        kaio_writes 305291         0.0004



Данные у нас в этом инстансе лежат в root (также как и физ.лог и лог.лог). Значение writes (предпоследняя цифра) у rootdbs растет все это время. В планах есть разделить rootdbs на root, data, plog и llog. А сейчас конечно непонятно по кому идет активность.
Пока писал onmode -c продолжает работать (время 11:30)


Собственно этим постом хотел спросить:
1) Что происходит?
2) Как посмотреть что происходит?
3) Что будет если перезапустить информикс? Архив ночной есть.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538772
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Итак прошел час (11:45) после запуска команды
Код: sql
1.
onmode -c  


и все --- сервер ушел в себя со всеми описанными выше симптомами:
1) телнеты на оба порта (olsoctcp и drsoctcp) подключаются
2) дисковой активности через монитор Windows - 0
3) С начала запуска сервера (вчера вечером) заполнилось 7 логических журналов по 100мб из 51.
4) коннект на порт olsoctcp не идет ни откуда.
5) коннект по drda с клиента идет!
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
C:\Program Files\IBM\IBM DATA SERVER DRIVER\bin>testconn40.exe  "database=css; server=192.168.5.19:9189; userid=portal; password=*****" 

Step 1: Printing version info
	.NET Framework version: 4.0.30319.1
	64-bit
	DB2 .NET provider version: 9.7.4.4
	DB2 .NET file version: 9.7.4.4
	Capability bits: ALLDEFINED
	Build: 20110330
	Factory for invariant name IBM.Data.DB2 verified
	Factory for invariant name IBM.Data.Informix verified
	IBM.Data.Informix from DbFactory is the Common Informix .NET provider
IBM Database Add-ins is not installed properly
        Elapsed: 2.1529104

Step 2: Validating db2dsdriver.cfg against db2dsdriver.xsd schema file
	File C:\ProgramData\IBM\DB2\IBMDBCL1\cfg\db2dsdriver.cfg  missing. Nothing to validate
        Elapsed: 0.0156008

Step 3: Connecting using "database=css; server=192.168.5.19:9189; userid=portal; password=***"
	Server type and version: IDS 11.70.0000
        Elapsed: 1.5912816

Step 4: Selecting rows from informix.systables to validate existence of packages
   SELECT * FROM informix.systables
        Elapsed: 0.4992256

Step 5: Calling GetSchema for tables to validate existence of schema functions
        Elapsed: 0.9672496


Test passed.



Есть снятый лог
Код: sql
1.
onstat -g all

на момент ухода сервера в себя.

Еще примечательный момент - сессии зависли и не освобождаются. Хотя в пуле клиента они уже явно просрочены:

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 15:26:57 -- 1180800 Kbytes

session                                      #RSAM    total      used       dynamic 
id       user     tty      pid      hostname threads  memory     memory     explain 
2234     informix -        0        -        0        16384      12528      off 
2218     informix -        0        -        0        16384      12528      off 
2217     alsuz    TSR_APP  17216    TSR_APP  2        3727360    3720976    off 
2216     dlr      TSR_APP  17216    TSR_APP  1        163840     85792      off 
2215     xisam    TSR_APP  17216    TSR_APP  1        3399680    3333168    off 
2213     shtm     TSR_APP  17216    TSR_APP  1        3592192    3524736    off 
2212     portal   SZAPP-SO 1548     SZAPP-SO 1        700416     679776     off 
2211     portal   SZAPP-SO 1548     SZAPP-SO 1        1355776    1333136    off 
2206     guzeliya TSR_APP  17216    TSR_APP  1        2002944    1918656    off 
2205     ludan    TSR_APP  17216    TSR_APP  1        4329472    4274704    off 
2202     zo       TSR_APP  17216    TSR_APP  2        4583424    4548480    off 
2190     kuleeva  TSR_APP  17216    TSR_APP  3        4714496    4679824    off 
2072     portal   SZAPP-SO 1548     szapp-so 1        2572288    2469168    off 
2061     informix -        0        -        1        45056      41360      off 
2046     portal   SZAPP-SO 1548     szapp-so 2        589824     516256     off 
2035     portal   SZAPP-SO 1548     szapp-so 3        1429504    1202656    off 
1992     portal   SZAPP-SO 1548     szapp-so 4        1822720    1463472    off 
1765     portal   SZAPP-SO 1548     szapp-so 4        2342912    1921296    off 
1741     portal   SZAPP-SO 1548     szapp-so 3        1953792    1711296    off 
1704     portal   SZAPP-SO 1548     szapp-so 4        1286144    1192928    off 
1589     portal   SZAPP-SO 1548     szapp-so 4        720896     445504     off 
1583     portal   SZAPP-SO 1548     szapp-so 3        2457600    2244288    off 
1581     informix -        0        -        1        45056      41360      off 
1563     alfiyab  TSR_APP  17216    TSR_APP  3        4268032    4244640    off 
1527     liliyaga TSR_APP  17216    TSR_APP  3        4653056    4615168    off 
1522     shtm     TSR_APP  17216    TSR_APP  2        4071424    4042976    off 
1438     portal   SZAPP-SO 1548     szapp-so 2        1339392    1133280    off 
1436     informix -        0        -        1        45056      41360      off 
1373     portal   SZAPP-SO 1548     szapp-so 4        2375680    2111888    off 
1368     portal   SZAPP-SO 1548     szapp-so 4        1007616    915504     off 
1366     dlr      TSR_APP  17216    TSR_APP  3        3624960    3594064    off 
1364     2224     TSR_APP  17216    TSR_APP  1        147456     82864      off 
1361     portal   SZAPP-SO 1548     szapp-so 3        1146880    942064     off 
1333     portal   SZAPP-SO 1548     SZAPP-SO 1        1388544    1353120    off 
870      informix TSR_DB   4400     TSR_DB   1        98304      95904      off 
164      portal   SZAPP-SO 1548     szapp-so 4        2854912    2506528    off 
28       informix -        0        -        1        57344      50336      off 
6        informix -        0        -        0        16384      14240      off 
5        informix -        0        -        0        16384      14240      off 
4        informix -        0        -        0        16384      12528      off 
3        informix -        0        -        0        16384      12528      off 
2        informix -        0        -        0        16384      12528      off 
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538779
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torero... Нагрузка не большая - меньше 100 одновременных сессий...
Собственно этим постом хотел спросить:
1) Что происходит?
2) Как посмотреть что происходит?
3) Что будет если перезапустить информикс? Архив ночной есть.

Рискну предположить, что нагрузка таки есть. В процессе синхронизации буферов с чанками данные от клиентов продолжают поступать. Другими словами, скорость поступления данных выше скорости сброса буферов на диск. В какой-то момент данных скапливается так много, и поскольку Informix отдает приоритет процессу обработки контрольной точки, обработка поступающих данных прекращается, становятся возможны только селекты, модификация данных невозможна, что и происходит у вас периодически.
Посмотреть, что происходит, можно командами onstat -d, onstat -F, onstat -g seg, onstat -u, onstat -g ses.
Рекомендую найти сессию, которая активно вставляет или модифицирует данные на сервере.
Инстанс лучше не перезапускать, есть риск потери данных со времени последнего архива.
После завершения чекпоинта надо будет посмотреть onstat -g ckp и вывод из журнала сообщений.
Там должны быть полезные рекомендации. Следовать им необязательно, но определенные выводы сделать можно.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538790
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
дополнительная информация на 12:10
1) в логах клиента который одновременно работает по olsoctcp и drda ошибки на модификацию (транзакцию) пошли сразу после команды onmode -c.
2) подключение по drda все еще идет!
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538813
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
victor16,

1) нагрузки нет. клиенты судя по логам и нашим попыткам зайти в клиентское приложение просто не могут проконнектиться по olsoctcp. По drda при этом коннект проходит. Но по drda идет только выборка без модификаций.
2) Сессии я приводил выше - они заморозились на момент недоступности сервера. Сейчас (12:23) проверил - они все на месте.
3) Запросы неоднократно профилировали и трейсили - система картотечная - нет длинных вставок, удалений или модификаций, свойственных аналитическим задачам. (мы на запросы сразу начали думать, как столкнулись с таким поведением. сейчас тоже допускаем конечно же их вину, но уже гипотетически. )
4) С другой стороны- что может "натворить" запрос? Длинный insert переполнит логи и будет long transaction aborted - но это явное и прогнозируемое поведение. и проблемы будут у конкретной сессии. мы искусственно вызывали такое поведение - сервер стоял как ни в чем ни бывало.

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
D:\>onstat -g sql

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 15:49:06 -- 1180800 Kbytes


Sess       SQL            Current            Iso Lock       SQL  ISAM F.E.
Id         Stmt type      Database           Lvl Mode       ERR  ERR  Vers  Explain
2217       SELECT         css                CR  Wait 10    0    0    3.50. Off
2216       -              css                CR  Wait 10    0    0    3.50. Off
2215       -              css                CR  Wait 10    0    0    3.50. Off
2213       -              css                CR  Wait 10    0    0    3.50. Off
2212       -              css                CR  Not Wait   0    0    -     Off
2211                      css                CR  Not Wait   0    0    -     Off
2206       -              css                CR  Wait 10    0    0    3.50. Off
2205       -              css                CR  Wait 10    0    0    3.50. Off
2202       SELECT         css                CR  Wait 10    0    0    3.50. Off
2190       SELECT         css                CR  Wait 10    0    0    3.50. Off
2072       -              css                CR  Wait 10    0    0    3.50. Off
2046       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
2035       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
1992       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
1765       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
1741       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
1704       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
1589       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
1583       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
1563       SELECT         css                CR  Wait 10    0    0    3.50. Off
1527       SELECT         css                CR  Wait 10    0    0    3.50. Off
1522       SELECT         css                CR  Wait 10    0    0    3.50. Off
1438       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
1373       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
1368       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
1366       SELECT         css                CR  Wait 10    0    0    3.50. Off
1364       -              css                CR  Wait 10    0    0    3.50. Off
1361       CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off
1333                      css                CR  Not Wait   0    0    -     Off
870        SELECT         css                CR  Not Wait   0    0    9.250 Off
164        CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off


Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
D:\>onstat -F

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 15:49:44 -- 1180800 Kbytes


Fg Writes     LRU Writes    Chunk Writes
0             0             0

address           flusher  state    data     # LRU    Chunk    Wakeups  Idle Tim
b8786858         0        I        0        0        1        133695   135612.078
b8787080         1        I        0        0        1        138162   140295.056
b87878a8         2        I        0        0        0        141355   143380.621
b87880d0         3        I        0        0        0        133694   135612.111
b87888f8         4        I        0        0        0        141387   143380.587
b8789120         5        I        0        0        0        138162   140296.042
b8789948         6        I        0        0        0        141355   143380.643
b878a170         7        I        0        0        0        133694   135612.291
      states: Exit Idle Chunk Lru


Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
D:\>onstat -g seg

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 15:50:17 -- 1180800 Kbytes

Segment Summary:
id         key        addr             size             ovhd     class blkused  blkfree
1381517313 52584801   80000000         940703744        11461456 R     229654   10
1381517314 52584802   b8120000         268435456        3147392  V     40517    25019
Total:     -          -                1209139200       -        -     270171   25029

   (* segment locked in memory)
No reserve memory is allocated


Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
102.
103.
104.
105.
106.
107.
onstat -u
IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 15:51:09 -- 1180800 Kbytes

Userthreads
address          flags   sessid   user     tty      wait             tout locks nreads   nwrites
b8786030         ---P--D 1        informix -        0                0    0     24       10
b8786858         ---P--F 0        informix -        0                0    0     0        1
b8787080         ---P--F 0        informix -        0                0    0     0        4
b87878a8         ---P--F 0        informix -        0                0    0     0        0
b87880d0         ---P--F 0        informix -        0                0    0     0        0
b87888f8         ---P--F 0        informix -        0                0    0     0        0
b8789120         ---P--F 0        informix -        0                0    0     0        0
b8789948         ---P--F 0        informix -        0                0    0     0        0
b878a170         ---P--F 0        informix -        0                0    0     0        0
b878a998         ---P--- 9        informix -        0                0    0     0        0
b878b1c0         ---P--B 10       informix -        0                0    0     85754    1040
b878b9e8         ---P--D 11       informix -        0                0    0     32667    0
b878c210         Y--P--- 28       informix -        b95612e0         0    0     0        0
b878ca38         ---P--D 15       informix -        0                0    0     0        0
b878d260         Y--P--- 1563     alfiyab  TSR_APP  bd576d50         0    1     163      179
b878da88         ---P--D 16       informix -        0                0    0     3        0
b878e2b0         Y--P--D 24       informix -        80b7af08         0    0     0        0
b878ead8         Y--P--- 1765     portal   SZAPP-SO c220c490         0    2     20765    23942
b878fb28         ------- 1373     portal   SZAPP-SO 0                0    2     0        0
b8790350         Y--P--- 1373     portal   SZAPP-SO c0aef800         0    2     10085    11863
b8790b78         ---P--- 1333     portal   SZAPP-SO 0                0    1     13       0
b87913a0         Y--P--- 2215     xisam    TSR_APP  c15d7170         0    1     1        5
b87923f0         Y--P--- 1366     dlr      TSR_APP  bde89c50         0    2     0        5
b8792c18         ------- 1361     portal   SZAPP-SO 0                0    2     0        0
b8793440         Y--P--- 870      informix TSR_DB   bde89a70         0    1     13       0
b8793c68         Y------ 1373     portal   SZAPP-SO bdbd39a0         0    2     0        0
b8794490         Y--P--- 1368     portal   SZAPP-SO bf58bf40         0    2     2        3
b8794cb8         Y--P--- 164      portal   SZAPP-SO ba569870         0    2     146113   185714
b87954e0         ------- 164      portal   SZAPP-SO 0                0    2     0        0
b8795d08         Y------ 1366     dlr      TSR_APP  b9dd1030         0    2     0        0
b8796530         Y------ 164      portal   SZAPP-SO b938a6a0         0    2     0        0
b8796d58         Y--P--- 1361     portal   SZAPP-SO bcbec030         0    2     844      866
b8797580         ------- 1368     portal   SZAPP-SO 0                0    2     0        0
b8797da8         ------- 1361     portal   SZAPP-SO 0                0    2     0        0
b87985d0         Y------ 1361     portal   SZAPP-SO bcc7f490         0    2     0        0
b8798df8         Y------ 1368     portal   SZAPP-SO bce09870         0    2     0        0
b8799620         Y------ 1765     portal   SZAPP-SO c2eb0c00         0    2     0        0
b879a670         Y------ 164      portal   SZAPP-SO ba56e2a0         0    2     0        0
b879ae98         ------- 1366     dlr      TSR_APP  0                0    2     0        0
b879b6c0         Y--P--- 1364     2224     TSR_APP  c0b04210         0    1     1        2
b879bee8         ------- 1368     portal   SZAPP-SO 0                0    2     0        0
b879c710         Y------ 1368     portal   SZAPP-SO bf753030         0    2     0        0
b879cf38         Y--P--- 1741     portal   SZAPP-SO b9413de0         0    2     2864     3304
b879df88         ---P--- 1438     portal   SZAPP-SO 0                0    2     4029     4163
b879e7b0         Y--P--- 1527     liliyaga TSR_APP  bf7538f0         0    1     10825    10856
b879efd8         Y--P--- 1589     portal   SZAPP-SO be548980         0    2     106      109
b879f800         ---P--- 1436     informix -        0                0    0     0        0
b87a0028         Y--P--- 2202     zo       TSR_APP  bcb86170         0    1     10826    11050
b87a0850         Y--P--- 1522     shtm     TSR_APP  bde89bb0         0    2     16       136
b87a1078         ------- 1438     portal   SZAPP-SO 0                0    2     0        0
b87a20c8         Y--P--- 2213     shtm     TSR_APP  c164aa90         0    1     195      225
b87a28f0         Y------ 1373     portal   SZAPP-SO bd6fa350         0    2     0        0
b87a3118         Y--P--- 2072     portal   SZAPP-SO c220c210         0    1     25125    28735
b87a4168         ------- 1373     portal   SZAPP-SO 0                0    2     0        0
b87a4990         Y--P--- 1992     portal   SZAPP-SO c171a0d0         0    2     1530     1560
b87a51b8         Y------ 1527     liliyaga TSR_APP  bd576670         0    1     0        0
b87a59e0         ------- 1527     liliyaga TSR_APP  0                0    1     0        0
b87a6208         Y--P--- 2035     portal   SZAPP-SO c1ee5f70         0    2     4        9
b87a6a30         Y--P--- 1704     portal   SZAPP-SO becdc6a0         0    2     687      790
b87a7258         Y------ 1589     portal   SZAPP-SO c0bd5f50         0    2     0        0
b87a7a80         ------- 1522     shtm     TSR_APP  0                0    2     0        0
b87a82a8         Y--P--- 2217     alsuz    TSR_APP  bf1a1d30         0    2     3        28
b87a8ad0         ------- 1589     portal   SZAPP-SO 0                0    2     0        0
b87a92f8         Y------ 1563     alfiyab  TSR_APP  bfd82e10         0    1     0        0
b87a9b20         ------- 1563     alfiyab  TSR_APP  0                0    1     0        0
b87aa348         Y------ 1589     portal   SZAPP-SO bfd82420         0    2     0        0
b87ab398         ------- 1992     portal   SZAPP-SO 0                0    2     0        0
b87ac3e8         ---P--- 1581     informix -        0                0    0     0        0
b87acc10         Y--P--- 2212     portal   SZAPP-SO bc1a8f60         0    1     0        0
b87ad438         Y--P--- 1583     portal   SZAPP-SO bd576710         0    2     25011    29436
b87adc60         ------- 1589     portal   SZAPP-SO 0                0    2     0        0
b87aecb0         Y--P--- 2216     dlr      TSR_APP  c22a0950         0    1     1        6
b87af4d8         Y------ 1704     portal   SZAPP-SO bd286d00         0    2     0        0
b87b0528         ------- 1765     portal   SZAPP-SO 0                0    2     0        0
b87b0d50         Y------ 1704     portal   SZAPP-SO c153e8a0         0    2     0        0
b87b1578         ------- 1704     portal   SZAPP-SO 0                0    2     0        0
b87b1da0         ------- 1583     portal   SZAPP-SO 0                0    2     0        0
b87b25c8         Y------ 1583     portal   SZAPP-SO c1ee5840         0    2     0        0
b87b2df0         ------- 1583     portal   SZAPP-SO 0                0    2     0        0
b87b3618         ------- 2217     alsuz    TSR_APP  0                0    2     0        0
b87b3e40         ------- 1741     portal   SZAPP-SO 0                0    2     0        0
b87b4668         Y------ 1741     portal   SZAPP-SO c127af90         0    2     0        0
b87b4e90         ------- 1741     portal   SZAPP-SO 0                0    2     0        0
b87b5ee0         ------- 2035     portal   SZAPP-SO 0                0    2     0        0
b87b6708         Y--P--- 2205     ludan    TSR_APP  c205d4c0         0    1     1415     1468
b87b6f30         Y------ 1765     portal   SZAPP-SO bbdf7340         0    2     0        0
b87b7f80         ------- 1765     portal   SZAPP-SO 0                0    2     0        0
b87b87a8         ------- 2202     zo       TSR_APP  0                0    1     0        0
b87b8fd0         Y------ 1992     portal   SZAPP-SO c22a0b30         0    2     0        0
b87b97f8         Y------ 1992     portal   SZAPP-SO b94136a0         0    2     0        0
b87ba020         ------- 1992     portal   SZAPP-SO 0                0    2     0        0
b87ba848         Y--P--- 2046     portal   SZAPP-SO c24e1f20         0    2     2        0
b87bb070         Y------ 2190     kuleeva  TSR_APP  bbd38530         0    1     0        0
b87bb898         ------- 2190     kuleeva  TSR_APP  0                0    1     0        0
b87bc8e8         Y------ 2035     portal   SZAPP-SO c171ae70         0    2     0        0
b87bd110         ------- 2046     portal   SZAPP-SO 0                0    2     0        0
b87bf9d8         ---P--- 2061     informix -        0                0    0     0        0
b87c0200         ---P--- 2211     portal   SZAPP-SO 0                0    1     4        0
b87c0a28         Y--P--- 2206     guzeliya TSR_APP  c07a6f10         0    1     385      426
b87c1250         Y--P--- 2190     kuleeva  TSR_APP  c07a6230         0    1     1167     1655
b87c1a78         ------- 2035     portal   SZAPP-SO 0                0    2     0        0
 101 active, 128 total, 44 maximum concurrent


Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
D:\>onstat -g ses

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 15:52:17 -- 1180800 Kbytes

session                                      #RSAM    total      used       dynamic
id       user     tty      pid      hostname threads  memory     memory     explain
2239     informix -        0        -        0        16384      12528      off
2238     portal   SZAPP-SO 4240     SZAPP-SO 1        348160     342016     off
2218     informix -        0        -        0        16384      12528      off
2217     alsuz    TSR_APP  17216    TSR_APP  2        3727360    3720976    off
2216     dlr      TSR_APP  17216    TSR_APP  1        163840     85792      off
2215     xisam    TSR_APP  17216    TSR_APP  1        3399680    3333168    off
2213     shtm     TSR_APP  17216    TSR_APP  1        3592192    3524736    off
2212     portal   SZAPP-SO 1548     SZAPP-SO 1        700416     679776     off
2211     portal   SZAPP-SO 1548     SZAPP-SO 1        1355776    1333136    off
2206     guzeliya TSR_APP  17216    TSR_APP  1        2002944    1918656    off
2205     ludan    TSR_APP  17216    TSR_APP  1        4329472    4274704    off
2202     zo       TSR_APP  17216    TSR_APP  2        4583424    4548480    off
2190     kuleeva  TSR_APP  17216    TSR_APP  3        4714496    4679824    off
2072     portal   SZAPP-SO 1548     szapp-so 1        2572288    2469168    off
2061     informix -        0        -        1        45056      41360      off
2046     portal   SZAPP-SO 1548     szapp-so 2        589824     516256     off
2035     portal   SZAPP-SO 1548     szapp-so 3        1429504    1202656    off
1992     portal   SZAPP-SO 1548     szapp-so 4        1822720    1463472    off
1765     portal   SZAPP-SO 1548     szapp-so 4        2342912    1921296    off
1741     portal   SZAPP-SO 1548     szapp-so 3        1953792    1711296    off
1704     portal   SZAPP-SO 1548     szapp-so 4        1286144    1192928    off
1589     portal   SZAPP-SO 1548     szapp-so 4        720896     445504     off
1583     portal   SZAPP-SO 1548     szapp-so 3        2457600    2244288    off
1581     informix -        0        -        1        45056      41360      off
1563     alfiyab  TSR_APP  17216    TSR_APP  3        4268032    4244640    off
1527     liliyaga TSR_APP  17216    TSR_APP  3        4653056    4615168    off
1522     shtm     TSR_APP  17216    TSR_APP  2        4071424    4042976    off
1438     portal   SZAPP-SO 1548     szapp-so 2        1339392    1133280    off
1436     informix -        0        -        1        45056      41360      off
1373     portal   SZAPP-SO 1548     szapp-so 4        2375680    2111888    off
1368     portal   SZAPP-SO 1548     szapp-so 4        1007616    915504     off
1366     dlr      TSR_APP  17216    TSR_APP  3        3624960    3594064    off
1364     2224     TSR_APP  17216    TSR_APP  1        147456     82864      off
1361     portal   SZAPP-SO 1548     szapp-so 3        1146880    942064     off
1333     portal   SZAPP-SO 1548     SZAPP-SO 1        1388544    1353120    off
870      informix TSR_DB   4400     TSR_DB   1        98304      95904      off
164      portal   SZAPP-SO 1548     szapp-so 4        2854912    2506528    off
28       informix -        0        -        1        57344      50336      off
6        informix -        0        -        0        16384      14240      off
5        informix -        0        -        0        16384      14240      off
4        informix -        0        -        0        16384      12528      off
3        informix -        0        -        0        16384      12528      off
2        informix -        0        -        0        16384      12528      off



Запросы в висящих сессиях замерли на создании индексов - пытались поиск в системе сделать. Ничего криминального. Поиск сделан через временную таблицу.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538828
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torerob8794cb8 Y--P--- 164 portal SZAPP-SO ba569870 0 2 146113 185714

Аномально высокое по сравнение с другими сессиями значение nwrites. Покажите onstat -g ses 164

_toreroЗапросы в висящих сессиях замерли на создании индексов - пытались поиск в системе сделать. Ничего криминального. Поиск сделан через временную таблицу.
Вы индексы создаете на временную таблицу или постоянную?
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538864
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
victor16,
индексы на временную таблицу.
Мы отключали создание этих индексов - изменений не было (то есть все-равно сервер был недоступен).
Под "Поиск" в предыдущем сообщении - имел ввиду некую прикладную функцию поиска сущностей в базе - набор select и update через временную таблицу.
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
session           effective                            #RSAM    total      used       dynamic
id       user     user      tty      pid      hostname threads  memory     memory     explain
164      portal   -         SZAPP-SO 1548     szapp-so 4        2854912    2506528    off

Program :
-

tid      name     rstcb            flags    curstk   status
2069     sqlexec  b8794cb8         Y--P---  14224    cond wait  opened_up -
33335    xchg_1.0 b879a670         Y------  1088     cond wait  opened_up -
33336    xchg_2.0 b8796530         Y------  1136     cond wait  opened_up -
33337    xchg_3.0 b87954e0         -------  8        ready-

Memory pools    count 3
name         class addr              totalsize  freesize   #allocfrag #freefrag
164          V     bde9a040         2768896    335808     4083       228
164*O0       V     bd3cc040         4096       784        1          1
164_SORT_0   V     bd23e040         81920      11792      8          3

name           free       used           name           free       used
overhead       0          9936           mtmisc         0          1696
scb            0          224            opentable      0          169568
filetable      0          24800          ru             0          608
misc           0          1648           blobio         0          27600
log            0          66176          temprec        0          21696
blob           0          10448          keys           0          45056
ralloc         0          1670304        gentcb         0          3920
ostcb          0          3024           sort           0          67120
sqscb          0          113456         sql            0          25616
srtmembuf      0          208            xchg_desc      0          1616
xchg_port      0          1296           xchg_packet    0          352
xchg_group     0          576            xchg_priv      0          480
scan_desc      0          240            sort_desc      0          3632
btmrg_desc     0          2512           hashfiletab    0          2272
osenv          0          3888           sqtcb          0          49312
fragman        0          144512         shmblklist     0          336
udr            0          13008          rsam_seqscan   0          19392

sqscb info
scb              sqscb            optofc   pdqpriority optcompind  directives
b8d2d0f0         bcb9b030         0        0           2           1

Sess       SQL            Current            Iso Lock       SQL  ISAM F.E.
Id         Stmt type      Database           Lvl Mode       ERR  ERR  Vers  Explain
164        CREATE INDEX   css                CR  Wait 10    0    0    3.50. Off

Current SQL statement (48701) :
  create index ix1_t_citizen on alx_t_keys (citizen_id)

Last parsed SQL statement :
  create index ix1_t_citizen on alx_t_keys (citizen_id)

User-created Temp tables :
  partnum  tabname            rowsize
  200080   alx_t_keys         48
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538874
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torero,

насколько быстро заполняются физический и логический журналы?
покажите onstat -l с интервалом, скажем в 10-15 секунд
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538889
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
victor16, самое главное забыл сказать по 164 сессии:

пользователь portal - это пользователь, под которым подключается пул приложений IIS веб-сервера. То есть за ним стоит работа десятков реальных людей.

Тогда пара слов об архитектуре:
1) Клиентами базы являются 2 клиентских приложения, расположенные на двух разных хостах
2) Первый клиент подключается и работает полностью через olsoctcp - это Winforms клиент, использующий провайдер IBM.Data.Informix.dll. Пользователи этого клиента подключаются к БД каждый своим логином.
3) Второй клиент - это сайт. Использует для подключения и работы два протокола:
- olsoctcp напрямую через провайдер IBM.Data.Informix.dll (в приложении на этом построена прямая работа через SQL: вся модификация данных и часть select-ов)
- drsoctcp для работы EntityFramework через DataServerData package (v9.7fp4_ntx64_dsdriver_ALL_LANG.exe) (в приложении на этом построена только часть выборки данных. модификация данных не производится).
Пользователи второго клиента подключаются к базе от имени пользователя portal. авторизация выполняется не средствами СУБД, а самим приложением.

По лог журналам:
вот вырезка из лога за сегодня 27.01.2014:
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
Mon Jan 27 08:03:04 2014

08:03:04  Logical Log 4893 Complete, timestamp: 0x71ae4a99.
08:45:23  Logical Log 4894 Complete, timestamp: 0x71b9c905.
09:17:10  Logical Log 4895 Complete, timestamp: 0x71c74d5d.
09:54:02  Logical Log 4896 Complete, timestamp: 0x71da636b.
10:18:37  Logical Log 4897 Complete, timestamp: 0x71e569e6.
10:35:52  Logical Log 4898 Complete, timestamp: 0x71ec9221.
11:27:01  Logical Log 4899 Complete, timestamp: 0x71feb994.


Других строчек нет.

По логам сейчас движения нет - клиенты все еще не могут работать по olsoctcp
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
onstat -l
Physical Logging
Buffer bufused  bufsize  numpages   numwrits   pages/io
  P-2  6        32       38669      1267       30.52
      phybegin         physize    phypos     phyused    %used
      1:263            225000     84549      14502      6.45

Logical Logging
Buffer bufused  bufsize  numrecs    numpages   numwrits   recs/pages pages/io
  L-3  0        16       3858225    245370     110207     15.7       2.2
        Subsystem    numrecs    Log Space used
        OLDRSAM      3858225    575683636

address          number   flags    uniqid   begin                size     used    %used
00000000B87E1CE0 1        U-B----  4874     1:225263            25000    25000   100.00
00000000B87E1D50 2        U-B----  4875     1:250263            25000    25000   100.00
00000000B87E1DC0 3        U-B----  4876     1:275263            25000    25000   100.00
00000000B87E1E30 4        U-B----  4877     1:300263            25000    25000   100.00
00000000B87E1EA0 5        U-B----  4878     1:325263            25000    25000   100.00
00000000B87E1F10 6        U-B----  4879     1:350263            25000    25000   100.00
00000000B87E1F80 7        U-B----  4880     1:375263            25000    25000   100.00
00000000B8626ED0 8        U-B----  4881     1:400263            25000    25000   100.00
00000000B8626F40 9        U-B----  4882     1:425263            25000    25000   100.00
00000000B8626FB0 10       U-B----  4883     1:450263            25000    25000   100.00
00000000B8627450 11       U-B----  4884     1:475263            25000    25000   100.00
00000000B86274C0 12       U-B----  4885     1:500263            25000    25000   100.00
00000000B8627530 13       U-B----  4886     1:525263            25000    25000   100.00
00000000B86275A0 14       U-B----  4887     1:550263            25000    25000   100.00
00000000B8627610 15       U-B----  4888     1:575263            25000    25000   100.00
00000000B8627680 16       U-B----  4889     1:600263            25000    25000   100.00
00000000B86276F0 17       U-B----  4890     1:625263            25000    25000   100.00
00000000B8627760 18       U-B----  4891     1:650263            25000    25000   100.00
00000000B86277D0 19       U-B----  4892     1:675263            25000    25000   100.00
00000000B8627840 20       U-B---L  4893     1:700263            25000    25000   100.00
00000000B86278B0 21       U-B----  4894     1:725263            25000    25000   100.00
00000000B8627920 22       U-B----  4895     1:750263            25000    25000   100.00
00000000B8627990 23       U-B----  4896     1:775263            25000    25000   100.00
00000000B8627A00 24       U-B----  4897     1:800263            25000    25000   100.00
00000000B8627A70 25       U-B----  4898     1:825263            25000    25000   100.00
00000000B8627AE0 26       U-B----  4899     1:850263            25000    25000   100.00
00000000B8627B50 27       U---C--  4900     1:875263            25000    17739    70.96
00000000B8627BC0 28       U-B----  4850     1:900263            25000    25000   100.00
00000000B8627C30 29       U-B----  4851     1:925263            25000    25000   100.00
00000000B8627CA0 30       U-B----  4852     1:950263            25000    25000   100.00
00000000B8627D10 31       U-B----  4853     1:975263            25000    25000   100.00
00000000B8627D80 32       U-B----  4854     1:1000263           25000    25000   100.00
00000000B8627DF0 33       U-B----  4855     1:1025263           25000    25000   100.00
00000000B8627E60 34       U-B----  4856     1:1050263           25000    25000   100.00
00000000B8627ED0 35       U-B----  4857     1:1075263           25000    25000   100.00
00000000B8627F40 36       U-B----  4858     1:1100263           25000    25000   100.00
00000000B8627FB0 37       U-B----  4859     1:1125263           25000    25000   100.00
00000000B87C7460 38       U-B----  4860     1:1150263           25000    25000   100.00
00000000B87C74D0 39       U-B----  4861     1:1175263           25000    25000   100.00
00000000B87C7540 40       U-B----  4862     1:1200263           25000    25000   100.00
00000000B87C75B0 41       U-B----  4863     1:1225263           25000    25000   100.00
00000000B87C7620 42       U-B----  4864     1:1250263           25000    25000   100.00
00000000B87C7690 43       U-B----  4865     1:1275263           25000    25000   100.00
00000000B87C7700 44       U-B----  4866     1:1300263           25000    25000   100.00
00000000B87C7770 45       U-B----  4867     1:1325263           25000    25000   100.00
00000000B87C77E0 46       U-B----  4868     1:1350263           25000    25000   100.00
00000000B87C7850 47       U-B----  4869     1:1375263           25000    25000   100.00
00000000B87C78C0 48       U-B----  4870     1:1400263           25000    25000   100.00
00000000B87C7930 49       U-B----  4871     1:1425263           25000    25000   100.00
00000000B87C79A0 50       U-B----  4872     1:1450263           25000    25000   100.00
00000000B87C7A10 51       U-B----  4873     1:1891686           25000    25000   100.00
 51 active, 51 total



По состоянию на 13:20 сервер к нам не вернулся. Решаем вопрос принудительного перезапуска windows службы. Подключение по drda все также работает.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538898
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torero,

а что показывает onstat -g act, onstat -g rea
лучше не один срез во времени, а несколько с интервалом 2-3 сек
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538942
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
victor16,

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
C:\INFORMIX11>onstat -g act

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 17:05:13 -- 1180800 Kbytes

Running threads:
 tid     tcb              rstcb            prty status                vp-class       name
 8       b8ca6bc0         0                1    running                11soc*        soctcppoll
 9       b8cda9c0         0                1    running                12soc*        soctcpio
 10      b8d10710         0                1    running                13soc*        soctcpio
 32531   bf432bc0         b8790b78         1    running                 1cpu*        drdaexec
 53193   c3081300         b87c0200         1    running                 9cpu*        drdaexec

C:\INFORMIX11>onstat -g act

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 17:05:19 -- 1180800 Kbytes

Running threads:
 tid     tcb              rstcb            prty status                vp-class       name
 8       b8ca6bc0         0                1    running                11soc*        soctcppoll
 9       b8cda9c0         0                1    running                12soc*        soctcpio
 10      b8d10710         0                1    running                13soc*        soctcpio
 32531   bf432bc0         b8790b78         1    running                 1cpu*        drdaexec
 53193   c3081300         b87c0200         1    running                 9cpu*        drdaexec

C:\INFORMIX11>onstat -g act

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 17:05:23 -- 1180800 Kbytes

Running threads:
 tid     tcb              rstcb            prty status                vp-class       name
 8       b8ca6bc0         0                1    running                11soc*        soctcppoll
 9       b8cda9c0         0                1    running                12soc*        soctcpio
 10      b8d10710         0                1    running                13soc*        soctcpio
 32531   bf432bc0         b8790b78         1    running                 1cpu*        drdaexec
 53193   c3081300         b87c0200         1    running                 9cpu*        drdaexec

C:\INFORMIX11>onstat -g act

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 17:05:28 -- 1180800 Kbytes

Running threads:
 tid     tcb              rstcb            prty status                vp-class       name
 8       b8ca6bc0         0                1    running                11soc*        soctcppoll
 9       b8cda9c0         0                1    running                12soc*        soctcpio
 10      b8d10710         0                1    running                13soc*        soctcpio
 32531   bf432bc0         b8790b78         1    running                 1cpu*        drdaexec
 53193   c3081300         b87c0200         1    running                 9cpu*        drdaexec



Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
C:\INFORMIX11>onstat -g rea

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 17:06:02 -- 1180800 Kbytes

Ready threads:
 tid     tcb              rstcb            prty status                vp-class       name
 7       b8c28b80         b8786030         3    ready                   1cpu*        main_loop()
 11      b8d44450         0                2    ready                   9cpu*        soctcplst
 13      b8d859a0         b8786858         1    ready                   1cpu*        flush_sub(0)
 14      b8d85d90         b8787080         1    ready                   9cpu*        flush_sub(1)
 16      b8dd06f0         b87880d0         1    ready                   1cpu*        flush_sub(3)
 18      b8e55030         b8789120         1    ready                   9cpu*        flush_sub(5)
 20      b8e8d030         b878a170         1    ready                   1cpu*        flush_sub(7)
 22      b8feb500         b878a998         2    ready                   9cpu*        aslogflush
 24      b9128710         b878b9e8         3    ready                   1cpu*        readahead_0
 42      b9146710         b878ca38         3    ready                   1cpu*        onmode_mon
 33337   c0773c90         b87954e0         1    ready                   8cpu*        xchg_3.0
 33349   c0bd5a50         b879ae98         1    ready                   9cpu*        xchg_2.0
 33352   bde4e5a0         b8792c18         1    ready                   8cpu*        xchg_2.0
 33379   b9462810         b879bee8         1    ready                   8cpu*        xchg_3.0
 33493   bde4ed80         b879f800         1    ready                   8cpu*        listen_authenticate
 33928   c0f0ac00         b87a1078         1    ready                   8cpu*        mb_collector
 35866   be548590         b87a4168         1    ready                   8cpu*        xchg_3.0
 35947   ba3c8a90         b87a59e0         1    ready                   8cpu*        xchg_2.0
 36465   bbb41bb0         b87a7a80         1    ready                   8cpu*        xchg_1.0
 36469   becdc210         b87a9b20         1    ready                   8cpu*        xchg_2.0
 36478   bfe7d7e0         b87ac3e8         1    ready                   9cpu*        listen_authenticate
 36695   bfd827e0         b87adc60         1    ready                   8cpu*        xchg_3.0
 41783   c153ec60         b87b1578         1    ready                   8cpu*        xchg_3.0
 41805   c1e9e030         b87b2df0         1    ready                   8cpu*        xchg_2.0
 42619   c25db800         b87b4e90         1    ready                   8cpu*        xchg_2.0
 48086   c205d030         b87b7f80         1    ready                   9cpu*        xchg_3.0
 48093   bc1a8030         b87ba020         1    ready                   8cpu*        xchg_3.0
 48936   c115d420         b87bd110         1    ready                   8cpu*        xchg_1.0
 48959   bcb86810         b87bf9d8         1    ready                   9cpu*        listen_authenticate
 48963   c07a69e0         b87c1a78         1    ready                   9cpu*        xchg_2.0
 53304   b9462c00         b87b87a8         1    ready                  10cpu*        xchg_1.0
 53306   c22a02b0         b87b3618         1    ready                  10cpu*        xchg_1.0
 53308   bd584d30         b87bb898         1    ready                  10cpu*        xchg_2.0

C:\INFORMIX11>onstat -g rea

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 17:06:27 -- 1180800 Kbytes

Ready threads:
 tid     tcb              rstcb            prty status                vp-class       name
 7       b8c28b80         b8786030         3    ready                   1cpu*        main_loop()
 11      b8d44450         0                2    ready                   9cpu*        soctcplst
 13      b8d859a0         b8786858         1    ready                   1cpu*        flush_sub(0)
 14      b8d85d90         b8787080         1    ready                   9cpu*        flush_sub(1)
 16      b8dd06f0         b87880d0         1    ready                   1cpu*        flush_sub(3)
 18      b8e55030         b8789120         1    ready                   9cpu*        flush_sub(5)
 20      b8e8d030         b878a170         1    ready                   1cpu*        flush_sub(7)
 22      b8feb500         b878a998         2    ready                   9cpu*        aslogflush
 24      b9128710         b878b9e8         3    ready                   1cpu*        readahead_0
 42      b9146710         b878ca38         3    ready                   1cpu*        onmode_mon
 33337   c0773c90         b87954e0         1    ready                   8cpu*        xchg_3.0
 33349   c0bd5a50         b879ae98         1    ready                   9cpu*        xchg_2.0
 33352   bde4e5a0         b8792c18         1    ready                   8cpu*        xchg_2.0
 33379   b9462810         b879bee8         1    ready                   8cpu*        xchg_3.0
 33493   bde4ed80         b879f800         1    ready                   8cpu*        listen_authenticate
 33928   c0f0ac00         b87a1078         1    ready                   8cpu*        mb_collector
 35866   be548590         b87a4168         1    ready                   8cpu*        xchg_3.0
 35947   ba3c8a90         b87a59e0         1    ready                   8cpu*        xchg_2.0
 36465   bbb41bb0         b87a7a80         1    ready                   8cpu*        xchg_1.0
 36469   becdc210         b87a9b20         1    ready                   8cpu*        xchg_2.0
 36478   bfe7d7e0         b87ac3e8         1    ready                   9cpu*        listen_authenticate
 36695   bfd827e0         b87adc60         1    ready                   8cpu*        xchg_3.0
 41783   c153ec60         b87b1578         1    ready                   8cpu*        xchg_3.0
 41805   c1e9e030         b87b2df0         1    ready                   8cpu*        xchg_2.0
 42619   c25db800         b87b4e90         1    ready                   8cpu*        xchg_2.0
 48086   c205d030         b87b7f80         1    ready                   9cpu*        xchg_3.0
 48093   bc1a8030         b87ba020         1    ready                   8cpu*        xchg_3.0
 48936   c115d420         b87bd110         1    ready                   8cpu*        xchg_1.0
 48959   bcb86810         b87bf9d8         1    ready                   9cpu*        listen_authenticate
 48963   c07a69e0         b87c1a78         1    ready                   9cpu*        xchg_2.0
 53304   b9462c00         b87b87a8         1    ready                  10cpu*        xchg_1.0
 53306   c22a02b0         b87b3618         1    ready                  10cpu*        xchg_1.0
 53308   bd584d30         b87bb898         1    ready                  10cpu*        xchg_2.0
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538964
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torero,

стоп, да у вас ничего не выполняется, нет ни одной нити в состоянии running, кроме листенеров.
сколько у вас физических процессоров на сервере?
какое количество процессоров Informix выделено под них (onstat -g cpu)?
привязаны ли они к физическим процессорам (affinity)?

ну и так, на всякий случай:
какое значение параметра LOG_INDEX_BUILDS
выполняется ли периодически команда onmode -F для освобождения неиспользуемой памяти?
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38538986
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
victor16,

Да, с 10:45 сервер после onmode -c вот в таком состоянии.

На сервере 2 CPU, 16 ядер.
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
102.
103.
104.
105.
106.
107.
108.
109.
110.
111.
112.
113.
114.
115.
116.
117.
118.
119.
120.
121.
122.
onstat -g cpu

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 1 days 17:21:06 -- 1180800 Kbytes

Thread CPU Info:
 tid    name              vp       Last Run           CPU Time     #scheds    status
 2      lio vp 0          3lio*   01/25 20:49:45        0.0000          1    IO Idle
 3      pio vp 0          4pio*   01/25 20:49:46        0.0153          2    IO Idle
 4      aio vp 0          5aio*   01/27 03:59:59        0.0205        117    IO Idle
 5      msc vp 0          6msc*   01/27 14:10:03        2.7640       2284    IO Idle
 6      fifo vp 0         7fifo*  01/25 20:49:49        0.0157          2    IO Idle
 7      main_loop()       1cpu*   01/27 10:30:01        3.1144     133741    ready
 8      soctcppoll       11soc*   01/27 10:24:37   135292.8320          8    running
 9      soctcpio         12soc*   01/25 20:49:51        0.0157          1    running
 10     soctcpio         13soc*   01/25 20:49:51        0.0156          1    running
 11     soctcplst         9cpu*   01/27 11:47:56        0.7398       3516    ready
 12     soctcplst         8cpu*   01/27 14:10:03        1.2244        650    sleeping forever
 13     flush_sub(0)      1cpu*   01/27 10:30:01        0.8191     133699    ready
 14     flush_sub(1)      9cpu*   01/27 11:48:04        0.7634     138165    ready
 15     flush_sub(2)      8cpu*   01/27 14:10:51        1.6359     146762    sleeping secs: 1
 16     flush_sub(3)      1cpu*   01/27 10:30:01        0.7646     133695    ready
 17     flush_sub(4)     10cpu*   01/27 14:10:51        0.9511     146793    sleeping secs: 1
 18     flush_sub(5)      9cpu*   01/27 11:48:04        0.8134     138163    ready
 19     flush_sub(6)      8cpu*   01/27 14:10:51        1.3024     146762    sleeping secs: 1
 20     flush_sub(7)      1cpu*   01/27 10:30:01        0.6006     133697    ready
 21     kaio             10cpu*   01/27 13:31:28       81.8382  256688818    IO Idle
 22     aslogflush        9cpu*   01/27 11:48:04        2.4360     138162    ready
 23     btscanner_0       8cpu*   01/27 14:09:49        1.1144       9748    sleeping secs: 74
 24     readahead_0       1cpu*   01/27 10:28:59        0.2796       4203    ready
 40     defragclean       9cpu*   01/25 20:49:59        0.0593          2    terminated
 41     kaio              1cpu*   01/27 10:30:01        8.0815   26198755    IO Idle
 42     onmode_mon        1cpu*   01/27 10:30:01        2.0944     133693    ready
 43     periodic         10cpu*   01/27 14:10:51        2.7824     146790    sleeping secs: 1
 50     kaio              9cpu*   01/27 11:47:58       42.9988  153051193    IO Idle
 52     bf_priosweep()   10cpu*   01/25 20:49:57        0.0104         21    cond wait  bp_cond
 54     kaio              8cpu*   01/27 11:47:18       28.6730   91885472    IO Idle
 57     encrypt          14encryp 01/27 14:10:03        0.6065       3137    cond wait  sqcrypto
 2069   sqlexec          10cpu*   01/27 10:30:07      161.2849    2271954    cond wait  opened_up
 32531  drdaexec          1cpu*   01/27 10:30:01        3.0303      16633    running
 33064  sqlexec           9cpu*   01/27 10:30:29        0.8432       9713    cond wait  opened_up
 33177  sqlexec           1cpu*   01/27 10:29:42        0.6826        131    cond wait  netnorm
 33335  xchg_1.0         10cpu*   01/27 10:30:07        0.0006          1    cond wait  opened_up
 33336  xchg_2.0          9cpu*   01/27 10:30:07        0.5951          1    cond wait  opened_up
 33337  xchg_3.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 33344  sqlexec          10cpu*   01/27 10:30:27        0.1139        541    cond wait  opened_up
 33346  sqlexec           8cpu*   01/27 10:30:47        0.5876       2849    cond wait  opened_up
 33348  xchg_1.0         10cpu*   01/27 10:30:27        0.1960          1    cond wait  opened_up
 33349  xchg_2.0          9cpu*   01/01 04:00:00        0.0000          0    ready
 33350  mb_collector     10cpu*   01/27 10:30:58        0.2693         31    terminated
 33351  xchg_1.0          9cpu*   01/27 10:30:29        0.2689          1    cond wait  opened_up
 33352  xchg_2.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 33370  sqlexec          10cpu*   01/27 10:42:01       13.7553     200149    cond wait  opened_up
 33376  mb_collector     10cpu*   01/27 10:31:18        0.0552         32    terminated
 33377  xchg_1.0          8cpu*   01/27 10:30:47        0.0661          1    cond wait  opened_up
 33378  xchg_2.0          9cpu*   01/27 10:30:47        0.0001          1    cond wait  opened_up
 33379  xchg_3.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 33493  listen_authenti   8cpu*   01/01 04:00:00        0.0000          0    ready
 33589  sqlexec           8cpu*   01/27 10:33:50        2.7147      18033    join wait  33928
 33928  mb_collector      8cpu*   01/01 04:00:00        0.0000          0    ready
 35763  sqlexec           8cpu*   01/27 10:46:18        2.2033      17948    cond wait  opened_up
 35807  sqlexec           9cpu*   01/27 10:42:19        0.8932      15330    cond wait  opened_up
 35863  mb_collector      9cpu*   01/27 10:42:30        0.0003         30    terminated
 35864  xchg_1.0         10cpu*   01/27 10:42:01        0.0015          1    cond wait  opened_up
 35865  xchg_2.0          9cpu*   01/27 10:42:01        0.1293          1    cond wait  opened_up
 35866  xchg_3.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 35946  xchg_1.0          9cpu*   01/27 10:42:19        0.0012          1    cond wait  opened_up
 35947  xchg_2.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 36312  sqlexec           8cpu*   01/27 10:46:22       10.1838      13050    cond wait  opened_up
 36465  xchg_1.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 36468  xchg_1.0          8cpu*   01/27 10:46:22        0.0002          1    cond wait  opened_up
 36469  xchg_2.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 36478  listen_authenti   9cpu*   01/01 04:00:00        0.0000          0    ready
 36480  sqlexec           9cpu*   01/27 11:05:18       29.0862     677010    cond wait  opened_up
 36488  sqlexec           8cpu*   01/27 10:47:58        0.1761       1101    cond wait  opened_up
 36691  mb_collector      9cpu*   01/27 10:48:29        0.0009         32    terminated
 36692  xchg_1.0          8cpu*   01/27 10:47:58        0.0010          1    cond wait  opened_up
 36694  xchg_2.0         10cpu*   01/27 10:47:58        0.0016          1    cond wait  opened_up
 36695  xchg_3.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 40378  sqlexec          10cpu*   01/27 11:05:13        0.8062       5544    cond wait  opened_up
 41781  xchg_1.0         10cpu*   01/27 11:05:13        0.0001          1    cond wait  opened_up
 41782  xchg_2.0          9cpu*   01/27 11:05:13        0.0977          1    cond wait  opened_up
 41783  xchg_3.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 41792  sqlexec          10cpu*   01/27 11:07:05        5.1087      69750    cond wait  opened_up
 41803  mb_collector     10cpu*   01/27 11:05:47        0.0004         31    terminated
 41804  xchg_1.0          9cpu*   01/27 11:05:18        0.0082          1    cond wait  opened_up
 41805  xchg_2.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 42434  sqlexec           9cpu*   01/27 11:27:19       25.7104     320218    cond wait  opened_up
 42617  mb_collector      9cpu*   01/27 11:07:36        0.0014         32    terminated
 42618  xchg_1.0         10cpu*   01/27 11:07:05        0.0002          1    cond wait  opened_up
 42619  xchg_2.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 47655  sqlexec           8cpu*   01/27 11:27:21        1.1635       9005    cond wait  opened_up
 48083  mb_collector     10cpu*   01/27 11:27:49        0.0010         32    terminated
 48084  xchg_1.0          9cpu*   01/27 11:27:19        0.0010          1    cond wait  opened_up
 48085  xchg_2.0         10cpu*   01/27 11:27:19        0.0011          1    cond wait  opened_up
 48086  xchg_3.0          9cpu*   01/01 04:00:00        0.0000          0    ready
 48090  mb_collector     10cpu*   01/27 11:27:52        0.0005         32    terminated
 48091  xchg_1.0          8cpu*   01/27 11:27:21        0.1395          1    cond wait  opened_up
 48092  xchg_2.0          9cpu*   01/27 11:27:21        0.0001          1    cond wait  opened_up
 48093  xchg_3.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 48701  sqlexec          10cpu*   01/27 11:31:18        0.3596       6877    cond wait  opened_up
 48852  sqlexec           8cpu*   01/27 11:31:19        0.1054         73    cond wait  opened_up
 48934  mb_collector      8cpu*   01/27 11:31:49        0.9592         32    terminated
 48935  xchg_1.0         10cpu*   01/27 11:32:35        0.0002          1    cond wait  opened_up
 48936  xchg_1.0          8cpu*   01/01 04:00:00        0.0000          0    ready
 48959  listen_authenti   9cpu*   01/01 04:00:00        0.0000          0    ready
 48963  xchg_2.0          9cpu*   01/01 04:00:00        0.0000          0    ready
 48984  sqlexec           9cpu*   01/27 11:48:03       25.5361     319293    cond wait  netnorm
 52732  sqlexec          10cpu*   01/27 11:48:15       25.8906      38169    cond wait  opened_up
 53103  sqlexec          10cpu*   01/27 11:48:06        9.2903      28631    cond wait  opened_up
 53107  sqlexec          10cpu*   01/27 11:48:34       16.2802      21783    cond wait  netnorm
 53137  sqlexec          10cpu*   01/27 11:48:33       19.9321      29377    cond wait  netnorm
 53193  drdaexec          9cpu*   01/27 11:48:04        0.8259       3940    running
 53258  sqlexec          10cpu*   01/27 11:48:21        6.3933       6966    cond wait  netnorm
 53264  sqlexec           9cpu*   01/27 11:47:58        0.1278        756    cond wait  netnorm
 53265  sqlexec          10cpu*   01/27 11:48:26        0.0398        339    cond wait  netnorm
 53298  sqlexec          10cpu*   01/27 11:48:11        0.3216       2164    cond wait  opened_up
 53303  drdaexec          9cpu*   01/27 11:48:04        0.1547         19    cond wait  netnorm
 53304  xchg_1.0         10cpu*   01/01 04:00:00        0.0000          0    ready
 53306  xchg_1.0         10cpu*   01/01 04:00:00        0.0000          0    ready
 53307  xchg_1.0         10cpu*   01/27 11:48:15        0.0002          1    cond wait  opened_up
 53308  xchg_2.0         10cpu*   01/01 04:00:00        0.0000          0    ready
 53371  drdaexec         10cpu*   01/27 14:10:22        0.0400         50    cond wait  netnorm



из CONFIG:

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
NETTYPE soctcp,2,150,CPU
LISTEN_TIMEOUT 60
MAX_INCOMPLETE_CONNECTIONS 1024
FASTPOLL 1
NS_CACHE host=900,service=900,user=900,group=900

MULTIPROCESSOR 1
VPCLASS cpu,num=4
VP_MEMORY_CACHE_KB 0
SINGLE_CPU_VP 0

LOG_INDEX_BUILDS



команда onmode -F не выполняется.
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539011
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torero,

покажите еще onstat -k, почему-то слишком много wait-еров в выводе onstat -u
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539037
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
В 14:17 перезапустили win службу с инстансом.
В 14:26 служба остановлена. В логе не появилось ни строчки.
Запустили заново.
Вот лог информикса после запуска (захватил предыдущий запуск):
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
102.
Sat Jan 25 20:49:45 2014

20:49:45  Booting Language <c> from module <>
20:49:45  Loading Module <CNULL>
20:49:45  Booting Language <builtin> from module <>
20:49:45  Loading Module <BUILTINNULL>
20:49:51  DR: DRAUTO is 0 (Off)
20:49:51  DR: ENCRYPT_HDR is 0 (HDR encryption Disabled)
20:49:51  IBM Informix Dynamic Server Version 11.70.FC4IE Software Serial Number AAA#B000000
20:49:52  IBM Informix Dynamic Server Initialized -- Shared Memory Initialized.

20:49:52  Started 1 B-tree scanners.
20:49:52  B-tree scanner threshold set at 5000.
20:49:52  B-tree scanner range scan size set to -1.
20:49:52  B-tree scanner ALICE mode set to 6.
20:49:52  B-tree scanner index compression level set to med.
20:49:52  Physical Recovery Started at Page (1:70314).
20:49:52  Physical Recovery Complete: 0 Pages Examined, 0 Pages Restored.
20:49:52  Logical Recovery Started.
20:49:52  10 recovery worker threads will be started.
20:49:53  Logical Recovery has reached the transaction cleanup phase.
20:49:53  Logical Recovery Complete.
	  0 Committed, 0 Rolled Back, 0 Open, 0 Bad Locks

20:49:54  Dataskip is now OFF for all dbspaces
20:49:55  Init operation complete - Mode Online
20:49:56  Checkpoint Completed:  duration was 1 seconds.
20:49:56  Sat Jan 25 - loguniq 4893, logpos 0x4c7c0c0, timestamp: 0x71ab22ea Interval: 1778

20:49:56  Maximum server connections 0 
20:49:56  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 2, Llog used 1

20:49:56  On-Line Mode
20:49:57  SCHAPI: "INFORMIXDIR/etc/sysadmin/stop" file is present.
          Bypassing dbScheduler and dbWorker threads startup.
20:49:59  Defragmenter cleaner thread now running
20:49:59  Defragmenter cleaner thread cleaned:0 partitions
20:50:13  Booting Language <spl> from module <>
20:50:13  Loading Module <SPLNULL>
21:53:41  IBM Global Security Kit (GSKit) version 8.0.15.6.

Mon Jan 27 08:03:04 2014

08:03:04  Logical Log 4893 Complete, timestamp: 0x71ae4a99.
08:45:23  Logical Log 4894 Complete, timestamp: 0x71b9c905.
09:17:10  Logical Log 4895 Complete, timestamp: 0x71c74d5d.
09:54:02  Logical Log 4896 Complete, timestamp: 0x71da636b.
10:18:37  Logical Log 4897 Complete, timestamp: 0x71e569e6.
10:35:52  Logical Log 4898 Complete, timestamp: 0x71ec9221.
11:27:01  Logical Log 4899 Complete, timestamp: 0x71feb994.
14:26:54  IBM Informix Dynamic Server Started.
14:26:54  Warning: The IBM IDS Innovator-C Edition license restriction limits
14:26:54  the total shared memory size for this server to 2097152 KB.
14:26:54  The maximum allowable shared memory was reset to this size to start the database server. 

Mon Jan 27 14:26:54 2014

14:26:54  Booting Language <c> from module <>
14:26:54  Loading Module <CNULL>
14:26:54  Booting Language <builtin> from module <>
14:26:54  Loading Module <BUILTINNULL>
14:27:00  DR: DRAUTO is 0 (Off)
14:27:00  DR: ENCRYPT_HDR is 0 (HDR encryption Disabled)
14:27:01  IBM Informix Dynamic Server Version 11.70.FC4IE Software Serial Number AAA#B000000
14:27:02  IBM Informix Dynamic Server Initialized -- Shared Memory Initialized.

14:27:02  Started 1 B-tree scanners.
14:27:02  B-tree scanner threshold set at 5000.
14:27:02  B-tree scanner range scan size set to -1.
14:27:02  B-tree scanner ALICE mode set to 6.
14:27:02  B-tree scanner index compression level set to med.
14:27:02  Physical Recovery Started at Page (1:70316).
14:27:02  Physical Recovery Complete: 14043 Pages Examined, 14043 Pages Restored.
14:27:02  Logical Recovery Started.
14:27:02  10 recovery worker threads will be started.
14:27:07  Fast Recovery Switching to Log 4894
14:27:18  Fast Recovery Switching to Log 4895
14:27:26  Fast Recovery Switching to Log 4896
14:27:38  Fast Recovery Switching to Log 4897
14:27:47  Fast Recovery Switching to Log 4898
14:27:50  Fast Recovery Switching to Log 4899
14:28:00  Fast Recovery Switching to Log 4900
14:28:06  Logical Recovery has reached the transaction cleanup phase.
14:28:06  Logical Recovery Complete.
	  97932 Committed, 4 Rolled Back, 0 Open, 0 Bad Locks

14:28:06  Dataskip is now OFF for all dbspaces
14:28:06  Init operation complete - Mode Online
14:28:07  Checkpoint Completed:  duration was 0 seconds.
14:28:07  Mon Jan 27 - loguniq 4900, logpos 0x454b0c0, timestamp: 0x7206bd26 Interval: 1779

14:28:07  Maximum server connections 0 
14:28:07  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 14505, Llog used 1

14:28:07  On-Line Mode
14:28:08  SCHAPI: "INFORMIXDIR/etc/sysadmin/stop" file is present.
          Bypassing dbScheduler and dbWorker threads startup.
14:28:09  IBM Global Security Kit (GSKit) version 8.0.15.6.
14:28:11  Defragmenter cleaner thread now running
14:28:11  Defragmenter cleaner thread cleaned:0 partitions
14:28:12  Booting Language <spl> from module <>
14:28:12  Loading Module <SPLNULL>


Сервер накатил 97932 транзакции.
Откатил 4 - видимо те, кому не повезло в момент, когда мы дали onmode -c


Еще дополнительный факт:
Утром был запущен eSQLeditor.
Код: sql
1.
2.
3.
9:40:16	00:00:00.000		Connecting to Server	ol_css2	
9:57:23	00:00:00.218	169789	12 row(s) retrieved.	
11:35:22	00:00:04.446	241677	12 row(s) retrieved.	



То есть начиная с 10:45 подключения по olsoctcp не проходили, но уже подключенный eSQLeditor выполняло запросы select.

Вот ошибки клиентов:
Код: sql
1.
SQL10007N Message "ADP_ConnectTimeoutExpired" could not be retrieved.  Reason code: "4".


Код: sql
1.
2.
3.
4.
5.
6.
ERROR [HY000] [Informix .NET provider][Informix]Read error occurred during connection attempt.

=========================[Informix Error]=========================
Message :[Informix .NET provider][Informix]Read error occurred during connection attempt.
Native error :-27001
SQL state :HY000
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539067
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torero,

вам повезло, что сервер поднялся.

Какой командой глушится сервер?
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539088
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torero,

у Вас, похоже, проблемы связаны с ограничениями для бесплатной версии.
Там есть ограничения и по количеству используемой памяти, и по количеству одновременно открытых сессий
и по размеру пространств. Точнее могут сказать в техсаппорте или те, кто устанавливал Вам эту систему.

Единственное, что могу посоветовать в Вашей ситуации:
1. Сделать апгрейд на 11.70FC8IE
2. Разнести журналы, данные и индексы по разным дискам.
3. Создать временное пространство.
4. Вернуть на место параметр RTO (т.е. отключить)
5. Уменьшить количество используемой памяти
6. Уменьшить значения lru_min_dirty, lru_max_dirty
7. Изменить логику приложений, исключив дорогостоящие операции типа CREATE INDEX.
8. Если п.7 невозможен, рассмотрите возможность создания временных таблиц без журналирования
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539130
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
victor16,

системы ставили мы.

Про ограничения бесплатной версии знаем. И до этого сервер открыто нам говорил об этом.
Вот эксперименты от 20.01.2014:
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
07:54:00  Long Transaction 0x00000000B87DB258 Aborted. Rollback Duration: 7 Seconds
07:59:03  Checkpoint Completed:  duration was 0 seconds.
07:59:03  Tue Jan 21 - loguniq 4849, logpos 0x4b9a018, timestamp: 0x6eea0723 Interval: 1471

07:59:03  Maximum server connections 30 
07:59:03  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 529, Llog used 625

08:52:01  IBM Informix Dynamic Server Started.
08:52:01  Warning: The IBM IDS Innovator-C Edition license restriction limits
08:52:01  the total shared memory size for this server to 2097152 KB.
08:52:01  The maximum allowable shared memory was reset to this size to start the database server. 
08:52:01  shmget: [EEXIST][17]: key 52584801: shared memory already exists
08:52:01  mt_shm_init: can't create resident segment



1. Пытались перейти на 11.70FC7, но остановились после сообщения о баге:
http://www.sql.ru/forum/1072455/ostorozhno-bag

2. Журналы создадим.
3. Что за временное пространство? tempdbs?
4. Отключим
5. Уменьшить количество используемой памяти - то есть уменьшить буферы?
6. Уменьшить значения lru_min_dirty, lru_max_dirty. До каких для примера?
7. Временные таблицы мы всегда создаем с with no log


15:05 Однако сервер опять ушел в себя!
Пошли смотреть, что там
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539191
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_torerovictor16,
Пытались перейти на 11.70FC7, но остановились после сообщения о баге:
http://www.sql.ru/forum/1072455/ostorozhno-bag

Workaround здесь очевиден:
1. как можно быстрее закрыть транзакцию в 1-й сессии
2. Не делать insert без открытия транзакции во 2-й сессии


_toreroЧто за временное пространство? tempdbs?
Да, создавать через onspaces с опцией -t

_toreroУменьшить количество используемой памяти - то есть уменьшить буферы?
Уменьшить значения lru_min_dirty, lru_max_dirty. До каких для примера?

Все будет зависеть от длительности контрольной точки. Уменьшать параметры до приемлемой ее длительности.
На сильно нагруженных системах иногда доходило до значений 1-2 а то и меньше.

_torero15:05 Однако сервер опять ушел в себя!
Пошли смотреть, что там

Давайте посмотрим. Для начала нужен снова вывод onstat -d, onstat -g ses, onstat -u, onstat -k, onstat -l, onstat -F, onstat -g act, onstat -g rea
...
Рейтинг: 0 / 0
Сервер не дает коннектиться и пропускает чекпойнты
    #38539292
_torero
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Сразу после перезапуска он еще раз ушел в себя достаточно быстро.

Перед запуском внесли изменения в CONFIG:

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
PHYSFILE 225000

RTO_SERVER_RESTART 0
BLOCKTIMEOUT 3600

BUFFERPOOL	default,buffers=50000,lrus=8,lru_min_dirty=50.00,lru_max_dirty=60.00
BUFFERPOOL	size=4K,buffers=50000,lrus=8,lru_min_dirty=50.00,lru_max_dirty=60.00
AUTO_LRU_TUNING 1



На данный момент инстанс работает.

В 15:55 дал команду onmode -c. Чекпоинт прошел только в 16:15. Тут же дал еще раз onmode -c --- чекпоинт прошел быстро.

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
C:\INFORMIX11>onmode -c

C:\INFORMIX11>onstat -g ckp

IBM Informix Dynamic Server Version 11.70.FC4IE -- On-Line -- Up 00:42:38 -- 542208 Kbytes

AUTO_CKPTS=On   RTO_SERVER_RESTART=Off

                                                                    Critical Sections                          Physical Log    Logical Log
           Clock                                  Total Flush Block #      Ckpt  Wait  Long  # Dirty   Dskflu  Total    Avg    Total    Avg
Interval   Time      Trigger    LSN               Time  Time  Time  Waits  Time  Time  Time  Buffers   /Sec    Pages    /Sec   Pages    /Sec
1785       15:34:00  Startup    4901:0x4a140c0    0.8   0.7   0.0   0      0.0   0.0   0.0   52        52      51       0      1        0
1786       15:39:04  CKPTINTVL  4901:0x5239018    0.0   0.0   0.0   0      0.0   0.0   0.0   843       843     684      2      2085     6
1787       15:44:55  CKPTINTVL  4901:0x5b54018    0.0   0.0   0.0   0      0.0   0.0   0.0   1040      1040    932      2      2331     6
1788       16:15:48 *User       4902:0x37ae018    0.4   0.0   0.0   1      0.0   0.4   0.4   60        60      2447     1      15874    8
1789       16:16:24 *User       4902:0x38ee018    0.0   0.0   0.0   1      0.0   0.0   0.0   10        10      310      8      320      8

Max Plog       Max Llog       Max Dskflush   Avg Dskflush   Avg Dirty      Blocked
pages/sec      pages/sec      Time           pages/sec      pages/sec      Time
200            200            1              400            0              0
...
Рейтинг: 0 / 0
25 сообщений из 70, страница 1 из 3
Форумы / Informix [игнор отключен] [закрыт для гостей] / Сервер не дает коннектиться и пропускает чекпойнты
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]