|
|
|
IDS: PANIC: Attempting to bring system down
|
|||
|---|---|---|---|
|
#18+
Помогите разобраться - почему IDS аварийно завершается? Informix Dynamic Server 2000 Version 9.21.UC3 + Linux. В online.log фиксируется Assert Failed: Exception Caught. Type: MT_EX_OS, Context: mem после чего либо просто клиент получает ошибку, либо сервер БД прекращает работу. Физическая память в порядке - переносили всю СУБД на резервный сервер, через пару дней та же картина, кроме того тестировали память - все OK. Что-то в настройках? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.07.2006, 16:57 |
|
||
|
IDS: PANIC: Attempting to bring system down
|
|||
|---|---|---|---|
|
#18+
пока гуру молчат А что если это сбой из-за утечек памяти? Или слишком большого количества сегментов разделяемой памяти используемых Информиксом? onstat -P даст Вам представление о том какой процент памяти чем занят. onmode -F освободит неиспользуемые ("утекающие") участки памяти. и там в логе идут запросы на увеличение сегмента виртуальной памяти блоками по 8Мб. что у Вас дает onstat -g seg ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.07.2006, 15:38 |
|
||
|
IDS: PANIC: Attempting to bring system down
|
|||
|---|---|---|---|
|
#18+
Точно связано с выделением сегмента для виртуального раздела. А что так часто выделяется? - Задайте первоначальный размер большой и ограничте размером, отведенным под информикс. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.07.2006, 15:47 |
|
||
|
IDS: PANIC: Attempting to bring system down
|
|||
|---|---|---|---|
|
#18+
Александр ФедоренкоТочно связано с выделением сегмента для виртуального раздела. А что так часто выделяется? - Задайте первоначальный размер большой и ограничте размером, отведенным под информикс. А зачем ограничивать? Если начальный сегмент будет большой - это хорошо, кстати и размер добавляемого сегмента хорошо бы сделать больше 8Мб. Сколько памяти в системе? Короче, пока нет конфига, онстата и параметров железа - говорить о чем-то конкретно не получится - точно. :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.07.2006, 16:25 |
|
||
|
IDS: PANIC: Attempting to bring system down
|
|||
|---|---|---|---|
|
#18+
Середа А зачем ограничивать? В юниксах кол-во сегментов на процесс обычно ограничено 10, т.е. обычно добавляем 8 сегментов, и падаем с ошибкой, не смог добавить сегмент. Кто нажрал памяти смотрим onstat -g ses, зачем ему столько смотрим onstat -g ses <sesid> К сожалению не гуру. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.07.2006, 16:35 |
|
||
|
IDS: PANIC: Attempting to bring system down
|
|||
|---|---|---|---|
|
#18+
JulianПомогите разобраться - почему IDS аварийно завершается? Informix Dynamic Server 2000 Version 9.21.UC3 + Linux. В online.log фиксируется Assert Failed: Exception Caught. Type: MT_EX_OS, Context: mem после чего либо просто клиент получает ошибку, либо сервер БД прекращает работу. Физическая память в порядке - переносили всю СУБД на резервный сервер, через пару дней та же картина, кроме того тестировали память - все OK. Что-то в настройках? Какой Linux, и какое ядро? Если ядро ниже 2.4.21 Нужно обновлять ядро. Или использовать настоящие сырые устройства (man raw). У меня когда то была похожая пробелема на RH 2.1 Полечилось через создание настоящих raw devices. ( см. man raw ) И перевода базы на их использование. Производительность возросла ~30 % и база перестала падать с такой ошибкой. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.07.2006, 17:03 |
|
||
|
IDS: PANIC: Attempting to bring system down
|
|||
|---|---|---|---|
|
#18+
JulianПомогите разобраться - почему IDS аварийно завершается? Informix Dynamic Server 2000 Version 9.21.UC3 + Linux. В online.log фиксируется Assert Failed: Exception Caught. Type: MT_EX_OS, Context: mem после чего либо просто клиент получает ошибку, либо сервер БД прекращает работу. Физическая память в порядке - переносили всю СУБД на резервный сервер, через пару дней та же картина, кроме того тестировали память - все OK. Что-то в настройках? http://www.sql.ru/forum/actualthread.aspx?tid=229806 - Если это ошибка сервера (или его аварийное завершение), то очень помогают выдержки из журнала сообщений и af-файла (из последнего наиболее ценен стек упавшей нити) . Только не надо сразу высылать весь дамп - он может быть очень большим по размеру; ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.07.2006, 21:51 |
|
||
|
IDS: PANIC: Attempting to bring system down
|
|||
|---|---|---|---|
|
#18+
2выбегалло, там аттач в первом посте и стек тоже есть. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.07.2006, 22:59 |
|
||
|
IDS: PANIC: Attempting to bring system down
|
|||
|---|---|---|---|
|
#18+
дейт2выбегалло, там аттач в первом посте и стек тоже есть. у меня winrar-а нет. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.07.2006, 23:34 |
|
||
|
IDS: PANIC: Attempting to bring system down
|
|||
|---|---|---|---|
|
#18+
На количество сегментов мы думали, но вроде сообщение об ошибке должно быть другим. Попробуем увеличить начальный размер. /opt/informix/bin/onstat -g seg: Informix Dynamic Server 2000 Version 9.21.UC3 -- On-Line -- Up 14:44:53 -- 345272 Kbytes Segment Summary: id key addr size ovhd class blkused blkfree 4816896 1381386241 10000000 278257664 223264 R 67906 28 5111817 1381386250 2095e000 8192000 856 V 2000 0 5144586 1381386251 2112e000 663552 624 M 132 30 5177355 1381386252 211d0000 8388608 856 V 2047 1 5210124 1381386253 219d0000 8388608 856 V 2027 21 5242893 1381386254 221d0000 8388608 856 V 2043 5 5275662 1381386255 229d0000 8388608 856 V 2024 24 5308431 1381386256 231d0000 8388608 856 V 1933 115 5341200 1381386257 239d0000 8388608 856 V 1804 244 5373969 1381386258 241d0000 8388608 856 V 1801 247 5406738 1381386259 249d0000 8388608 856 V 207 1841 Total: - - 354222080 - - 83924 2556 (* segment locked in memory) Всего памяти 1G. Linux Red Hat с ядром 2.4 (абсолютно точно следующие цифры после точки пока не могу сказать, т.к. сижу удаленно и и сейчас нет доступа к серверу). Все dbspace и так на raw device (настоящие и ненастоящие - это как?). На всякий случай повторяю прицеп в zip, но при этом не укладываюсь в отведенный максимум 70K, из-за чего - две части (вторая, возможно, и лишняя, просто для полноты). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.07.2006, 01:45 |
|
||
|
IDS: PANIC: Attempting to bring system down
|
|||
|---|---|---|---|
|
#18+
Остаток прицепа: ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.07.2006, 01:46 |
|
||
|
IDS: PANIC: Attempting to bring system down
|
|||
|---|---|---|---|
|
#18+
JulianНа количество сегментов мы думали, но вроде сообщение об ошибке должно быть другим. Попробуем увеличить начальный размер. /opt/informix/bin/onstat -g seg: Informix Dynamic Server 2000 Version 9.21.UC3 -- On-Line -- Up 14:44:53 -- 345272 Kbytes Segment Summary: id key addr size ovhd class blkused blkfree 4816896 1381386241 10000000 278257664 223264 R 67906 28 5111817 1381386250 2095e000 8192000 856 V 2000 0 5144586 1381386251 2112e000 663552 624 M 132 30 5177355 1381386252 211d0000 8388608 856 V 2047 1 5210124 1381386253 219d0000 8388608 856 V 2027 21 5242893 1381386254 221d0000 8388608 856 V 2043 5 5275662 1381386255 229d0000 8388608 856 V 2024 24 5308431 1381386256 231d0000 8388608 856 V 1933 115 5341200 1381386257 239d0000 8388608 856 V 1804 244 5373969 1381386258 241d0000 8388608 856 V 1801 247 5406738 1381386259 249d0000 8388608 856 V 207 1841 Total: - - 354222080 - - 83924 2556 (* segment locked in memory) Всего памяти 1G. Linux Red Hat с ядром 2.4 (абсолютно точно следующие цифры после точки пока не могу сказать, т.к. сижу удаленно и и сейчас нет доступа к серверу). Все dbspace и так на raw device (настоящие и ненастоящие - это как?). На всякий случай повторяю прицеп в zip, но при этом не укладываюсь в отведенный максимум 70K, из-за чего - две части (вторая, возможно, и лишняя, просто для полноты). Количество сегментов тут ни при чем. Сервер упал через минуту после выделения последнего сегмента. Чем занята упавшая нить ? выполнением процедуры Price_Injunction Last parsed SQL statement : execute PROCEDURE Price_Injunction ( ? , ? ) User-created Temp tables : partnum tabname rowsize 300007 inj_price_tmp 94 300007 inj_price_tmp 94 30000e print_appl_tmp 74 300007 inj_price_tmp 94 30000f print_appl_tmp 74 30000b weight_tmp 173 30000a print_protocol_tmp 34 30000f print_model_tmp 44 300007 inj_price_tmp 94 30000b weight_tmp 173 30000a print_protocol_tmp 34 300009 print_registr_tmp 51 Где именно в теле процедуры ? Где-то после создания таблиц print_appl_tmp, print_model_tmp . Что именно не нравится ? Выражение с преобразованием типов (кастингом), потому что стек выглядит 0x084f404f (oninit)afsig_handler(0xb, 0x2262a350, 0x2262a3d0, 0x24408440, 0x818f508, 0x2262a700) 0x4003da35 (*nosymtab*)0x4003da35(0xb, 0x2262a350, 0x2262a3d0, 0xb, 0x0, 0x1) 0x400cc840 (*nosymtab*)0x400cc840(0x2262a780, 0x0, 0x21c9a150, 0x2262a75c, 0x2262a780, 0x2262a704) 0x08150a2d (oninit)find_celist(0x21c9a150, 0x2262a780, 0x818f508, 0x2262a700, 0x247bdef0, 0x2262a760) 0x08150b39 (oninit)retrieve_rrcache(0x4, 0x2262a780, 0x2262a75c, 0x0, 0x818f298, 0x0) 0x0818f7ce (oninit)getcastinfo(0x2262a8e4, 0x2262a8f8, 0x2262a8b8, 0x2262a8f8, 0x2262a8e4, 0x2262a8b8) 0x0818b8be (oninit)getcast2(0x2262a8e4, 0x2262a8f8, 0x2262a8b8, 0x2262a850, 0x0, 0x0) 0x0818b52f (oninit)getcast (0x2262a8e4, 0x2262a8f8, 0x2262a8b8, 0x23ae1410, 0x23be8270, 0x0) 0x0812a0c1 (oninit)mkcastexpr(0x23be8270, 0x23be82b0, 0x49, 0x2262aa54, 0x23492710, 0x18) 0x08140660 (oninit)ip_doimplicit(0x23be8270, 0x23ae1410, 0x18, 0x0, 0x0, 0x244e9a18) 0x08140ac5 (oninit)ip_exprparse(0x244f5650, 0x23ae1410, 0x0, 0x23ae1410, 0x0, 0x244e9a18) 0x0813f9a9 (oninit)ip_evalexpr(0x23ae1410, 0x244f5650, 0x60220, 0x23ae10a0, 0x2, 0x21c9a0a0) 0x0813eb37 (oninit)runproc (0x2262ad08, 0x2262ad0c, 0x21c9a0a0, 0x23ae10a0, 0x23ae1238, 0x2262ad58 runproc - запустить процедуру, ... ip_doimplicit - выполнить неявное преобразование типов, getcast, getcast2, getcastinfo - входы в процедуры кастинга, потом сервер зачем-то лезет в (специализированный ) кэш ( retrieve_rrcache ), затем ищет какой-то список (find_celist) - и здесь грохается. afsig_handler - это уже обработка assert failure. Так что, если вам сильно интересно, то трахайте процедуру Price_Injunction - ищите место где в ней падает и пытайтесь найти workaround. Ну или проапдейтесь до более свежей версии, 9.21.UC3 исполнилось сто лет в обед. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.07.2006, 04:01 |
|
||
|
IDS: PANIC: Attempting to bring system down
|
|||
|---|---|---|---|
|
#18+
У меня это "любимый" баг. С выделением сегментов памяти не связан (у меня ее более,чем достаточно хватает захваченных в момент запуска). Даже если новый сегмент выделился под что-то не типичиное, до до падения сервера иногда проходят месяца. Единственная закономерность у меня - падение происходит на процедурах (при этом выполнение update statistics for procedure в этот момент сильно повышает вероятность падения), хотя у некоторых граждан с аналогичными симптомами сервер заваливала нить ontape-а, формировавшая архив Level-0, при прочей нулевой нагрузке. У меня сие начало проявляться после апгрейда с 7.2 на 7.3, после перехода на 9-ку стал намного реже (раз 5 в год), но все равно не ушел. Апгрейдиться с 9.21.UC2 Solaris X86 мне не куда. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.07.2006, 10:05 |
|
||
|
IDS: PANIC: Attempting to bring system down
|
|||
|---|---|---|---|
|
#18+
Julian Всего памяти 1G. Linux Red Hat с ядром 2.4 (абсолютно точно следующие цифры после точки пока не могу сказать, т.к. сижу удаленно и и сейчас нет доступа к серверу). Все dbspace и так на raw device (настоящие и ненастоящие - это как?). Я наверное не правильно выразился, под настоящими я имeл ввиду #ls -al crw-rw---- 1 informix informix 8, 224 May 28 03:30 /dev/raw/ids_data000 Другими словами они называются raw character special device. Старые ядра для блочных устройств используют буферизацию. И при активном вводе выводе базы манагеру виртуальной памяти OC через пару тройку дней сносило крышу . В этом случае либо ОС 90% процессороного времени находилась в обработке системных вызовов( syscpu), либо база падала с ошибкой похожей на вашу. Такую картину я наблюдал на RH AS 2.1. (ядро 2.4.9.....) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.07.2006, 10:27 |
|
||
|
IDS: PANIC: Attempting to bring system down
|
|||
|---|---|---|---|
|
#18+
DaugavaАпгрейдиться с 9.21.UC2 Solaris X86 мне не куда. еще есть UC4 ... :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.07.2006, 18:13 |
|
||
|
IDS: PANIC: Attempting to bring system down
|
|||
|---|---|---|---|
|
#18+
Размер начального сегмента SHMVIRTSIZE увеличен в onconfig.rc с 8000 до 96000. Не помогло. 2Выбегалло Спасибо. Однако по нескольким af.* видно, что 1. После фиксирования в online.log ошибки " 10:28:06 Assert Failed: Exception Caught. Type: MT_EX_OS, Context: mem " IDS может продолжать работу, а может и свалиться. В прицепах выше видно, что он погиб после второй ошибки. Бывает, что после первой, бывает - после третьей. (Кстати, еслии не сваливается, то начинает очень сильно тормозить, причем некоторые сессии невозможно выкинуть по onmode -z sessid). 2. Бывает, что срубается и не из-за CAST. 3. Ошибки возникают на разных процедурах. Все это видно в пример1 и пример2. 4. Иногда ошибка возникает не в процедуре, а в SELECT, который не меняется уже пару лет и вызывается очень часто. пример3. В общем, все нормально работало годами, но последних пару месяцев стал срубаться вервер БД раз в несколько дней (при переносе БД на резервный - та же картина). Система развивается обычным образом - меняются/добавляются процедуры и клиенты. Поэтому я и думаю, что или перестали отвечать нуждам системы настройки, или появилась какая-то ошибка в БД (процедурах, структурах данных?). Непонято, где копать. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.07.2006, 23:39 |
|
||
|
IDS: PANIC: Attempting to bring system down
|
|||
|---|---|---|---|
|
#18+
Red Hat 7.2 kernel 2.4.7-10 Enterprice. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.07.2006, 23:41 |
|
||
|
IDS: PANIC: Attempting to bring system down
|
|||
|---|---|---|---|
|
#18+
Если вы внимательно всмотритесь в текст селекта в примере 3, то увидите вызов функции Injunction_Person. Грохается в связи с этим самым rrcache - то на find_celist, то на find_celist->checkcast->cmprid. Есть на udrlm_spl_execute, что не совсем понятно. Но это все а) баги и б) лечится только переходом на новые версии. В таком вот аксепте ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.07.2006, 00:39 |
|
||
|
IDS: PANIC: Attempting to bring system down
|
|||
|---|---|---|---|
|
#18+
Paul Tatarenko DaugavaАпгрейдиться с 9.21.UC2 Solaris X86 мне не куда. еще есть UC4 ... :) Если бы существовал хотя бы UC5, в котором вроде полечили "very old pages" при backup level-0, то апгрейд имел бы смысл. А так менять шило на мыло смысла не вижу, насколько я помню, у вас на UC4 были теже проблемы, что и у меня. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.07.2006, 09:57 |
|
||
|
IDS: PANIC: Attempting to bring system down
|
|||
|---|---|---|---|
|
#18+
Daugava... шило на мыло... угу ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.07.2006, 14:29 |
|
||
|
IDS: PANIC: Attempting to bring system down
|
|||
|---|---|---|---|
|
#18+
После перехода на Informix 9.40.UC6 сервер в течение 7 дней работает стабильно при той же нагрузке и при выполнении тех же задач - скорее всего падал из-за багов Informix 9.21.UC3. Всем большое спасибо! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.07.2006, 11:55 |
|
||
|
|

start [/forum/topic.php?fid=44&msg=33826198&tid=1608626]: |
0ms |
get settings: |
6ms |
get forum list: |
11ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
151ms |
get topic data: |
8ms |
get forum data: |
2ms |
get page messages: |
44ms |
get tp. blocked users: |
1ms |
| others: | 196ms |
| total: | 423ms |

| 0 / 0 |
