powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Informix [игнор отключен] [закрыт для гостей] / IDS: PANIC: Attempting to bring system down
21 сообщений из 21, страница 1 из 1
IDS: PANIC: Attempting to bring system down
    #33826198
Julian
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Помогите разобраться - почему IDS аварийно завершается?
Informix Dynamic Server 2000 Version 9.21.UC3 + Linux.

В online.log фиксируется
Assert Failed: Exception Caught. Type: MT_EX_OS, Context: mem
после чего либо просто клиент получает ошибку, либо сервер БД прекращает работу.

Физическая память в порядке - переносили всю СУБД на резервный сервер, через пару дней та же картина, кроме того тестировали память - все OK.

Что-то в настройках?
...
Рейтинг: 0 / 0
IDS: PANIC: Attempting to bring system down
    #33827897
Середа
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
пока гуру молчат

А что если это сбой из-за утечек памяти? Или слишком большого количества сегментов разделяемой памяти используемых Информиксом?

onstat -P даст Вам представление о том какой процент памяти чем занят.
onmode -F освободит неиспользуемые ("утекающие") участки памяти.

и там в логе идут запросы на увеличение сегмента виртуальной памяти блоками по 8Мб.

что у Вас дает onstat -g seg
...
Рейтинг: 0 / 0
IDS: PANIC: Attempting to bring system down
    #33827926
Точно связано с выделением сегмента для виртуального раздела. А что так часто выделяется? - Задайте первоначальный размер большой и ограничте размером, отведенным под информикс.
...
Рейтинг: 0 / 0
IDS: PANIC: Attempting to bring system down
    #33828088
Середа
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Александр ФедоренкоТочно связано с выделением сегмента для виртуального раздела. А что так часто выделяется? - Задайте первоначальный размер большой и ограничте размером, отведенным под информикс.
А зачем ограничивать?
Если начальный сегмент будет большой - это хорошо, кстати и размер добавляемого сегмента хорошо бы сделать больше 8Мб.
Сколько памяти в системе?

Короче, пока нет конфига, онстата и параметров железа - говорить о чем-то конкретно не получится - точно. :)
...
Рейтинг: 0 / 0
IDS: PANIC: Attempting to bring system down
    #33828136
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Середа
А зачем ограничивать?
В юниксах кол-во сегментов на процесс обычно ограничено 10, т.е. обычно добавляем 8 сегментов, и падаем с ошибкой, не смог добавить сегмент.
Кто нажрал памяти смотрим onstat -g ses, зачем ему столько смотрим onstat -g ses <sesid>

К сожалению не гуру.
...
Рейтинг: 0 / 0
IDS: PANIC: Attempting to bring system down
    #33828238
onstat-
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
JulianПомогите разобраться - почему IDS аварийно завершается?
Informix Dynamic Server 2000 Version 9.21.UC3 + Linux.

В online.log фиксируется
Assert Failed: Exception Caught. Type: MT_EX_OS, Context: mem
после чего либо просто клиент получает ошибку, либо сервер БД прекращает работу.

Физическая память в порядке - переносили всю СУБД на резервный сервер, через пару дней та же картина, кроме того тестировали память - все OK.

Что-то в настройках?

Какой Linux, и какое ядро?

Если ядро ниже 2.4.21 Нужно обновлять ядро.
Или использовать настоящие сырые устройства (man raw).
У меня когда то была похожая пробелема на RH 2.1
Полечилось через создание настоящих raw devices. ( см. man raw )
И перевода базы на их использование.
Производительность возросла ~30 % и база
перестала падать с такой ошибкой.
...
Рейтинг: 0 / 0
IDS: PANIC: Attempting to bring system down
    #33828800
Выбегалло
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
JulianПомогите разобраться - почему IDS аварийно завершается?
Informix Dynamic Server 2000 Version 9.21.UC3 + Linux.

В online.log фиксируется
Assert Failed: Exception Caught. Type: MT_EX_OS, Context: mem
после чего либо просто клиент получает ошибку, либо сервер БД прекращает работу.

Физическая память в порядке - переносили всю СУБД на резервный сервер, через пару дней та же картина, кроме того тестировали память - все OK.

Что-то в настройках?

http://www.sql.ru/forum/actualthread.aspx?tid=229806
- Если это ошибка сервера (или его аварийное завершение), то очень помогают выдержки из журнала сообщений и af-файла (из последнего наиболее ценен стек упавшей нити) . Только не надо сразу высылать весь дамп - он может быть очень большим по размеру;
...
Рейтинг: 0 / 0
IDS: PANIC: Attempting to bring system down
    #33828862
дейт
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
2выбегалло, там аттач в первом посте и стек тоже есть.
...
Рейтинг: 0 / 0
IDS: PANIC: Attempting to bring system down
    #33828879
Выбегалло
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
дейт2выбегалло, там аттач в первом посте и стек тоже есть.

у меня winrar-а нет.
...
Рейтинг: 0 / 0
IDS: PANIC: Attempting to bring system down
    #33828919
Julian
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
На количество сегментов мы думали, но вроде сообщение об ошибке должно быть другим. Попробуем увеличить начальный размер.

/opt/informix/bin/onstat -g seg:

Informix Dynamic Server 2000 Version 9.21.UC3 -- On-Line -- Up 14:44:53 -- 345272 Kbytes

Segment Summary:
id key addr size ovhd class blkused blkfree
4816896 1381386241 10000000 278257664 223264 R 67906 28
5111817 1381386250 2095e000 8192000 856 V 2000 0
5144586 1381386251 2112e000 663552 624 M 132 30
5177355 1381386252 211d0000 8388608 856 V 2047 1
5210124 1381386253 219d0000 8388608 856 V 2027 21
5242893 1381386254 221d0000 8388608 856 V 2043 5
5275662 1381386255 229d0000 8388608 856 V 2024 24
5308431 1381386256 231d0000 8388608 856 V 1933 115
5341200 1381386257 239d0000 8388608 856 V 1804 244
5373969 1381386258 241d0000 8388608 856 V 1801 247
5406738 1381386259 249d0000 8388608 856 V 207 1841
Total: - - 354222080 - - 83924 2556

(* segment locked in memory)

Всего памяти 1G.
Linux Red Hat с ядром 2.4 (абсолютно точно следующие цифры после точки
пока не могу сказать, т.к. сижу удаленно и и сейчас нет доступа к серверу).
Все dbspace и так на raw device (настоящие и ненастоящие - это как?).

На всякий случай повторяю прицеп в zip, но при этом не укладываюсь
в отведенный максимум 70K, из-за чего - две части (вторая, возможно, и
лишняя, просто для полноты).
...
Рейтинг: 0 / 0
IDS: PANIC: Attempting to bring system down
    #33828920
Julian
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Остаток прицепа:
...
Рейтинг: 0 / 0
IDS: PANIC: Attempting to bring system down
    #33828929
Выбегалло
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
JulianНа количество сегментов мы думали, но вроде сообщение об ошибке должно быть другим. Попробуем увеличить начальный размер.

/opt/informix/bin/onstat -g seg:

Informix Dynamic Server 2000 Version 9.21.UC3 -- On-Line -- Up 14:44:53 -- 345272 Kbytes

Segment Summary:
id key addr size ovhd class blkused blkfree
4816896 1381386241 10000000 278257664 223264 R 67906 28
5111817 1381386250 2095e000 8192000 856 V 2000 0
5144586 1381386251 2112e000 663552 624 M 132 30
5177355 1381386252 211d0000 8388608 856 V 2047 1
5210124 1381386253 219d0000 8388608 856 V 2027 21
5242893 1381386254 221d0000 8388608 856 V 2043 5
5275662 1381386255 229d0000 8388608 856 V 2024 24
5308431 1381386256 231d0000 8388608 856 V 1933 115
5341200 1381386257 239d0000 8388608 856 V 1804 244
5373969 1381386258 241d0000 8388608 856 V 1801 247
5406738 1381386259 249d0000 8388608 856 V 207 1841
Total: - - 354222080 - - 83924 2556

(* segment locked in memory)

Всего памяти 1G.
Linux Red Hat с ядром 2.4 (абсолютно точно следующие цифры после точки
пока не могу сказать, т.к. сижу удаленно и и сейчас нет доступа к серверу).
Все dbspace и так на raw device (настоящие и ненастоящие - это как?).

На всякий случай повторяю прицеп в zip, но при этом не укладываюсь
в отведенный максимум 70K, из-за чего - две части (вторая, возможно, и
лишняя, просто для полноты).

Количество сегментов тут ни при чем. Сервер упал через минуту после выделения последнего сегмента.
Чем занята упавшая нить ? выполнением процедуры Price_Injunction


Last parsed SQL statement :
execute PROCEDURE Price_Injunction ( ? , ? )

User-created Temp tables :
partnum tabname rowsize
300007 inj_price_tmp 94
300007 inj_price_tmp 94
30000e print_appl_tmp 74
300007 inj_price_tmp 94
30000f print_appl_tmp 74
30000b weight_tmp 173
30000a print_protocol_tmp 34
30000f print_model_tmp 44
300007 inj_price_tmp 94
30000b weight_tmp 173
30000a print_protocol_tmp 34
300009 print_registr_tmp 51

Где именно в теле процедуры ? Где-то после создания таблиц print_appl_tmp, print_model_tmp . Что именно не нравится ? Выражение с преобразованием типов (кастингом), потому что стек выглядит
0x084f404f (oninit)afsig_handler(0xb, 0x2262a350, 0x2262a3d0, 0x24408440, 0x818f508, 0x2262a700)
0x4003da35 (*nosymtab*)0x4003da35(0xb, 0x2262a350, 0x2262a3d0, 0xb, 0x0, 0x1)
0x400cc840 (*nosymtab*)0x400cc840(0x2262a780, 0x0, 0x21c9a150, 0x2262a75c, 0x2262a780, 0x2262a704)
0x08150a2d (oninit)find_celist(0x21c9a150, 0x2262a780, 0x818f508, 0x2262a700, 0x247bdef0, 0x2262a760)
0x08150b39 (oninit)retrieve_rrcache(0x4, 0x2262a780, 0x2262a75c, 0x0, 0x818f298, 0x0)
0x0818f7ce (oninit)getcastinfo(0x2262a8e4, 0x2262a8f8, 0x2262a8b8, 0x2262a8f8, 0x2262a8e4, 0x2262a8b8)
0x0818b8be (oninit)getcast2(0x2262a8e4, 0x2262a8f8, 0x2262a8b8, 0x2262a850, 0x0, 0x0)
0x0818b52f (oninit)getcast (0x2262a8e4, 0x2262a8f8, 0x2262a8b8, 0x23ae1410, 0x23be8270, 0x0)
0x0812a0c1 (oninit)mkcastexpr(0x23be8270, 0x23be82b0, 0x49, 0x2262aa54, 0x23492710, 0x18)
0x08140660 (oninit)ip_doimplicit(0x23be8270, 0x23ae1410, 0x18, 0x0, 0x0, 0x244e9a18)
0x08140ac5 (oninit)ip_exprparse(0x244f5650, 0x23ae1410, 0x0, 0x23ae1410, 0x0, 0x244e9a18)
0x0813f9a9 (oninit)ip_evalexpr(0x23ae1410, 0x244f5650, 0x60220, 0x23ae10a0, 0x2, 0x21c9a0a0)
0x0813eb37 (oninit)runproc (0x2262ad08, 0x2262ad0c, 0x21c9a0a0, 0x23ae10a0, 0x23ae1238, 0x2262ad58

runproc - запустить процедуру,
...
ip_doimplicit - выполнить неявное преобразование типов,
getcast, getcast2, getcastinfo - входы в процедуры кастинга, потом сервер зачем-то лезет в (специализированный ) кэш ( retrieve_rrcache ), затем ищет какой-то список (find_celist) - и здесь грохается. afsig_handler - это уже обработка assert failure.
Так что, если вам сильно интересно, то трахайте процедуру Price_Injunction - ищите место где в ней падает и пытайтесь найти workaround. Ну или проапдейтесь до более свежей версии, 9.21.UC3 исполнилось сто лет в обед.
...
Рейтинг: 0 / 0
IDS: PANIC: Attempting to bring system down
    #33829208
Фотография Daugava
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
У меня это "любимый" баг. С выделением сегментов памяти не связан (у меня ее более,чем достаточно хватает захваченных в момент запуска). Даже если новый сегмент выделился под что-то не типичиное, до до падения сервера иногда проходят месяца. Единственная закономерность у меня - падение происходит на процедурах (при этом выполнение update statistics for procedure в этот момент сильно повышает вероятность падения), хотя у некоторых граждан с аналогичными симптомами сервер заваливала нить ontape-а, формировавшая архив Level-0, при прочей нулевой нагрузке.
У меня сие начало проявляться после апгрейда с 7.2 на 7.3, после перехода на 9-ку стал намного реже (раз 5 в год), но все равно не ушел. Апгрейдиться с 9.21.UC2 Solaris X86 мне не куда.
...
Рейтинг: 0 / 0
IDS: PANIC: Attempting to bring system down
    #33829287
onstat-
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Julian

Всего памяти 1G.
Linux Red Hat с ядром 2.4 (абсолютно точно следующие цифры после точки
пока не могу сказать, т.к. сижу удаленно и и сейчас нет доступа к серверу).
Все dbspace и так на raw device (настоящие и ненастоящие - это как?).



Я наверное не правильно выразился, под настоящими я имeл ввиду

#ls -al
crw-rw---- 1 informix informix 8, 224 May 28 03:30 /dev/raw/ids_data000

Другими словами они называются raw character special device.

Старые ядра для блочных устройств используют буферизацию.
И при активном вводе выводе базы манагеру виртуальной памяти OC
через пару тройку дней сносило крышу .
В этом случае либо ОС 90% процессороного времени
находилась в обработке системных вызовов( syscpu),
либо база падала с ошибкой похожей на вашу.
Такую картину я наблюдал на RH AS 2.1. (ядро 2.4.9.....)
...
Рейтинг: 0 / 0
IDS: PANIC: Attempting to bring system down
    #33831066
Paul Tatarenko
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
DaugavaАпгрейдиться с 9.21.UC2 Solaris X86 мне не куда.
еще есть UC4 ... :)
...
Рейтинг: 0 / 0
IDS: PANIC: Attempting to bring system down
    #33831486
Julian
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Размер начального сегмента SHMVIRTSIZE увеличен в onconfig.rc с 8000 до 96000.
Не помогло.

2Выбегалло

Спасибо.
Однако по нескольким af.* видно, что

1.
После фиксирования в online.log ошибки
"
10:28:06 Assert Failed: Exception Caught. Type: MT_EX_OS, Context: mem
"
IDS может продолжать работу, а может и свалиться. В прицепах выше видно, что он погиб после второй ошибки. Бывает, что после первой, бывает - после третьей. (Кстати, еслии не сваливается, то начинает очень сильно тормозить,
причем некоторые сессии невозможно выкинуть по onmode -z sessid).

2.
Бывает, что срубается и не из-за CAST.

3.
Ошибки возникают на разных процедурах.

Все это видно в пример1 и пример2.

4.
Иногда ошибка возникает не в процедуре, а в SELECT, который не меняется уже пару лет и вызывается очень часто.
пример3.

В общем, все нормально работало годами, но последних пару месяцев стал срубаться вервер БД раз в несколько дней (при переносе БД на резервный -
та же картина).
Система развивается обычным образом - меняются/добавляются процедуры и клиенты.
Поэтому я и думаю, что или перестали отвечать нуждам системы настройки,
или появилась какая-то ошибка в БД (процедурах, структурах данных?).
Непонято, где копать.
...
Рейтинг: 0 / 0
IDS: PANIC: Attempting to bring system down
    #33831488
Julian
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Red Hat 7.2
kernel 2.4.7-10 Enterprice.
...
Рейтинг: 0 / 0
IDS: PANIC: Attempting to bring system down
    #33831504
Выбегалло
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Если вы внимательно всмотритесь в текст селекта в примере 3, то увидите вызов функции Injunction_Person.
Грохается в связи с этим самым rrcache - то на find_celist, то на find_celist->checkcast->cmprid. Есть на udrlm_spl_execute, что не совсем понятно. Но это все а) баги и б) лечится только переходом на новые версии.

В таком вот аксепте
...
Рейтинг: 0 / 0
IDS: PANIC: Attempting to bring system down
    #33831775
Фотография Daugava
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Paul Tatarenko DaugavaАпгрейдиться с 9.21.UC2 Solaris X86 мне не куда.
еще есть UC4 ... :)
Если бы существовал хотя бы UC5, в котором вроде полечили "very old pages" при backup level-0, то апгрейд имел бы смысл. А так менять шило на мыло смысла не вижу, насколько я помню, у вас на UC4 были теже проблемы, что и у меня.
...
Рейтинг: 0 / 0
IDS: PANIC: Attempting to bring system down
    #33832876
Paul Tatarenko
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Daugava... шило на мыло...
угу
...
Рейтинг: 0 / 0
IDS: PANIC: Attempting to bring system down
    #33860172
tsadss
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
После перехода на Informix 9.40.UC6 сервер в течение 7 дней работает стабильно при той же нагрузке и при выполнении тех же задач - скорее всего падал из-за багов Informix 9.21.UC3.

Всем большое спасибо!
...
Рейтинг: 0 / 0
21 сообщений из 21, страница 1 из 1
Форумы / Informix [игнор отключен] [закрыт для гостей] / IDS: PANIC: Attempting to bring system down
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]