Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Informix [игнор отключен] [закрыт для гостей] / IDS: PANIC: Attempting to bring system down / 21 сообщений из 21, страница 1 из 1
02.07.2006, 16:57
    #33826198
Julian
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS: PANIC: Attempting to bring system down
Помогите разобраться - почему IDS аварийно завершается?
Informix Dynamic Server 2000 Version 9.21.UC3 + Linux.

В online.log фиксируется
Assert Failed: Exception Caught. Type: MT_EX_OS, Context: mem
после чего либо просто клиент получает ошибку, либо сервер БД прекращает работу.

Физическая память в порядке - переносили всю СУБД на резервный сервер, через пару дней та же картина, кроме того тестировали память - все OK.

Что-то в настройках?
...
Рейтинг: 0 / 0
03.07.2006, 15:38
    #33827897
Середа
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS: PANIC: Attempting to bring system down
пока гуру молчат

А что если это сбой из-за утечек памяти? Или слишком большого количества сегментов разделяемой памяти используемых Информиксом?

onstat -P даст Вам представление о том какой процент памяти чем занят.
onmode -F освободит неиспользуемые ("утекающие") участки памяти.

и там в логе идут запросы на увеличение сегмента виртуальной памяти блоками по 8Мб.

что у Вас дает onstat -g seg
...
Рейтинг: 0 / 0
03.07.2006, 15:47
    #33827926
IDS: PANIC: Attempting to bring system down
Точно связано с выделением сегмента для виртуального раздела. А что так часто выделяется? - Задайте первоначальный размер большой и ограничте размером, отведенным под информикс.
...
Рейтинг: 0 / 0
03.07.2006, 16:25
    #33828088
Середа
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS: PANIC: Attempting to bring system down
Александр ФедоренкоТочно связано с выделением сегмента для виртуального раздела. А что так часто выделяется? - Задайте первоначальный размер большой и ограничте размером, отведенным под информикс.
А зачем ограничивать?
Если начальный сегмент будет большой - это хорошо, кстати и размер добавляемого сегмента хорошо бы сделать больше 8Мб.
Сколько памяти в системе?

Короче, пока нет конфига, онстата и параметров железа - говорить о чем-то конкретно не получится - точно. :)
...
Рейтинг: 0 / 0
03.07.2006, 16:35
    #33828136
Журавлев Денис
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS: PANIC: Attempting to bring system down
Середа
А зачем ограничивать?
В юниксах кол-во сегментов на процесс обычно ограничено 10, т.е. обычно добавляем 8 сегментов, и падаем с ошибкой, не смог добавить сегмент.
Кто нажрал памяти смотрим onstat -g ses, зачем ему столько смотрим onstat -g ses <sesid>

К сожалению не гуру.
...
Рейтинг: 0 / 0
03.07.2006, 17:03
    #33828238
onstat-
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS: PANIC: Attempting to bring system down
JulianПомогите разобраться - почему IDS аварийно завершается?
Informix Dynamic Server 2000 Version 9.21.UC3 + Linux.

В online.log фиксируется
Assert Failed: Exception Caught. Type: MT_EX_OS, Context: mem
после чего либо просто клиент получает ошибку, либо сервер БД прекращает работу.

Физическая память в порядке - переносили всю СУБД на резервный сервер, через пару дней та же картина, кроме того тестировали память - все OK.

Что-то в настройках?

Какой Linux, и какое ядро?

Если ядро ниже 2.4.21 Нужно обновлять ядро.
Или использовать настоящие сырые устройства (man raw).
У меня когда то была похожая пробелема на RH 2.1
Полечилось через создание настоящих raw devices. ( см. man raw )
И перевода базы на их использование.
Производительность возросла ~30 % и база
перестала падать с такой ошибкой.
...
Рейтинг: 0 / 0
03.07.2006, 21:51
    #33828800
Выбегалло
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS: PANIC: Attempting to bring system down
JulianПомогите разобраться - почему IDS аварийно завершается?
Informix Dynamic Server 2000 Version 9.21.UC3 + Linux.

В online.log фиксируется
Assert Failed: Exception Caught. Type: MT_EX_OS, Context: mem
после чего либо просто клиент получает ошибку, либо сервер БД прекращает работу.

Физическая память в порядке - переносили всю СУБД на резервный сервер, через пару дней та же картина, кроме того тестировали память - все OK.

Что-то в настройках?

http://www.sql.ru/forum/actualthread.aspx?tid=229806
- Если это ошибка сервера (или его аварийное завершение), то очень помогают выдержки из журнала сообщений и af-файла (из последнего наиболее ценен стек упавшей нити) . Только не надо сразу высылать весь дамп - он может быть очень большим по размеру;
...
Рейтинг: 0 / 0
03.07.2006, 22:59
    #33828862
дейт
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS: PANIC: Attempting to bring system down
2выбегалло, там аттач в первом посте и стек тоже есть.
...
Рейтинг: 0 / 0
03.07.2006, 23:34
    #33828879
Выбегалло
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS: PANIC: Attempting to bring system down
дейт2выбегалло, там аттач в первом посте и стек тоже есть.

у меня winrar-а нет.
...
Рейтинг: 0 / 0
04.07.2006, 01:45
    #33828919
Julian
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS: PANIC: Attempting to bring system down
На количество сегментов мы думали, но вроде сообщение об ошибке должно быть другим. Попробуем увеличить начальный размер.

/opt/informix/bin/onstat -g seg:

Informix Dynamic Server 2000 Version 9.21.UC3 -- On-Line -- Up 14:44:53 -- 345272 Kbytes

Segment Summary:
id key addr size ovhd class blkused blkfree
4816896 1381386241 10000000 278257664 223264 R 67906 28
5111817 1381386250 2095e000 8192000 856 V 2000 0
5144586 1381386251 2112e000 663552 624 M 132 30
5177355 1381386252 211d0000 8388608 856 V 2047 1
5210124 1381386253 219d0000 8388608 856 V 2027 21
5242893 1381386254 221d0000 8388608 856 V 2043 5
5275662 1381386255 229d0000 8388608 856 V 2024 24
5308431 1381386256 231d0000 8388608 856 V 1933 115
5341200 1381386257 239d0000 8388608 856 V 1804 244
5373969 1381386258 241d0000 8388608 856 V 1801 247
5406738 1381386259 249d0000 8388608 856 V 207 1841
Total: - - 354222080 - - 83924 2556

(* segment locked in memory)

Всего памяти 1G.
Linux Red Hat с ядром 2.4 (абсолютно точно следующие цифры после точки
пока не могу сказать, т.к. сижу удаленно и и сейчас нет доступа к серверу).
Все dbspace и так на raw device (настоящие и ненастоящие - это как?).

На всякий случай повторяю прицеп в zip, но при этом не укладываюсь
в отведенный максимум 70K, из-за чего - две части (вторая, возможно, и
лишняя, просто для полноты).
...
Рейтинг: 0 / 0
04.07.2006, 01:46
    #33828920
Julian
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS: PANIC: Attempting to bring system down
Остаток прицепа:
...
Рейтинг: 0 / 0
04.07.2006, 04:01
    #33828929
Выбегалло
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS: PANIC: Attempting to bring system down
JulianНа количество сегментов мы думали, но вроде сообщение об ошибке должно быть другим. Попробуем увеличить начальный размер.

/opt/informix/bin/onstat -g seg:

Informix Dynamic Server 2000 Version 9.21.UC3 -- On-Line -- Up 14:44:53 -- 345272 Kbytes

Segment Summary:
id key addr size ovhd class blkused blkfree
4816896 1381386241 10000000 278257664 223264 R 67906 28
5111817 1381386250 2095e000 8192000 856 V 2000 0
5144586 1381386251 2112e000 663552 624 M 132 30
5177355 1381386252 211d0000 8388608 856 V 2047 1
5210124 1381386253 219d0000 8388608 856 V 2027 21
5242893 1381386254 221d0000 8388608 856 V 2043 5
5275662 1381386255 229d0000 8388608 856 V 2024 24
5308431 1381386256 231d0000 8388608 856 V 1933 115
5341200 1381386257 239d0000 8388608 856 V 1804 244
5373969 1381386258 241d0000 8388608 856 V 1801 247
5406738 1381386259 249d0000 8388608 856 V 207 1841
Total: - - 354222080 - - 83924 2556

(* segment locked in memory)

Всего памяти 1G.
Linux Red Hat с ядром 2.4 (абсолютно точно следующие цифры после точки
пока не могу сказать, т.к. сижу удаленно и и сейчас нет доступа к серверу).
Все dbspace и так на raw device (настоящие и ненастоящие - это как?).

На всякий случай повторяю прицеп в zip, но при этом не укладываюсь
в отведенный максимум 70K, из-за чего - две части (вторая, возможно, и
лишняя, просто для полноты).

Количество сегментов тут ни при чем. Сервер упал через минуту после выделения последнего сегмента.
Чем занята упавшая нить ? выполнением процедуры Price_Injunction


Last parsed SQL statement :
execute PROCEDURE Price_Injunction ( ? , ? )

User-created Temp tables :
partnum tabname rowsize
300007 inj_price_tmp 94
300007 inj_price_tmp 94
30000e print_appl_tmp 74
300007 inj_price_tmp 94
30000f print_appl_tmp 74
30000b weight_tmp 173
30000a print_protocol_tmp 34
30000f print_model_tmp 44
300007 inj_price_tmp 94
30000b weight_tmp 173
30000a print_protocol_tmp 34
300009 print_registr_tmp 51

Где именно в теле процедуры ? Где-то после создания таблиц print_appl_tmp, print_model_tmp . Что именно не нравится ? Выражение с преобразованием типов (кастингом), потому что стек выглядит
0x084f404f (oninit)afsig_handler(0xb, 0x2262a350, 0x2262a3d0, 0x24408440, 0x818f508, 0x2262a700)
0x4003da35 (*nosymtab*)0x4003da35(0xb, 0x2262a350, 0x2262a3d0, 0xb, 0x0, 0x1)
0x400cc840 (*nosymtab*)0x400cc840(0x2262a780, 0x0, 0x21c9a150, 0x2262a75c, 0x2262a780, 0x2262a704)
0x08150a2d (oninit)find_celist(0x21c9a150, 0x2262a780, 0x818f508, 0x2262a700, 0x247bdef0, 0x2262a760)
0x08150b39 (oninit)retrieve_rrcache(0x4, 0x2262a780, 0x2262a75c, 0x0, 0x818f298, 0x0)
0x0818f7ce (oninit)getcastinfo(0x2262a8e4, 0x2262a8f8, 0x2262a8b8, 0x2262a8f8, 0x2262a8e4, 0x2262a8b8)
0x0818b8be (oninit)getcast2(0x2262a8e4, 0x2262a8f8, 0x2262a8b8, 0x2262a850, 0x0, 0x0)
0x0818b52f (oninit)getcast (0x2262a8e4, 0x2262a8f8, 0x2262a8b8, 0x23ae1410, 0x23be8270, 0x0)
0x0812a0c1 (oninit)mkcastexpr(0x23be8270, 0x23be82b0, 0x49, 0x2262aa54, 0x23492710, 0x18)
0x08140660 (oninit)ip_doimplicit(0x23be8270, 0x23ae1410, 0x18, 0x0, 0x0, 0x244e9a18)
0x08140ac5 (oninit)ip_exprparse(0x244f5650, 0x23ae1410, 0x0, 0x23ae1410, 0x0, 0x244e9a18)
0x0813f9a9 (oninit)ip_evalexpr(0x23ae1410, 0x244f5650, 0x60220, 0x23ae10a0, 0x2, 0x21c9a0a0)
0x0813eb37 (oninit)runproc (0x2262ad08, 0x2262ad0c, 0x21c9a0a0, 0x23ae10a0, 0x23ae1238, 0x2262ad58

runproc - запустить процедуру,
...
ip_doimplicit - выполнить неявное преобразование типов,
getcast, getcast2, getcastinfo - входы в процедуры кастинга, потом сервер зачем-то лезет в (специализированный ) кэш ( retrieve_rrcache ), затем ищет какой-то список (find_celist) - и здесь грохается. afsig_handler - это уже обработка assert failure.
Так что, если вам сильно интересно, то трахайте процедуру Price_Injunction - ищите место где в ней падает и пытайтесь найти workaround. Ну или проапдейтесь до более свежей версии, 9.21.UC3 исполнилось сто лет в обед.
...
Рейтинг: 0 / 0
04.07.2006, 10:05
    #33829208
Daugava
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS: PANIC: Attempting to bring system down
У меня это "любимый" баг. С выделением сегментов памяти не связан (у меня ее более,чем достаточно хватает захваченных в момент запуска). Даже если новый сегмент выделился под что-то не типичиное, до до падения сервера иногда проходят месяца. Единственная закономерность у меня - падение происходит на процедурах (при этом выполнение update statistics for procedure в этот момент сильно повышает вероятность падения), хотя у некоторых граждан с аналогичными симптомами сервер заваливала нить ontape-а, формировавшая архив Level-0, при прочей нулевой нагрузке.
У меня сие начало проявляться после апгрейда с 7.2 на 7.3, после перехода на 9-ку стал намного реже (раз 5 в год), но все равно не ушел. Апгрейдиться с 9.21.UC2 Solaris X86 мне не куда.
...
Рейтинг: 0 / 0
04.07.2006, 10:27
    #33829287
onstat-
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS: PANIC: Attempting to bring system down
Julian

Всего памяти 1G.
Linux Red Hat с ядром 2.4 (абсолютно точно следующие цифры после точки
пока не могу сказать, т.к. сижу удаленно и и сейчас нет доступа к серверу).
Все dbspace и так на raw device (настоящие и ненастоящие - это как?).



Я наверное не правильно выразился, под настоящими я имeл ввиду

#ls -al
crw-rw---- 1 informix informix 8, 224 May 28 03:30 /dev/raw/ids_data000

Другими словами они называются raw character special device.

Старые ядра для блочных устройств используют буферизацию.
И при активном вводе выводе базы манагеру виртуальной памяти OC
через пару тройку дней сносило крышу .
В этом случае либо ОС 90% процессороного времени
находилась в обработке системных вызовов( syscpu),
либо база падала с ошибкой похожей на вашу.
Такую картину я наблюдал на RH AS 2.1. (ядро 2.4.9.....)
...
Рейтинг: 0 / 0
04.07.2006, 18:13
    #33831066
Paul Tatarenko
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS: PANIC: Attempting to bring system down
DaugavaАпгрейдиться с 9.21.UC2 Solaris X86 мне не куда.
еще есть UC4 ... :)
...
Рейтинг: 0 / 0
04.07.2006, 23:39
    #33831486
Julian
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS: PANIC: Attempting to bring system down
Размер начального сегмента SHMVIRTSIZE увеличен в onconfig.rc с 8000 до 96000.
Не помогло.

2Выбегалло

Спасибо.
Однако по нескольким af.* видно, что

1.
После фиксирования в online.log ошибки
"
10:28:06 Assert Failed: Exception Caught. Type: MT_EX_OS, Context: mem
"
IDS может продолжать работу, а может и свалиться. В прицепах выше видно, что он погиб после второй ошибки. Бывает, что после первой, бывает - после третьей. (Кстати, еслии не сваливается, то начинает очень сильно тормозить,
причем некоторые сессии невозможно выкинуть по onmode -z sessid).

2.
Бывает, что срубается и не из-за CAST.

3.
Ошибки возникают на разных процедурах.

Все это видно в пример1 и пример2.

4.
Иногда ошибка возникает не в процедуре, а в SELECT, который не меняется уже пару лет и вызывается очень часто.
пример3.

В общем, все нормально работало годами, но последних пару месяцев стал срубаться вервер БД раз в несколько дней (при переносе БД на резервный -
та же картина).
Система развивается обычным образом - меняются/добавляются процедуры и клиенты.
Поэтому я и думаю, что или перестали отвечать нуждам системы настройки,
или появилась какая-то ошибка в БД (процедурах, структурах данных?).
Непонято, где копать.
...
Рейтинг: 0 / 0
04.07.2006, 23:41
    #33831488
Julian
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS: PANIC: Attempting to bring system down
Red Hat 7.2
kernel 2.4.7-10 Enterprice.
...
Рейтинг: 0 / 0
05.07.2006, 00:39
    #33831504
Выбегалло
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS: PANIC: Attempting to bring system down
Если вы внимательно всмотритесь в текст селекта в примере 3, то увидите вызов функции Injunction_Person.
Грохается в связи с этим самым rrcache - то на find_celist, то на find_celist->checkcast->cmprid. Есть на udrlm_spl_execute, что не совсем понятно. Но это все а) баги и б) лечится только переходом на новые версии.

В таком вот аксепте
...
Рейтинг: 0 / 0
05.07.2006, 09:57
    #33831775
Daugava
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS: PANIC: Attempting to bring system down
Paul Tatarenko DaugavaАпгрейдиться с 9.21.UC2 Solaris X86 мне не куда.
еще есть UC4 ... :)
Если бы существовал хотя бы UC5, в котором вроде полечили "very old pages" при backup level-0, то апгрейд имел бы смысл. А так менять шило на мыло смысла не вижу, насколько я помню, у вас на UC4 были теже проблемы, что и у меня.
...
Рейтинг: 0 / 0
05.07.2006, 14:29
    #33832876
Paul Tatarenko
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS: PANIC: Attempting to bring system down
Daugava... шило на мыло...
угу
...
Рейтинг: 0 / 0
18.07.2006, 11:55
    #33860172
tsadss
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS: PANIC: Attempting to bring system down
После перехода на Informix 9.40.UC6 сервер в течение 7 дней работает стабильно при той же нагрузке и при выполнении тех же задач - скорее всего падал из-за багов Informix 9.21.UC3.

Всем большое спасибо!
...
Рейтинг: 0 / 0
Форумы / Informix [игнор отключен] [закрыт для гостей] / IDS: PANIC: Attempting to bring system down / 21 сообщений из 21, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]