|
Проблема с сервером
|
|||
---|---|---|---|
#18+
Помогите найти причину падения сервера Informix. Железо: Операционная система — Windows 2000 server Sp4; CPU — Intel(r) Xeon 1.8GHz; RAM — 4 Gb; Установлен RAID 5 уровня; Informix 9.3 TC3 кусок log: 0:38:11 Informix Dynamic Server Started. Fri Aug 01 10:38:12 2008 10:38:12 Booting Language <c> from module <> 10:38:12 Loading Module <CNULL> 10:38:12 Booting Language <builtin> from module <> 10:38:12 Loading Module <BUILTINNULL> 10:38:17 Informix Dynamic Server Version 9.30.TC3 Software Serial Number 10:38:18 Informix Dynamic Server Initialized -- Shared Memory Initialized. 10:38:19 Physical Recovery Started at Page(4:7257). 10:39:07 Physical Recovery Complete: 0 Pages Examined 0 Pages Restored. 10:39:07 Logical Recovery Started. 10:39:07 10 recovery worker threads will be started. 10:39:07 Fast Recovery Switching to Log 732 10:39:07 Dynamically allocated new virtual shared memory segment (size 8192KB) 10:39:11 Logical Recovery has reached the transaction cleanup phase. 10:39:11 Logical Recovery Complete. 2 Committed, 0 Rolled Back, 0 Open, 0 Bad Locks 10:39:12 Dataskip is now OFF for all dbspaces 10:39:12 Checkpoint Completed: duration was 0 seconds. 10:39:12 Checkpoint loguniq 732, logpos 0x18 10:39:12 Maximum server connections 0 10:39:12 Init operation complete - Mode Online 10:39:12 On-Line Mode 10:46:39 Booting Language <spl> from module <> 10:46:39 Loading Module <SPLNULL> 10:49:41 Fuzzy Checkpoint Completed: duration was 0 seconds, 3 buffers not flushed. 10:49:41 Checkpoint loguniq 732, logpos 0x29a8 10:49:41 Maximum server connections 8 10:49:54 Assert Failed: Unhandled NT Exception! 10:49:54 See Also: C:\tmp\af.411c022 10:49:54 Assert Failed: No Exception Handler 10:49:54 Informix Dynamic Server Version 9.30.TC3 10:49:54 Who: Session(19, Informix@gorlovka, 2168, 0) Thread(41, sqlexec, 0, 1) File: mtex.c Line: 890 10:49:54 Results: Exception Caught. Type: MT_EX_OS, Context: mem 10:49:54 Action: Please notify Informix Technical Support. 10:49:54 stack trace for pid 1048 written to C:\tmp\af.411c022 10:49:54 See Also: C:\tmp\af.411c022, shmem.411c022.0 10:49:56 Releasing server from system block 10:50:09 PANIC: Attempting to bring system down 10:50:09 mtex.c, line 890, thread 41, proc id 1048, No Exception Handler. 11:41:42 Informix Dynamic Server Started. Fri Aug 01 11:41:43 2008 11:41:43 Booting Language <c> from module <> 11:41:43 Loading Module <CNULL> 11:41:43 Booting Language <builtin> from module <> 11:41:43 Loading Module <BUILTINNULL> 11:41:47 Informix Dynamic Server Version 9.30.TC3 Software Serial Number 11:41:48 Informix Dynamic Server Initialized -- Shared Memory Initialized. 11:41:48 Physical Recovery Started at Page(4:7271). 11:41:49 Physical Recovery Complete: 216 Pages Examined 216 Pages Restored. 11:41:49 Logical Recovery Started. 11:41:49 10 recovery worker threads will be started. 11:41:49 Dynamically allocated new virtual shared memory segment (size 8192KB) 11:41:53 Logical Recovery has reached the transaction cleanup phase. 11:41:53 Logical Recovery Complete. 29 Committed, 1 Rolled Back, 0 Open, 0 Bad Locks 11:41:54 Dataskip is now OFF for all dbspaces 11:41:54 Checkpoint Completed: duration was 0 seconds. 11:41:54 Checkpoint loguniq 732, logpos 0x1116a8 11:41:54 Maximum server connections 0 11:41:54 Dropping temporary TBLspace 0x800002, recovering 8 pages. 11:41:54 Dropping temporary TBLspace 0x800003, recovering 8 pages. 11:41:54 Dropping temporary TBLspace 0x800004, recovering 8 pages. 11:41:54 Dropping temporary TBLspace 0x800005, recovering 8 pages. 11:41:54 Dropping temporary TBLspace 0x800006, recovering 8 pages. 11:41:54 Dropping temporary TBLspace 0x800007, recovering 8 pages. 11:41:54 Checkpoint Completed: duration was 0 seconds. 11:41:54 Checkpoint loguniq 732, logpos 0x112378 11:41:54 Maximum server connections 0 11:41:54 Init operation complete - Mode Online 11:41:54 On-Line Mode 11:47:23 Checkpoint Completed: duration was 0 seconds. 11:47:23 Checkpoint loguniq 732, logpos 0x113018 11:47:23 Maximum server connections 1 11:50:40 Booting Language <spl> from module <> 11:50:40 Loading Module <SPLNULL> 11:52:23 Checkpoint Completed: duration was 0 seconds. 11:52:23 Checkpoint loguniq 732, logpos 0x114018 11:52:23 Maximum server connections 7 11:52:29 I/O bad request chunk 322, pagenum 8224, pagecnt 1 11:52:29 Assert Failed: la_upd_bitmaps 11:52:29 Informix Dynamic Server Version 9.30.TC3 11:52:30 Who: Session(23, Informix@gorlovka, 1728, 0) Thread(45, sqlexec, 0, 1) File: rslight.c Line: 2706 11:52:30 Results: Light Append: Can't find bitmap page 11:52:30 stack trace for pid 2192 written to C:\tmp\af.415cecd 11:52:30 See Also: C:\tmp\af.415cecd, shmem.415cecd.0 11:52:44 la_upd_bitmaps 11:52:44 la_upd_bitmaps 11:52:45 I/O bad request chunk 3790, pagenum 58547, pagecnt 1 11:52:45 Assert Failed: la_upd_bitmaps 11:52:45 Informix Dynamic Server Version 9.30.TC3 11:52:45 Who: Session(23, Informix@gorlovka, 1728, 0) Thread(45, sqlexec, 0, 1) File: rslight.c Line: 2706 11:52:45 Results: Light Append: Can't find bitmap page 11:52:45 stack trace for pid 2192 written to C:\tmp\af.415cecd 11:52:45 See Also: C:\tmp\af.415cecd 11:52:48 Releasing server from system block 11:52:54 la_upd_bitmaps 11:52:54 la_upd_bitmaps 11:57:47 Fuzzy Checkpoint Completed: duration was 0 seconds, 675 buffers not flushed. 11:57:47 Checkpoint loguniq 732, logpos 0xa377c4 onconfig ROOTNAME rootdbs # Root dbspace name ROOTPATH C:\IFMXDATA\ol_fin\rootdbs_dat.000 # Path for device containing root dbspace ROOTOFFSET 0 # Offset of root dbspace into device (Kbytes) ROOTSIZE 51200 # Size of root dbspace (Kbytes) MIRROR 0 # Mirroring flag (Yes = 1, No = 0) MIRRORPATH # Path for device containing mirrored root MIRROROFFSET 0 # Offset into mirrored device (Kbytes) PHYSDBS physdbs # Location (dbspace) of physical log PHYSFILE 100000 # Physical log file size (Kbytes) LOGFILES 20 # Number of logical log files LOGSIZE 2000 # Logical log size (Kbytes) LOG_BACKUP_MODE MANUAL # Logical log backup mode (MANUAL, CONT) MSGPATH C:\Informix\ol_fin.log # System message log file path CONSOLE C:\Informix\conol_fin.log # System console message path ALARMPROGRAM C:\Informix\etc\log_full.bat # Alarm program path TBLSPACE_STATS 1 # Maintain tblspace statistics TAPEDEV NUL #\\.\TAPE0 # Tape device path TAPEBLK 16 # Tape block size (Kbytes) TAPESIZE 10240 # Maximum amount of data to put on tape (Kbytes) # Log Archive Tape Device LTAPEDEV NUL # Log tape device path LTAPEBLK 16 # Log tape block size (Kbytes) LTAPESIZE 10240 # Max amount of data to put on log tape (Kbytes) # Optical STAGEBLOB # Informix Dynamic Server/Optical staging area OPTICAL_LIB_PATH # Location of Optical Subsystem driver DLL SERVERNUM 0 # Unique id corresponding to a server instance DBSERVERNAME ol_fin # Name of default Dynamic Server DBSERVERALIASES # List of alternate dbservernames NETTYPE soctcp,1,,NET # Override sqlhosts nettype parameters DEADLOCK_TIMEOUT 60 # Max time to wait of lock in distributed env. RESIDENT 0 # Forced residency flag (Yes = 1, No = 0) MULTIPROCESSOR 1 # 0 for single-processor, 1 for multi-processor NUMCPUVPS 3 # Number of user (cpu) vps SINGLE_CPU_VP 0 # If non-zero, limit number of cpu vps to one NOAGE 0 # Process aging AFF_SPROC 0 # Affinity start processor AFF_NPROCS 0 # Affinity number of processors LOCKS 40000 # Maximum number of locks BUFFERS 80000 # Maximum number of shared buffers NUMAIOVPS 1 # Number of IO vps PHYSBUFF 32 # Physical log buffer size (Kbytes) LOGBUFF 32 # Logical log buffer size (Kbytes) CLEANERS 4 # Number of buffer cleaner processes SHMBASE 0x20000000L # Shared memory base address SHMVIRTSIZE 64000 # initial virtual shared memory segment size SHMADD 32000 # Size of new shared memory segments (Kbytes) SHMTOTAL 0 # Total shared memory (Kbytes). 0=>unlimited CKPTINTVL 300 # Check point interval (in sec) LRUS 80 # Number of LRU queues LRU_MAX_DIRTY 50 # LRU percent dirty begin cleaning limit LRU_MIN_DIRTY 30 # LRU percent dirty end cleaning limit TXTIMEOUT 0x12c # Transaction timeout (in sec) STACKSIZE 128 # Stack size (Kbytes) DYNAMIC_LOGS 2 LTXHWM 80 LTXEHWM 90 OFF_RECVRY_THREADS 10 # Default number of offline worker threads ON_RECVRY_THREADS 1 # Default number of online worker threads DRINTERVAL 30 # DR max time between DR buffer flushes (in sec) DRTIMEOUT 30 # DR network timeout (in sec) DRLOSTFOUND \tmp # DR lost+found file path CDR_EVALTHREADS 1,2 # evaluator threads (per-cpu-vp,additional) CDR_DSLOCKWAIT 5 # DS lockwait timeout (seconds) CDR_QUEUEMEM 4096 # Maximum memory for any CDR queue (Kbytes) CDR_QHDR_DBSPACE # CDR queue dbspace (default same as catalog) CDR_QDATA_SBSPACE # CDR queue smart blob space CDR_QDATA_SBFLAGS 2 # Log/no-log (default no log) CDR_NIFCOMPRESS 0 # Link level compression (-1 never, 0 none, 9 max) BAR_ACT_LOG C:\Informix\bar_ol_fin.log #Path of log file for onbar.exe BAR_MAX_BACKUP 5 BAR_RETRY 1 BAR_NB_XPORT_COUNT 10 BAR_XFER_BUF_SIZE 15 BAR_BSALIB_PATH C:\ISM\2.20\bin\libbsa.dll # Location of ISM XBSA DLL RESTARTABLE_RESTORE on #To support restartable restore..values on/off ISM_DATA_POOL ISMData ISM_LOG_POOL ISMLogs RA_PAGES 4 # Number of pages to attempt to read ahead RA_THRESHOLD 2 # Number of pages left before next group DBSPACETEMP tempdbs1,tempdbs2,tempdbs3 # Default temp dbspaces DUMPDIR C:\tmp # Preserve diagnostics in this directory DUMPSHMEM 1 # Dump a copy of shared memory DUMPGCORE 0 # Dump a core image using 'gcore' DUMPCORE 0 # Dump a core image (Warning:this aborts Dynamic DUMPCNT 1 # Number of shared memory or gcore dumps for # a single user's session FILLFACTOR 90 # Fill factor for building indexes USEOSTIME 0 # 0: use internal time(fast), 1: get time from OS(slow) MAX_PDQPRIORITY 100 # Maximum allowed pdqpriority DS_MAX_QUERIES 32 # Maximum number of decision support queries DS_TOTAL_MEMORY 4096 # Decision support memory (Kbytes) DS_MAX_SCANS 1048576 # Maximum number of decision support scans DATASKIP off # List of dbspaces to skip OPTCOMPIND 2 # To hint the optimizer DIRECTIVES 1 # Optimizer DIRECTIVES ON (1/Default) or OFF (0) ONDBSPACEDOWN 2 # Dbspace down option: 0 = CONTINUE, 1 = ABORT, 2 = WAIT OPCACHEMAX 0 # Maximum optical cache size (Kbytes) HETERO_COMMIT 0 SBSPACENAME sbspace # Default sbspace BLOCKTIMEOUT 3600 # Default timeout for system block OPT_GOAL -1 ALLOW_NEWLINE 0 # embedded newlines(Yes = 1, No = 0 or anything but 1) SYSSBSPACENAME sbspace # Default System sbspace JVPJAVAHOME C:\Informix\extend\krakatoa\jre # JDK installation root directory JVPHOME C:\Informix\extend\krakatoa # Krakatoa installation directory JVPPROPFILE C:\Informix\extend\krakatoa\.jvpprops_ol_fin # JVP property file JDKVERSION 1.3 # JDK version supported by this server JVPJAVALIB \bin\ JVPJAVAVM hpi;server;verify;java;net;zip;jpeg JVPCLASSPATH C:\Informix\extend\krakatoa\krakatoa.jar;C:\Informix\extend\krakatoa\jdbc.jar JVPLOGFILE C:\Informix\extend\krakatoa/jvp.log # JVP log file. дествия: проверял работу при различных настройках onconfig, не помагло, (оканчательный вариант onconfig выложил на верху). при выполнении команд следующих команд Oncheck -cD <база> oncheck cI <база> update statistics higs сервер работает стабильно, но через пару дней картина повторяется Подскажите в чем может быть причина??????? ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2008, 11:27 |
|
Проблема с сервером
|
|||
---|---|---|---|
#18+
dbexport11:52:30 See Also: C:\tmp\af.415cecd, shmem.415cecd.0 ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2008, 11:36 |
|
Проблема с сервером
|
|||
---|---|---|---|
#18+
Журавлев Денис dbexport11:52:30 See Also: C:\tmp\af.415cecd, shmem.415cecd.0 Там выше еще есть assert failed'ы и разные по характеру. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2008, 12:10 |
|
Проблема с сервером
|
|||
---|---|---|---|
#18+
а техподдержка что говорит? ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2008, 12:12 |
|
Проблема с сервером
|
|||
---|---|---|---|
#18+
в тех потдежку softline отсылал файлы с папки tmp, присали параметры которые советуют изменить в onconfшп, именения последние я выложил, но вот сегодня уже дважды сервак вылетал. пичем пеняют на старую версию Informix 9.3. Да и вот еще, может проблемы как-то связаны с RAId 5??? ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2008, 12:27 |
|
Проблема с сервером
|
|||
---|---|---|---|
#18+
dbexportв тех потдежку softline отсылал файлы с папки tmp, присали параметры которые советуют изменить в onconfшп, именения последние я выложил, но вот сегодня уже дважды сервак вылетал. пичем пеняют на старую версию Informix 9.3. Да и вот еще, может проблемы как-то связаны с RAId 5??? Вот версию обновить точно надо. Нам в свое время полегчало. По поводу RAID5 здесь было много чего написано, но если onchek показывает, что со структурой и данными все нормально, то думаю он тут явно не причем. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2008, 13:20 |
|
Проблема с сервером
|
|||
---|---|---|---|
#18+
Вот после зануска команд oncheck -cD, oncheck -cI, update statistics high работает нормально, ошибок не выдает, потом через время все по новой сервак виснет, такие-же ошибки в логе, с чем может быть связоно не пойму??? если есть варианты или может ссылки де можно что-нить нарыть, заранее спасибо. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2008, 14:47 |
|
Проблема с сервером
|
|||
---|---|---|---|
#18+
dbexportВот после зануска команд oncheck -cD, oncheck -cI, update statistics high работает нормально, ошибок не выдает, потом через время все по новой сервак виснет, такие-же ошибки в логе, с чем может быть связоно не пойму??? если есть варианты или может ссылки де можно что-нить нарыть, заранее спасибо. Что послужило причиной такого поведения сервер ? Не может быть, чтобы сервер работал в штатном режиме такое длительное время и вдруг .... Можно понять, когда HW - выходит из строя .... не хватает ресурсов, как следствие каких-то изменений (например, в application и т.д.).... Вопрос - каких ? Что произошло такого, чего Вы не знаете или знает ? С уважением, Вадим. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2008, 14:58 |
|
Проблема с сервером
|
|||
---|---|---|---|
#18+
итак попорядку: 1. Была проведена модернизация серверного оборудования, увеличена оперативная память с 2 Gb до 4 Gb; 2. На сервере был поднят RAID 5 уровня; 3. Пришли обновления от разработчика на сервер приложений с реорганизацией базы данных. После обновления сервера по п.1 и п.2 сервер работал стабильно, особых проблем не возникало, проблемы посыпались вот сейчас. Отсылал логи по обновлениям разработчикам, да и сам глядел. Все прошло гладко. Есть сервер Informix 10.00.FC5, поднят на Linux susy и вот там проблем нет. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2008, 16:45 |
|
Проблема с сервером
|
|||
---|---|---|---|
#18+
dbexportитак попорядку: 1. Была проведена модернизация серверного оборудования, увеличена оперативная память с 2 Gb до 4 Gb; 2. На сервере был поднят RAID 5 уровня; 3. Пришли обновления от разработчика на сервер приложений с реорганизацией базы данных. После обновления сервера по п.1 и п.2 сервер работал стабильно, особых проблем не возникало, проблемы посыпались вот сейчас. Отсылал логи по обновлениям разработчикам, да и сам глядел. Все прошло гладко. Есть сервер Informix 10.00.FC5, поднят на Linux susy и вот там проблем нет. Если Вы увеличили память для OS Windows, то по всей видимости Вам нужно изменить базовый адрес SHMBASE .... и пересмотреть ряд параметров SHM.... Насколько Я понял, проблемы начались после ряда обновлений прикладного ПО ... :) Что можно сказать ... разработчики должны хорошо тестировать свое решение - полные функциональные тесты и performаnce тесты ... Все вопросы к разработчикам. Возможно, что наступили на грабли в IDS 9.30 ... нужен последний релиз IDS 9.30.xC7 !!! Или переходите на более новый 11.50.xC2 !!! С уважением, Вадим. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2008, 16:56 |
|
Проблема с сервером
|
|||
---|---|---|---|
#18+
А вот как объяснить, что после выполнения Oncheck -cD, oncheck -cI, update statistics high сервер может проработать 1-3 дня без проблем, и потом опять та-жа картина, останавливается сервер Informix каждые 1-3 часа работы????? ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2008, 17:04 |
|
Проблема с сервером
|
|||
---|---|---|---|
#18+
Если это новое ПО, то очень может быть что разработчики все оттестировали как положено. Версия то сервера старая. Узнайте у разработчиков на какой версии и каком релизе у них разрабатывалось и тестировалось. В моей практике было, что накатываен новые ХП в продуктив. Сервер падает с assert failed с сообщением что то типа mtex.c ( здесь это тоже есть). Проблемы уходили с накатом последнего релиза сервера. Кстати можно попробовать еще обновить статистику ХП. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2008, 17:09 |
|
Проблема с сервером
|
|||
---|---|---|---|
#18+
Понятно, спасибо всем за помощь, в понедельник тогда буду решать вопрос с версией и выходить на разработчиков ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2008, 17:14 |
|
Проблема с сервером
|
|||
---|---|---|---|
#18+
dbexportА вот как объяснить, что после выполнения Oncheck -cD, oncheck -cI, update statistics high сервер может проработать 1-3 дня без проблем, и потом опять та-жа картина, останавливается сервер Informix каждые 1-3 часа работы????? Объяснить то легко. Баг например проявляется при исполнении хранимой процедуры. Посколько сервак тредный, то его плющит целиком, т.е. он падает, но данные при этом не разваливаются благодаря очень хорошо сделанному механизму изменения данных на диске. Был у меня например такой прикол. Эксплуатировали мы одно время две конфигурацию на спарках и на интел под линуксом. Так на спарках работала (там последний релиз был) , а на линуксе сервер (версия была более древняя) падал примерно с той же любимой ошибкой MT_EX_OS . Тогда например я переписывал ХП специально для линуксовой версии и мне это удалось. Но после этого с максимально возможной скоростью переехали на спарки и на последний релиз информикса и все забыли. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2008, 17:17 |
|
Проблема с сервером
|
|||
---|---|---|---|
#18+
С переводом базы данных на server Informix 10 была решена данная проблема. Месяц наблюдений за работой сервера не выявил ошибок. Тема закрыта. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.11.2008, 10:18 |
|
|
start [/forum/topic.php?fid=44&fpage=32&tid=1607954]: |
0ms |
get settings: |
7ms |
get forum list: |
14ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
97ms |
get topic data: |
14ms |
get forum data: |
2ms |
get page messages: |
59ms |
get tp. blocked users: |
2ms |
others: | 379ms |
total: | 580ms |
0 / 0 |