Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Informix [игнор отключен] [закрыт для гостей] / Подскажите почему падает информикс / 15 сообщений из 15, страница 1 из 1
19.03.2007, 20:03
    #34401296
Filariel
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Подскажите почему падает информикс
Добрый день . Не могу не как разобратся.

Сначало выдает в лог такие строки не смотря на то что tmpdbs в кончиг файле не прописан

14:23:11 Warning: Invalid (non-existent/blobspace/disabled) dbspace listed
in DBSPACETEMP: 'tmpdbs'
14:26:53 Warning: Invalid (non-existent/blobspace/disabled) dbspace listed
in DBSPACETEMP: 'tmpdbs'


а после этого через некоторое время сервер валится

15:55:23 Who: Session(5962, tanya@ws-66.pc.fcbank.com.ua, 3056, 0x3b09ba78)
Thread(10232, sqlexec, 3b06f870, 1)
File: mtex.c Line: 377
15:55:23 Action: Please notify IBM Informix Technical Support.
15:55:23 stack trace for pid 1576 written to /tmp/af.2be0964b
15:55:23 See Also: /tmp/af.2be0964b
15:55:26 Exception Caught. Type: MT_EX_OS, Context: mem
15:55:26 (-9791): ERROR: Routine execution trap -- procname=<cap_getparam> procid=252
reason: mem
15:55:26 Assert Failed: No Exception Handler
15:55:26 IBM Informix Dynamic Server Version 9.40.UC4
15:55:26 Who: Session(5962, tanya@ws-66.pc.fcbank.com.ua, 3056, 0x3b09ba78)
Thread(10232, sqlexec, 3b06f870, 1)
File: mtex.c Line: 431
15:55:26 Results: Exception Caught. Type: MT_EX_OS, Context: mem
15:55:26 Action: Please notify IBM Informix Technical Support.
15:55:26 stack trace for pid 1576 written to /tmp/af.2be0964b
15:55:26 See Also: /tmp/af.2be0964b
15:55:29 mtex.c, line 431, thread 10232, proc id 1576, No Exception Handler.
15:55:29 The Master Daemon Died
15:55:29 PANIC: Attempting to bring system down

Из за чего это может происходить
...
Рейтинг: 0 / 0
19.03.2007, 20:57
    #34401374
Чемберлен
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Подскажите почему падает информикс
Содержимое файла /tmp/af.2be0964b приложите, пожалуйста, в упакованном виде...
...
Рейтинг: 0 / 0
19.03.2007, 22:13
    #34401461
sysmaster
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Подскажите почему падает информикс
Можно просто вывод onstat -d.
...
Рейтинг: 0 / 0
19.03.2007, 22:47
    #34401489
Выбегалло
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Подскажите почему падает информикс
И конфиг (onstat -c) .

В таком вот аксепте
...
Рейтинг: 0 / 0
20.03.2007, 09:05
    #34401784
Andron
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Подскажите почему падает информикс
Стоит посмотреть на это:

Filariel
...
15:55:26 (-9791): ERROR: Routine execution trap -- procname=<cap_getparam> procid=252
reason: mem

15:55:26 Assert Failed: No Exception Handler
...


finderr -9791
-9791 User-defined routine execution failed.

This error occurs under the following circumstances:

1. A language problem occurred or an internal server error
exists. In this case, the following log message is entered
in the log:

ERROR: Routine execution failed -- procname = routine_name procid =
process_ID_number

2. The executing routine has caused one of the following
exceptions:

mem -- memory fault

ill -- illegal instruction

fpt -- floating point or divide by zero

sys -- system call problem

"xxx" -- SAPI layer exception explanation

The following error message appears in the log:

ERROR: Routine execution trap -- procname = procedure_name procid =
process_ID_number reason: error_string
...
Рейтинг: 0 / 0
20.03.2007, 10:25
    #34401959
Igor Zaiets
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Подскажите почему падает информикс
Скорее за все временное пространство не при чем.
Без аэфки можно токо посоветовть:
1. Настроить пулы(DS,DD,PC)
2. Если это на одной и той же процедуре - смотреть процедуру
3. Перейти как минимум на 9.40UC6
...
Рейтинг: 0 / 0
20.03.2007, 11:21
    #34402214
Filariel
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Подскажите почему падает информикс
Вот конфиг файл

ROOTNAME rootdbs # Root dbspace name
ROOTPATH /dev/sdb1 # Path for device containing root dbspace
ROOTOFFSET 0 # Offset of root dbspace into device (Kbytes)
ROOTSIZE 2000000 # Size of root dbspace (Kbytes)

# Disk Mirroring Configuration Parameters

MIRROR 0 # Mirroring flag (Yes = 1, No = 0)
MIRRORPATH # Path for device containing mirrored root
MIRROROFFSET 0 # Offset into mirrored device (Kbytes)

# Physical Log Configuration

PHYSDBS rootdbs # Location (dbspace) of physical log
PHYSFILE 20000 # Physical log file size (Kbytes)

# Logical Log Configuration

LOGFILES 202 # Number of logical log files
LOGSIZE 20000 # Logical log size (Kbytes)

# Diagnostics

MSGPATH /usr/informix/online.log # System message log file path
CONSOLE /dev/console # System console message path

# To automatically backup logical logs, edit alarmprogram.sh and set
#BACKUPLOGS=Y
ALARMPROGRAM /usr/informix/etc/alarmprogram.sh # Alarm program path
TBLSPACE_STATS 1 # Maintain tblspace statistics

# System Archive Tape Device


#TAPEDEV /dev/null
TAPEDEV /dev/st0 # Tape device path
#TAPEDEV /backup/prime.bkp
#TAPEDEV /home/script/bkp_lnk
TAPEBLK 2048 # Tape block size (Kbytes)
TAPESIZE 200000000 # Maximum amount of data to put on tape (Kbytes)

# Log Archive Tape Device

LTAPEDEV /dev/null
##LTAPEDEV /dev/st0 # Log tape device path
#LTAPEDEV /backup/log.bkp # Logical log backup to file
LTAPEBLK 2048 # Log tape block size (Kbytes)
LTAPESIZE 200000000 # Max amount of data to put on log tape (Kbytes)

# Optical

STAGEBLOB # Informix Dynamic Server staging area

# System Configuration

SERVERNUM 0 # Unique id corresponding to a OnLine instance
DBSERVERNAME ix11 # Name of default database server
DBSERVERALIASES # List of alternate dbservernames
NETTYPE soctcp,1,100,NET # Configure poll thread(s) for nettype
DEADLOCK_TIMEOUT 60 # Max time to wait of lock in distributed env.
RESIDENT 0 # Forced residency flag (Yes = 1, No = 0)

MULTIPROCESSOR 1 # 0 for single-processor, 1 for multi-processor
NUMCPUVPS 3 # Number of user (cpu) vps
SINGLE_CPU_VP 0 # If non-zero, limit number of cpu vps to one

NOAGE 1 # Process aging
AFF_SPROC 1 # Affinity start processor
AFF_NPROCS 3 # Affinity number of processors

# Shared Memory Parameters

LOCKS 2000000 # Maximum number of locks
BUFFERS 250000 # Maximum number of shared buffers
NUMAIOVPS 12 # Number of IO vps
PHYSBUFF 512 # Physical log buffer size (Kbytes)
LOGBUFF 512 # Logical log buffer size (Kbytes)
CLEANERS 12 # Number of buffer cleaner processes
SHMBASE 0x10000000 # Shared memory base address
SHMVIRTSIZE 65536 # initial virtual shared memory segment size
SHMADD 16384 # Size of new shared memory segments (Kbytes)
SHMTOTAL 0 # Total shared memory (Kbytes). 0=>unlimited
CKPTINTVL 300 # Check point interval (in sec)
LRUS 12 # Number of LRU queues
LRU_MAX_DIRTY 60.000000 # LRU percent dirty begin cleaning limit
LRU_MIN_DIRTY 50.000000 # LRU percent dirty end cleaning limit
TXTIMEOUT 0x12c # Transaction timeout (in sec)
STACKSIZE 32 # Stack size (Kbytes)

# Dynamic Logging
# DYNAMIC_LOGS:
# 2 : server automatically add a new logical log when necessary. (ON)
# 1 : notify DBA to add new logical logs when necessary. (ON)
# 0 : cannot add logical log on the fly. (OFF)
#
# When dynamic logging is on, we can have higher values for LTXHWM/LTXEHWM,
# because the server can add new logical logs during long transaction rollback.
# However, to limit the number of new logical logs being added, LTXHWM/LTXEHWM
# can be set to smaller values.
#
# If dynamic logging is off, LTXHWM/LTXEHWM need to be set to smaller values
# to avoid long transaction rollback hanging the server due to lack of logical
# log space, i.e. 50/60 or lower.

DYNAMIC_LOGS 0
LTXHWM 50
LTXEHWM 60

# System Page Size
# BUFFSIZE - OnLine no longer supports this configuration parameter.
# To determine the page size used by OnLine on your platform
# see the last line of output from the command, 'onstat -b'.


# Recovery Variables
# OFF_RECVRY_THREADS:
# Number of parallel worker threads during fast recovery or an offline restore.
# ON_RECVRY_THREADS:
# Number of parallel worker threads during an online restore.

OFF_RECVRY_THREADS 10 # Default number of offline worker threads
ON_RECVRY_THREADS 3 # Default number of online worker threads

# Data Replication Variables
DRINTERVAL 30 # DR max time between DR buffer flushes (in sec)
DRTIMEOUT 20 # DR network timeout (in sec)
DRLOSTFOUND /usr/informix/etc/dr.lostfound # DR lost+found file path

# CDR Variables
CDR_EVALTHREADS 2,2 # evaluator threads (per-cpu-vp,additional)
CDR_DSLOCKWAIT 5 # DS lockwait timeout (seconds)
CDR_QUEUEMEM 49152 # Maximum amount of memory for any CDR queue (Kbytes)
CDR_NIFCOMPRESS 0 # Link level compression (-1 never, 0 none, 9 max)
CDR_SERIAL 0,0 # Serial Column Sequence
CDR_DBSPACE # dbspace for syscdr database
CDR_QHDR_DBSPACE # CDR queue dbspace (default same as catalog)
CDR_QDATA_SBSPACE # List of CDR queue smart blob spaces

# CDR_MAX_DYNAMIC_LOGS
# -1 => unlimited
# 0 => disable dynamic log addition
# >0 => limit the no. of dynamic log additions with the specified value.
# Max dynamic log requests that CDR can make within one server session.

CDR_MAX_DYNAMIC_LOGS 0 # Dynamic log addition disabled by default

# Backup/Restore variables
BAR_ACT_LOG /usr/informix/bar_act.log # ON-Bar Log file - not in /tmp please
BAR_DEBUG_LOG /usr/informix/bar_dbug.log
# ON-Bar Debug Log - not in /tmp please
BAR_MAX_BACKUP 1
BAR_RETRY 1
BAR_NB_XPORT_COUNT 10
BAR_XFER_BUF_SIZE 31
RESTARTABLE_RESTORE on
BAR_PROGRESS_FREQ 0

# Informix Storage Manager variables
ISM_DATA_POOL ISMData
ISM_LOG_POOL ISMLogs

# Read Ahead Variables
RA_PAGES # Number of pages to attempt to read ahead
RA_THRESHOLD # Number of pages left before next group

# DBSPACETEMP:
# OnLine equivalent of DBTEMP for SE. This is the list of dbspaces
# that the OnLine SQL Engine will use to create temp tables etc.
# If specified it must be a colon separated list of dbspaces that exist
# when the OnLine system is brought online. If not specified, or if
# all dbspaces specified are invalid, various ad hoc queries will create
# temporary files in /tmp instead.

DBSPACETEMP tempdbs1,tempdbs2

# DUMP*:
# The following parameters control the type of diagnostics information which
# is preserved when an unanticipated error condition (assertion failure) occurs
# during OnLine operations.
# For DUMPSHMEM, DUMPGCORE and DUMPCORE 1 means Yes, 0 means No.

DUMPDIR /tmp # Preserve diagnostics in this directory
DUMPSHMEM 0 # Dump a copy of shared memory
DUMPGCORE 0 # Dump a core image using 'gcore'
DUMPCORE 0 # Dump a core image (Warning:this aborts OnLine)
DUMPCNT 1 # Number of shared memory or gcore dumps for
# a single user's session

FILLFACTOR 90 # Fill factor for building indexes

# method for OnLine to use when determining current time
USEOSTIME 0 # 0: use internal time(fast), 1: get time from OS(slow)

# Parallel Database Queries (pdq)
MAX_PDQPRIORITY 60 # Maximum allowed pdqpriority
DS_MAX_QUERIES # Maximum number of decision support queries
DS_TOTAL_MEMORY # Decision support memory (Kbytes)
DS_MAX_SCANS 1048576 # Maximum number of decision support scans
DATASKIP off
# OPTCOMPIND
# 0 => Nested loop joins will be preferred (where
# possible) over sortmerge joins and hash joins.
# 1 => If the transaction isolation mode is not
# "repeatable read", optimizer behaves as in (2)
# below. Otherwise it behaves as in (0) above.
# 2 => Use costs regardless of the transaction isolation
# mode. Nested loop joins are not necessarily
# preferred. Optimizer bases its decision purely
# on costs.
OPTCOMPIND 2 # To hint the optimizer

DIRECTIVES 1 # Optimizer DIRECTIVES ON (1/Default) or OFF (0)

ONDBSPACEDOWN 2 # Dbspace down option: 0 = CONTINUE, 1 = ABORT, 2 = WAIT
OPCACHEMAX 0 # Maximum optical cache size (Kbytes)

# HETERO_COMMIT (Gateway participation in distributed transactions)
# 1 => Heterogeneous Commit is enabled
# 0 (or any other value) => Heterogeneous Commit is disabled
HETERO_COMMIT 0

SBSPACENAME # Default smartblob space name - this is where blobs
# go if no sbspace is specified when the smartblob is
# created. It is also used by some datablades as
# the location to put their smartblobs.
SYSSBSPACENAME # Default smartblob space for use by the Informix
# Server. This is used primarily for Informix Server
# system statistics collection.

BLOCKTIMEOUT 3600 # Default timeout for system block
SYSALARMPROGRAM /usr/informix/etc/evidence.sh # System Alarm program path

# Optimization goal: -1 = ALL_ROWS(Default), 0 = FIRST_ROWS
OPT_GOAL -1

ALLOW_NEWLINE 0 # embedded newlines(Yes = 1, No = 0 or anything but 1)

#
# The following are default settings for enabling Java in the database.
# Replace all occurrences of /usr/informix with the value of $INFORMIXDIR.

#VPCLASS jvp,num=1 # Number of JVPs to start with

JVPJAVAHOME /usr/informix/extend/krakatoa/jre
# JRE installation root directory
JVPHOME /usr/informix/extend/krakatoa # Krakatoa installation directory

JVPPROPFILE /usr/informix/extend/krakatoa/.jvpprops # JVP property file
JVPLOGFILE /usr/informix/jvp.log # JVP log file.

JDKVERSION 1.3 # JDK version supported by this server

# The path to the JRE libraries relative to JVPJAVAHOME
JVPJAVALIB /lib/i386/

# The JRE libraries to use for the Java VM

JVPJAVAVM hpi:server:verify:java:net:zip:jpeg

# use JVPARGS to change Java VM configuration
#To display jni call
#JVPARGS -verbose:jni

# Classpath to use upon Java VM start-up (use _g version for debugging)

#JVPCLASSPATH /usr/informix/extend/krakatoa/krakatoa_g.jar:/usr/informix/extend/krakatoa/jdbc_g.jar
JVPCLASSPATH /usr/informix/extend/krakatoa/krakatoa.jar:/usr/informix/extend/krakatoa/jdbc.jar


У меня такое ощущение что не хватило места в одном из чанков . Но как это проверить ?
В приложеном файле вывод onstat -d но там вроде все нормально .
Посмотрите может кто что увидит.
...
Рейтинг: 0 / 0
20.03.2007, 12:06
    #34402399
Filariel
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Подскажите почему падает информикс
Вот аф -ка которая пишется при ошибке.
Кстати ошибка возникает при выполнении одной и той же процедуры , но эта процедура раньше работала нормально.
...
Рейтинг: 0 / 0
20.03.2007, 12:34
    #34402516
Filariel
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Подскажите почему падает информикс
сории афка не присоеденилась была слишком большая
...
Рейтинг: 0 / 0
20.03.2007, 14:06
    #34402866
vasilis
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Подскажите почему падает информикс
FilarielСначало выдает в лог такие строки не смотря на то что tmpdbs в кончиг файле не прописан
14:23:11 Warning: Invalid (non-existent/blobspace/disabled) dbspace listed in DBSPACETEMP: 'tmpdbs'
14:26:53 Warning: Invalid (non-existent/blobspace/disabled) dbspace listed in DBSPACETEMP: 'tmpdbs'
а после этого через некоторое время сервер валится
...
Из за чего это может происходить
Думаю, что отсутствие временного пространства и свал сервера не связаны между собой.
Противоречие DBSPACETEMP в onconfig и реального значения (действующего) могло произойти по простой причине изменения DBSPACETEMP уже после старта сервера, а. т.к. IDS не перезагружался уже более года (это действительно реальные значения ?), то об этом изменении могли уже и забыть... Также, DBSPACETEMP может определяться и в переменных окружения.
Кстати, посмотреть отличия в конфигурационных параметрах (original и effective) можно следующим простым запросом:
----------------------------------------------
-- Create list differences original (ONCONFIG)
-- and effective parameters
--
-- V.Shulzhenko DBA_Tools 2000-07
----------------------------------------------
set isolation to dirty read;
select
cf_name name
,cf_effective effective
,cf_original original_ONCONFIG
,cf_default default
from sysconfig
where cf_original != cf_effective
and cf_original !=''
order by 1;
...
Рейтинг: 0 / 0
20.03.2007, 14:21
    #34402922
Filariel
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Подскажите почему падает информикс
То что это вряд ли из за темпового дбспейса я почти уверен потому что
tmpdbs такого спейса нету и не где в онконфиге не прописан.
Да и давольно регулярно он пишет это сообщение в лог но при этом не падает .
Проблема в чем то другом . Возможно и в самой процедуре которая выполняется в момент падения сервера (одна и таже процедура ) .
Странно то что падает он тоже не постоянно , а не определенно может упасть , а может пройти .
...
Рейтинг: 0 / 0
20.03.2007, 14:33
    #34402972
vasilis
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Подскажите почему падает информикс
Несколько комментов или вопросов по конфигурации.
Насколько я понял, это не промышленный сервер ? (отсутствие архива логич.журналов, зеркалирования, большие буфера журналов и т.п.).
Тем не менее, рекомендовал бы изменить некоторые параметры (ниже мои предлагаемые значения):
RESIDENT 1 # Forced residency flag (Yes = 1, No = 0)

PHYSBUFF 128 # Physical log buffer size (Kbytes)
LOGBUFF 64 # Logical log buffer size (Kbytes)

LRUS 127 # Number of LRU queues

LRU_MAX_DIRTY 20.000000 # LRU percent dirty begin cleaning limit
LRU_MIN_DIRTY 10.000000 # LRU percent dirty end cleaning limit

LTXHWM 45
LTXEHWM 54

RA_PAGES 128 # Number of pages to attempt to read ahead
RA_THRESHOLD 48 # Number of pages left before next group

DBSPACETEMP tempdbs1,tempdbs2,tmpdbs3

DS_MAX_QUERIES 4 # Maximum number of decision support queries
DS_TOTAL_MEMORY 32000 # Decision support memory (Kbytes)
DS_MAX_SCANS 16 # Maximum number of decision support scans

У меня такое ощущение что не хватило места в одном из чанков . Но как это проверить ?
В приложеном файле вывод onstat -d но там вроде все нормально .
Посмотрите может кто что увидит.
Из-за нехватки места в чанке сервер падать не должен, просто с ошибкой завершится сессия-запрос.
А зачем такая хитрая конфигурация ДБ-пространств ? На каждую таблицу по dbspace ? Что это вам дало, кроме усложнения администрирования ?
...
Рейтинг: 0 / 0
20.03.2007, 14:42
    #34403009
vasilis
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Подскажите почему падает информикс
FilarielВот аф -ка которая пишется при ошибке.
Кстати ошибка возникает при выполнении одной и той же процедуры , но эта процедура раньше работала нормально.
Похоже, что эту процедуру (cup_add_service) пересоздавали или просто сделали новый план при включенном PDQ (например, при Update Statistics) и теперь при выполнении она создает несколько десятков нитей, выполняющихся параллельно.
...
Рейтинг: 0 / 0
20.03.2007, 15:31
    #34403209
Filariel
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Подскажите почему падает информикс
авторНасколько я понял, это не промышленный сервер ?

Да это тестовый вариант промышленого сервера на котором
бекап логических журналов отключен.

авторЧто это вам дало, кроме усложнения администрирования ?
На этот вопрос ответить не могу , это делали до меня и почему именно так не знаю .

авторПохоже, что эту процедуру (cup_add_service) пересоздавали или просто сделали новый план при включенном PDQ (например, при Update Statistics) и теперь при выполнении она создает несколько десятков нитей, выполняющихся параллельно.

Вот это возможно так как на сервере постоянно происходят изменения. Это возможно как то исправить ?
...
Рейтинг: 0 / 0
21.03.2007, 12:42
    #34405474
Тан
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Подскажите почему падает информикс
Filariel авторПохоже, что эту процедуру (cup_add_service) пересоздавали или просто сделали новый план при включенном PDQ (например, при Update Statistics) и теперь при выполнении она создает несколько десятков нитей, выполняющихся параллельно.
Вот это возможно так как на сервере постоянно происходят изменения. Это возможно как то исправить ?
set pdqpriority 0;
update statistics for procedure;
...
Рейтинг: 0 / 0
Форумы / Informix [игнор отключен] [закрыт для гостей] / Подскажите почему падает информикс / 15 сообщений из 15, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]