powered by simpleCommunicator - 2.0.56     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Informix [игнор отключен] [закрыт для гостей] / Подскажите из за чего может падать сервер
25 сообщений из 36, страница 1 из 2
Подскажите из за чего может падать сервер
    #35830497
KyRo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Упал информикс . Не могу понять почему , запрос который пользователь выполнял в принципе очень скромный по меркам самой базы.
Подскажите куда копать ,

Ids 9.4 UC4

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
102.
103.
104.
105.
106.
107.
108.
109.
110.
111.
112.
113.
114.
115.
116.
117.
118.
119.
120.
121.
122.
123.
124.
125.
126.
127.
128.
129.
130.
131.
132.
133.
134.
135.
136.
137.
138.
139.
140.
141.
142.
143.
144.
145.
146.
147.
148.
149.
150.
151.
152.
153.
154.
155.
156.
157.
158.
159.
160.
161.
162.
163.
164.
165.
166.
167.
168.
169.
170.
171.
172.
173.
174.
175.
176.
177.
178.
179.
180.
181.
182.
183.
184.
185.
186.
187.
188.
189.
190.
191.
192.
193.
194.
195.
196.
197.
198.
199.
200.
201.
202.
203.
204.
205.
206.
207.
208.
209.
210.
211.
212.
213.
214.
215.
216.
217.
218.
219.
220.
221.
222.
223.
224.
225.
226.
227.
228.
229.
230.
231.
232.
233.
234.
235.
236.
237.
238.
239.
240.
241.
242.
243.
244.
245.
246.
247.
248.
249.
250.
251.
252.
253.
254.
255.
256.
257.
258.
259.
260.
261.
262.
263.
264.
265.
266.
267.
# Root Dbspace Configuration

ROOTNAME        rootdbs         # Root dbspace name
ROOTPATH        /dev/sdb1       # Path for device containing root dbspace
ROOTOFFSET       0                # Offset of root dbspace into device (Kbytes)
ROOTSIZE         2000000          # Size of root dbspace (Kbytes)

# Disk Mirroring Configuration Parameters
#
MIRROR           0                # Mirroring flag (Yes =  1 , No =  0 )
MIRRORPATH                      # Path for device containing mirrored root
MIRROROFFSET     0                # Offset into mirrored device (Kbytes)

# Physical Log Configuration

PHYSDBS         rootdbs         # Location (dbspace) of physical log
PHYSFILE         20000            # Physical log file size (Kbytes)

# Logical Log Configuration

LOGFILES         450              # Number of logical log files
LOGSIZE          20000            # Logical log size (Kbytes)

# Diagnostics

MSGPATH         /usr/informix/online.log # System message log file path
CONSOLE         /dev/console    # System console message path

# To automatically backup logical logs, edit alarmprogram.sh and set
# BACKUPLOGS=Y
ALARMPROGRAM    /usr/informix/etc/alarm.sh # Alarm program path
#ALARMPROGRAM    /usr/informix/etc/alarmprogram.sh # Alarm program path
TBLSPACE_STATS   1                # Maintain tblspace statistics

# System Archive Tape Device

#TAPEDEV                /home/script/bkp_lnk
#TAPEDEV         /dev/null
TAPEDEV         /dev/st0        # Tape device path
#TAPEDEV                /bkp/prime.bkp
TAPEBLK          2048             # Tape block size (Kbytes)
TAPESIZE         300000000        # Maximum amount of data to put on tape (Kbytes)

# Log Archive Tape Device

#LTAPEDEV        /dev/null
#LTAPEDEV        /dev/st0        # Log tape device path
LTAPEDEV        /backup/log     # Logical log backup to file
LTAPEBLK         2048             # Log tape block size (Kbytes)
LTAPESIZE        200000000        # Max amount of data to put on log tape (Kbytes)

# Optical

STAGEBLOB                       # Informix Dynamic Server staging area

# System Configuration
SERVERNUM        0                # Unique id corresponding to a OnLine instance
DBSERVERNAME    ix10            # Name of default database server
#DBSERVERNAME    ix11            # Name of default database server
DBSERVERALIASES                 # List of alternate dbservernames
NETTYPE         soctcp, 1 , 100 ,NET # Configure poll thread(s) for nettype
DEADLOCK_TIMEOUT  60               # Max time to wait of lock in distributed env.
RESIDENT         0                # Forced residency flag (Yes =  1 , No =  0 )

MULTIPROCESSOR   1                #  0  for single-processor,  1  for multi-processor
NUMCPUVPS        3                # Number of user (cpu) vps
SINGLE_CPU_VP    0                # If non-zero, limit number of cpu vps to one

NOAGE            1                # Process aging
AFF_SPROC        1                # Affinity start processor
AFF_NPROCS       3                # Affinity number of processors

# Shared Memory Parameters

LOCKS            4000000          # Maximum number of locks
BUFFERS          250000           # Maximum number of shared buffers
NUMAIOVPS        12               # Number of IO vps
PHYSBUFF         512              # Physical log buffer size (Kbytes)
LOGBUFF          512              # Logical log buffer size (Kbytes)
CLEANERS         12               # Number of buffer cleaner processes
SHMBASE         0x10000000        # Shared memory base address
SHMVIRTSIZE      65536            # initial virtual shared memory segment size
SHMADD           32768            # Size of new shared memory segments (Kbytes)
SHMTOTAL         0                # Total shared memory (Kbytes).  0 =>unlimited
CKPTINTVL        300              # Check point interval (in sec)
LRUS             12               # Number of LRU queues
LRU_MAX_DIRTY    60 . 000000        # LRU percent dirty begin cleaning limit
LRU_MIN_DIRTY    50 . 000000        # LRU percent dirty end cleaning limit
TXTIMEOUT       0x12c             # Transaction timeout (in sec)
STACKSIZE        32               # Stack size (Kbytes)

# Dynamic Logging
# DYNAMIC_LOGS:
#     2  : server automatically add a new logical log when necessary. (ON)
#     1  : notify DBA to add new logical logs when necessary. (ON)
#     0  : cannot add logical log on the fly. (OFF)
#
# When dynamic logging is on, we can have higher values for LTXHWM/LTXEHWM,
# because the server can add new logical logs during long transaction rollback.
# However, to limit the number of new logical logs being added, LTXHWM/LTXEHWM
# can be set to smaller values.
#
# If dynamic logging is off, LTXHWM/LTXEHWM need to be set to smaller values
# to avoid long transaction rollback hanging the server due to lack of logical
# log space, i.e.  50 / 60  or lower.

DYNAMIC_LOGS     0 
LTXHWM           50 
LTXEHWM          60 

# System Page Size
# BUFFSIZE - OnLine no longer supports this configuration parameter.
#            To determine the page size used by OnLine on your platform
#            see the last line of output from the command, 'onstat -b'.
# Recovery Variables
# OFF_RECVRY_THREADS:
# Number of parallel worker threads during fast recovery or an offline restore.
# ON_RECVRY_THREADS:
# Number of parallel worker threads during an online restore.

OFF_RECVRY_THREADS  10               # Default number of offline worker threads
ON_RECVRY_THREADS  3                # Default number of online worker threads

# Data Replication Variables
DRINTERVAL       30               # DR max time between DR buffer flushes (in sec)
DRTIMEOUT        20               # DR network timeout (in sec)
DRLOSTFOUND     /usr/informix/etc/dr.lostfound # DR lost+found file path

# CDR Variables
CDR_EVALTHREADS  2 , 2              # evaluator threads (per-cpu-vp,additional)
CDR_DSLOCKWAIT   5                # DS lockwait timeout (seconds)
CDR_QUEUEMEM     49152            # Maximum amount of memory for any CDR queue (Kbytes)
CDR_NIFCOMPRESS  0                # Link level compression (- 1  never,  0  none,  9  max)
CDR_SERIAL       0 , 0              # Serial Column Sequence
CDR_DBSPACE                     # dbspace for syscdr database
CDR_QHDR_DBSPACE                 # CDR queue dbspace (default same as catalog)
CDR_QDATA_SBSPACE                 # List of CDR queue smart blob spaces

# CDR_MAX_DYNAMIC_LOGS
# - 1  => unlimited
#   0  => disable dynamic log addition
# > 0  => limit the no. of dynamic log additions with the specified value.
# Max dynamic log requests that CDR can make within one server session.

CDR_MAX_DYNAMIC_LOGS  0                # Dynamic log addition disabled by default

# Backup/Restore variables
BAR_ACT_LOG     /usr/informix/bar_act.log # ON-Bar Log file - not in /tmp please
BAR_DEBUG_LOG   /usr/informix/bar_dbug.log
                                # ON-Bar Debug Log - not in /tmp please
BAR_MAX_BACKUP   0 
BAR_RETRY        1 
BAR_NB_XPORT_COUNT  10 
BAR_XFER_BUF_SIZE  31 
RESTARTABLE_RESTORE on
BAR_PROGRESS_FREQ  0 

# Informix Storage Manager variables
ISM_DATA_POOL   ISMData
ISM_LOG_POOL    ISMLogs

# Read Ahead Variables
RA_PAGES                        # Number of pages to attempt to read ahead
RA_THRESHOLD                    # Number of pages left before next group

# DBSPACETEMP:
# OnLine equivalent of DBTEMP for SE. This is the list of dbspaces
# that the OnLine SQL Engine will use to create temp tables etc.
# If specified it must be a colon separated list of dbspaces that exist
# when the OnLine system is brought online.  If not specified, or if
# all dbspaces specified are invalid, various ad hoc queries will create
# temporary files in /tmp instead.

DBSPACETEMP     tempdbs1:tempdbs2

# DUMP*:
# The following parameters control the type of diagnostics information which
# is preserved when an unanticipated error condition (assertion failure) occurs
# during OnLine operations.
# For DUMPSHMEM, DUMPGCORE and DUMPCORE  1  means Yes,  0  means No.

DUMPDIR         /tmp            # Preserve diagnostics in this directory
DUMPSHMEM        0                # Dump a copy of shared memory
DUMPGCORE        0                # Dump a core image using 'gcore'
DUMPCORE         0                # Dump a core image (Warning:this aborts OnLine)
DUMPCNT          1                # Number of shared memory or gcore dumps for
                                # a single user's session

FILLFACTOR       90               # Fill factor for building indexes

# method for OnLine to use when determining current time
USEOSTIME        0                #  0 : use internal time(fast),  1 : get time from OS(slow)

# Parallel Database Queries (pdq)
MAX_PDQPRIORITY  60                # Maximum allowed pdqpriority
DS_MAX_QUERIES                  # Maximum number of decision support queries
DS_TOTAL_MEMORY                 # Decision support memory (Kbytes)
DS_MAX_SCANS     1048576          # Maximum number of decision support scans
DATASKIP        off
# OPTCOMPIND
#  0  => Nested loop joins will be preferred (where
#      possible) over sortmerge joins and hash joins.
#  1  => If the transaction isolation mode is not
#      "repeatable read", optimizer behaves as in ( 2 )
#      below.  Otherwise it behaves as in ( 0 ) above.
#  2  => Use costs regardless of the transaction isolation
#      mode.  Nested loop joins are not necessarily
#      preferred.  Optimizer bases its decision purely
#      on costs.
OPTCOMPIND       2                # To hint the optimizer

DIRECTIVES       1                # Optimizer DIRECTIVES ON ( 1 /Default) or OFF ( 0 )

ONDBSPACEDOWN    2                # Dbspace down option:  0  = CONTINUE,  1  = ABORT,  2  = WAIT
OPCACHEMAX       0                # Maximum optical cache size (Kbytes)

# HETERO_COMMIT (Gateway participation in distributed transactions)
#  1  => Heterogeneous Commit is enabled
#  0  (or any other value) => Heterogeneous Commit is disabled
HETERO_COMMIT    0 

SBSPACENAME                     # Default smartblob space name - this is where blobs
                       # go if no sbspace is specified when the smartblob is
                       # created. It is also used by some datablades as
                       # the location to put their smartblobs.
SYSSBSPACENAME                  # Default smartblob space for use by the Informix
                       # Server. This is used primarily for Informix Server
                       # system statistics collection.

BLOCKTIMEOUT     3600             # Default timeout for system block
SYSALARMPROGRAM /usr/informix/etc/evidence.sh # System Alarm program path

# Optimization goal: - 1  = ALL_ROWS(Default),  0  = FIRST_ROWS
OPT_GOAL        - 1 

ALLOW_NEWLINE    0                # embedded newlines(Yes =  1 , No =  0  or anything but  1 )

#
# The following are default settings for enabling Java in the database.
# Replace all occurrences of /usr/informix with the value of $INFORMIXDIR.

#VPCLASS        jvp,num= 1        # Number of JVPs to start with

JVPJAVAHOME     /usr/informix/extend/krakatoa/jre
                                # JRE installation root directory
JVPHOME         /usr/informix/extend/krakatoa # Krakatoa installation directory

JVPPROPFILE     /usr/informix/extend/krakatoa/.jvpprops # JVP property file
JVPLOGFILE      /usr/informix/jvp.log # JVP log file.

JDKVERSION       1 . 3              # JDK version supported by this server

# The path to the JRE libraries relative to JVPJAVAHOME
JVPJAVALIB      /lib/i386/

# The JRE libraries to use for the Java VM

JVPJAVAVM       hpi:server:verify:java:net:zip:jpeg

# use JVPARGS to change Java VM configuration
#To display jni call
#JVPARGS        -verbose:jni

# Classpath to use upon Java VM start-up (use _g version for debugging)

#JVPCLASSPATH  /usr/informix/extend/krakatoa/krakatoa_g.jar:/usr/informix/extend/krakatoa/jdbc_g.jar
JVPCLASSPATH    /usr/informix/extend/krakatoa/krakatoa.jar:/usr/informix/extend/krakatoa/jdbc.jar

Сообщение из лога

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
 17 : 04 : 27   Logical Log  75011  - Backup Started
 17 : 04 : 27   Logical Log  75011  - Backup Completed
 17 : 07 : 11   Fuzzy Checkpoint Completed:  duration was  3  seconds,  1954  buffers not flushed,
timestamp:  944672550 .
 17 : 07 : 11   Checkpoint loguniq  75012 , logpos 0xada288, timestamp:  944672550 

 17 : 07 : 11   Maximum server connections  50 
 17 : 07 : 43   Assert Failed: No Exception Handler
 17 : 07 : 43   IBM Informix Dynamic Server Version  9 . 40 .UC4
 17 : 07 : 43    Who: Session( 26532 , primus@ 10 . 1 . 10 . 52 ,  1716 , 0x47226bf0)
                Thread( 95520 , sqlexec, 4dca4e88,  1 )
                File: mtex.c Line:  431 
 17 : 07 : 43    Results: Exception Caught. Type: MT_EX_OS, Context: mem
 17 : 07 : 43    Action: Please notify IBM Informix Technical Support.
 17 : 07 : 43   stack trace for pid  1587  written to /tmp/af.7908c73f
 17 : 07 : 43    See Also: /tmp/af.7908c73f
 17 : 07 : 47   mtex.c, line  431 , thread  95520 , proc id  1587 , No Exception Handler.
 17 : 07 : 48   The Master Daemon Died
 17 : 07 : 48   The Master Daemon Died
 17 : 07 : 48   The Master Daemon Died
 17 : 07 : 48   PANIC: Attempting to bring system down


И собственно сам af
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35830558
vasilis
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
KyRoУпал информикс . Не могу понять почему , запрос который пользователь выполнял в принципе очень скромный по меркам самой базы.
Подскажите куда копать ,
Похоже, что кто-то начал экспериментировать с PDQ. Возможно, что даже планы процедур переоптимизировали :)
Выключите его и не используйте без особой надобности.
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35830783
onstat-
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Поддерживаю vasilis по поводу PDQ.
у меня был опыт эксплуатации этого приложения.
PDQ там полезно для пользователей которые ведут пакетную обработку.
на мануальные транзакции не влияет, значение 1 для этой системы самый оптимальный вариант.

ИМХО
И еще поробуйте поднять значение stacksize.
Интуиция и просмотр сека вызовов мне подсказывает, что в стеке вызовов функции есть вызов функции с переменным количеством аргументов.
Какая там архитектура стека я не знаю. но есть вероятность того что память просто портится когда нехватает стека.
И еще в нашей версии были процедуры с трудом умещающиеся в ограничение 64 К.
как они там лежат я не знаю, но 32 к для этой системы точно мало, у нас стояло 64 потом поднимали до
128 кажется.
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35830959
Фотография Daugava
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
вот моя схожая проблема.
Рекомендации помогли, выполнил все, правда так до сих пор и не провел эксперимент, чтобы выяснить какая именно оказалась решающей. Все таки склоняюсь к stacksize.
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35832489
KyRo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Спасибо . Буду пробовать оптимизировать.
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35872437
KyRo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
После предложенной оптимизации , немного стабильности и вот опять упала система . Падать начала регулярно , по несколько раз на день . вообще не могу понять что к чему .
Ругается на сессию , но запроса как такового нет .
Посмотрите может что подскажете.
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35872463
cpr
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
cpr
Гость
ИМХО
копать нужно в сторону более свежих версий.
Все остальное от лукавовго, тем более что как я поня саппорта нет.
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35872479
KyRo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
авторВсе остальное от лукавовго, тем более что как я поня саппорта нет.
Нет сапорта к сожалению нет .
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35872736
vasilis
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
KyRoПосле предложенной оптимизации , немного стабильности и вот опять упала система . Падать начала регулярно , по несколько раз на день . вообще не могу понять что к чему .
.
А что именно вы "оптимизировали" ?
Вы поняли совет по поводу PDQ ? По моему, вы ничего не сделали и не проверили из того, что я ранее советовал/спрашивал.
Какой смысл смотреть и советовать дальше ? Лично для меня уже его нет.
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35873121
Фотография Daugava
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ну человек все таки поменял STACKSIZE, добавил еще один temp, увеличил BUFFERS.
Первое могло повлиять на устойчивость положительно, второе по мнению Зайца скорее отрицательно, третье врядли вообще как-то могло что-то затронуть (если память в порядке и ее хватает).

KyRo, передайте Лосеву привет от меня. Хорошо, что у вас процессинг не на Informix-e.
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35873433
KyRo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
авторВы поняли совет по поводу PDQ ? По моему, вы ничего не сделали и не проверили из того, что я ранее советовал/спрашивал.

Почему же не понял , понял . Просто отключить просто так PDQ не могу , запрос разработчикам отправил , просто еще не пришел ответ , могу ли я его выключить.

При этом я понаблюдал за системой и поспрашивал у наших разработчиков , используют ли они PDQ запросы. Все отвечают отрицательно .
В сформированной af onstat -g mgm показывает что нет не одного активного PDQ

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
/usr/informix/bin/onstat -g mgm:

IBM Informix Dynamic Server Version  9 . 40 .UC4     -- On-Line -- Up 00:29:18 -- 1150904 Kbytes

Memory Grant Manager (MGM)
--------------------------

MAX_PDQPRIORITY:   60 
DS_MAX_QUERIES:     6 
DS_MAX_SCANS:       1048576 
DS_TOTAL_MEMORY:    768  KB

Queries:   Active     Ready   Maximum
                 0           0           6 

Memory:     Total      Free   Quantum
(KB)           768         768         128 

Scans:      Total      Free   Quantum
            1048576     1048576           1 

Load Control:    (Memory)      (Scans)  (Priority)  (Max Queries)   (Reinit)
                   Gate  1        Gate  2       Gate  3          Gate  4      Gate  5 
(Queue Length)           0              0             0                0            0 

Active Queries:  None

Ready Queries:  None

Free Resource        Average #        Minimum #
--------------    ---------------     ---------
Memory               80 . 3  +-  25 . 5             32 
Scans              1048575 . 0  +-  0 . 0            1048575 

Queries              Average #        Maximum #    Total #
--------------    ---------------     ---------    -------
Active                1 . 0  +-  0 . 0               1          932 
Ready                 0 . 0  +-  0 . 0               0            0 

Resource/Lock Cycle Prevention count:   0 


То же самое , при максимальной загрузке системы и выполнении ежедневных процедур.

автор
KyRo, передайте Лосеву привет от меня. Хорошо, что у вас процессинг не на Informix-e.

Привет передам! Знать бы имя от кого , а то по нику форума , боюсь не поймет от кого . Кстати процессинг у нас как раз на информиксе.

Вот что меня интересует , не может ли себя вот так вести сервер от не хватки оперативной памяти ? На базу данных 250 гигов , на сервере стоит всего 4 гб оперативной памяти , и я все время наблюдаю ее почти 100 % загрузку .
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35873447
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
KyRo, и я все время наблюдаю ее почти 100 % загрузку .в никсах всегда 100% загрузка памяти, т.к. свободная память занимается буферным кешем, главное не должно быть своппинга постоянного см. vmstat колонки pi po (si so)
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35873695
KyRo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
авторглавное не должно быть своппинга

Нет своп вообще не использует

Код: plaintext
1.
2.
3.
4.
[root@ix10 tmp]# vmstat
   procs                      memory    swap          io     system         cpu
 r  b  w   swpd   free   buff  cache  si  so    bi    bo   in    cs  us  sy  id
  0    1    0        0     6196   662080   1938352     0     0     243      67    123     329     7     5    88 
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35873712
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
KyRoавторглавное не должно быть своппинга

Нет своп вообще не использует

Код: plaintext
1.
2.
3.
4.
[root@ix10 tmp]# vmstat
   procs                      memory    swap          io     system         cpu
 r  b  w   swpd   free   buff  cache  si  so    bi    bo   in    cs  us  sy  id
  0    1    0        0     6196   662080   1938352     0     0     243      67    123     329     7     5    88 

vmstat 60 15
это линукс? тогда команда free
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35873817
KyRo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Free показывает что в свап залазит , но я так мониторил память, вижу что если и залазит в свап то не сильно , вот где то как сейчас.

Код: plaintext
1.
2.
3.
4.
5.
[root@ix10 tmp]# free
             total       used       free     shared    buffers     cached
Mem:        4111704      4020356        91348      1267744       564112      1923608 
-/+ buffers/cache:     1532636      2579068 
Swap:       4192944          324      4192620 

Код: plaintext
1.
2.
3.
4.
5.
[root@ix10 tmp]# free
             total       used       free     shared    buffers     cached
Mem:        4111704      4097796        13908      1267744       623404      1943036 
-/+ buffers/cache:     1531356      2580348 
Swap:       4192944          172      4192772 
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35874005
vasilis
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
KyRoавторВы поняли совет по поводу PDQ ? По моему, вы ничего не сделали и не проверили из того, что я ранее советовал/спрашивал.
Почему же не понял , понял . Просто отключить просто так PDQ не могу , запрос разработчикам отправил , просто еще не пришел ответ , могу ли я его выключить.
А как вы собираетесь его выключить?
Если вы все поняли и разобрались, то ответ должен быть конкретным.
KyRoПри этом я понаблюдал за системой и поспрашивал у наших разработчиков , используют ли они PDQ запросы. Все отвечают отрицательно .
В сформированной af onstat -g mgm показывает что нет не одного активного PDQ
Код: plaintext
1.
2.
3.
4.
5.
/usr/informix/bin/onstat -g mgm:
...
Queries              Average #        Maximum #    Total #
--------------    ---------------     ---------    -------
Active                1 . 0  +-  0 . 0               1          932 

А что показывают, по вашему, выше приведенные вами же цифры ?
А по разработчикам я что то не понял - одним отправили запрос, в то же время спрашивали "у наших разработчиков". В итоге, где и какие разработчики и кто все таки несет ответственность за работу системы ?

Но главное, что у вас в системе (в приведенном дампе) видно как минимум 5 многонитиевых сессий с кол-вом от 9 до 69(!). Другой такой картины, как при плохом использовании PDQ, я не помню. Наиболее вероятен следующий сценарий (встречал на практике несколько раз):
- при создании процедуры (и ее оптимизации) включен PDQ
или, что более вероятно, при выполнении Update Statistics (а в стандартном режиме утилита также переоптимизирует ХП) тоже оказался включен PDQ
- при последующем выполнении процедуры она создает многонитиевый процесс
- основные параметры PDQ в onconfig вообще не определялись (по умолчанию DS_MAX_QUERIES и DS_TOTAL_MEMORY) и очень плохие (типа, квантума в 128Кб)
- из-за того что выполняются процедуры и не видно текстов запросов
Приведите нам полный текст скрипта, которым выполняется сбор статистики и переменные окружения во время его выполнения - может быть что то можно будет увидеть.

KyRoВот что меня интересует , не может ли себя вот так вести сервер от не хватки оперативной памяти ? На базу данных 250 гигов , на сервере стоит всего 4 гб оперативной памяти , и я все время наблюдаю ее почти 100 % загрузку .
Из 4-х гиг вы используете Информиксом всего 1,1 гига. И общий размер базы слабо коррелируется с объемом используемой ОП. Нехватка ОП влияла бы на скорость, но не на устойчивость сервера.

И последнее: кто конфигурировал onconfig ? И имеете ли возможность менять там параметры - мне многое там не нравится.
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35874031
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
KyRo
cached
1923608

можно считать это тоже свободная

[quot KyRo]
324 4192620
это мелочь
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35874325
KyRo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
авторА как вы собираетесь его выключить?
Выключается в онконфиге MAX_PDQPRIORITY 0 . Сейчас выставил в ноль, не дожидаясь ответа сапорта. Будем смотреть как теперь будет работать , пока вижу то что он хорошо залез в своп , хотя раньше этого не было

Код: plaintext
1.
2.
3.
4.
5.
[root@ix10 root]# free
             total       used       free     shared    buffers     cached
Mem:        4111704      4096184        15520      1912920       543792       733744 
-/+ buffers/cache:     2818648      1293056 
Swap:       4192944      1629916      2563028 


авторА по разработчикам я что то не понял - одним отправили запрос, в то же время спрашивали "у наших разработчиков". В итоге, где и какие разработчики и кто все таки несет ответственность за работу системы ?

Дело в том что у нас две системы . Одна центральная в которой храниться вся информация (разрабатывается за границей и сапортится ей же) и дополнительная (для внутрешних целей, разрабатывается нашими программистами). В данной ситуации получается что падает центральная система , при попытке установить конект с дополнительной (через trust).

Скрипт которым мы делаем update statistics

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
-- agents
Update Statistics High For Table agents(lastname);
Update Statistics High For Table agents(addressserno);
Update Statistics High For Table agents(bankid);
Update Statistics High For Table agents(agentid);
Update Statistics Low  For Table agents(branchid);

-- applog
Update Statistics High For Table applog(rowserno);
Update Statistics High For Table applog(timestamp);

-- archtapplog
Update Statistics High For Table archtapplog(rowserno);

-- archtcisotrxns
Update Statistics High For Table archtcisotrxns(i031_arn);
Update Statistics High For Table archtcisotrxns(serno);

-- archtcstatements
Update Statistics High For Table archtcstatements(caccserno);
Update Statistics High For Table archtcstatements(batchserno);
Update Statistics High For Table archtcstatements(serno);

-- archtctransactions
Update Statistics High For Table archtctransactions(caccserno);
Update Statistics High For Table archtctransactions(cardserno);
Update Statistics High For Table archtctransactions(batchserno);
Update Statistics High For Table archtctransactions(serno);

-- archtmapplog
Update Statistics High For Table archtmapplog(rowserno);

-- archtmisotrxns
Update Statistics High For Table archtmisotrxns(i031_arn);
Update Statistics High For Table archtmisotrxns(serno);

-- archtmstatements
Update Statistics High For Table archtmstatements(meraccserno);
Update Statistics High For Table archtmstatements(batchserno);
Update Statistics High For Table archtmstatements(serno);

-- archtmstmtlinks
Update Statistics High For Table archtmstmtlinks(statementserno);
Update Statistics Low  For Table archtmstmtlinks(merserno);
Update Statistics High For Table archtmstmtlinks(transactionserno);

-- archtmtransactions
Update Statistics High For Table archtmtransactions(merserno);
Update Statistics High For Table archtmtransactions(meraccserno);
Update Statistics High For Table archtmtransactions(inbatchserno);
Update Statistics High For Table archtmtransactions(serno);

-- archtoriginalpos
Update Statistics High For Table archtoriginalpos(trxnserno);
Update Statistics Low  For Table archtoriginalpos(seqno);
Update Statistics Low  For Table archtoriginalpos(fieldno);

-- archtoriginaltrxns
Update Statistics Low  For Table archtoriginaltrxns(seqno);
Дальше все то же но по другим таблицам

Переменная
Код: plaintext
1.
2.
INFORMIXSERVER=ix10
export INFORMIXSERVER


авторИ последнее: кто конфигурировал onconfig ? И имеете ли возможность менять там параметры - мне многое там не нравится.

Кто конфигурировал сказать не могу , это было за долго до меня . Скорее всего сами разработчики системы , которые приезжали на миграцию . возможность править конфиг я имею.
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35874415
onstat-
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
KyRo
пока вижу то что он хорошо залез в своп , хотя раньше этого не было


Код: plaintext
1.
2.
3.
4.
5.
[root@ix10 root]# free
             total       used       free     shared    buffers     cached
Mem:        4111704      4096184        15520      1912920       543792       733744 
-/+ buffers/cache:     2818648      1293056 
Swap:       4192944      1629916      2563028 



Насколько я понимаю кроме informix на сервере ничего другого не работает,
тогда это от того что у Вас чанки подключены как блочные устройства.

Я практически уверен, что когда переведете базу на символьные, и падать перестанет.
Мне когдато перевод чанков на символьнье устройства очень помог в избавлении от непредсказуемых падений, у меня правда чанки подключались через линки,
что очень облегчило перевод.

з.ы. По моему эта тема уже обсуждалась.
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35874617
vasilis
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
KyRoавторА как вы собираетесь его выключить?
Выключается в онконфиге MAX_PDQPRIORITY 0 . Сейчас выставил в ноль, не дожидаясь ответа сапорта. Будем смотреть как теперь будет работать , пока вижу то что он хорошо залез в своп , хотя раньше этого не было
Покажите onstat -u после сброса (onstat -z) и рабочей нагрузки в течении часа

KyRoВ данной ситуации получается что падает центральная система , при попытке установить конект с дополнительной (через trust).
А из чего вы это заключили ?

KyRoСкрипт которым мы делаем update statistics
странноватый способ.
Неужели в скрипте упомянуты абсолютно все фильтры и индексы, используемые в системе ?
Намного проще было бы автоматизировать создание данного скрипта, с использованием и low с drop distributions вначале, и medium для ключей индексов (не первых) и high для первых в индексе и оптимизацией процедур, т.е. как это советуется во множестве рекомендаций и ФАК-ов.
Ну да ладно.
Основной мой вопрос ведь был в том, чтобы увидеть - не переоптимизируются ли процедуры с включенным PDQ, чего я все равно не увидел...

KyRoПеременная
Код: plaintext
1.
2.
INFORMIXSERVER=ix10
export INFORMIXSERVER

Я ведь просил не одну эту переменную, а "переменн ые окружения во время его выполнения"

авторИ последнее: кто конфигурировал onconfig ? И имеете ли возможность менять там параметры - мне многое там не нравится.

KyRoКто конфигурировал сказать не могу , это было за долго до меня . Скорее всего сами разработчики системы , которые приезжали на миграцию . возможность править конфиг я имею.
Хотите увидеть и попробовать мои рекомендации по onconfig ?
Просто мне жаль будет потраченного времени, если я напишу, а вы все равно побоитесь их применить (и в чем то будете правы :)
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35874635
vasilis
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
onstat-Я практически уверен, что когда переведете базу на символьные, и падать перестанет.
Очень даже может быть.
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35874754
svat2
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
KyRo
Подскажите куда копать ,
Ids 9.4 UC4


+1 к update версии

... а вообще, была проблема с падениями с подобными ошибками с MTEX.C на 9.4UC6
В моем случае помогло согласование (не)использования ACPI в биосе сервера и ядре ОС (а именно: отключил и там и там).
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35875103
cpr
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
cpr
Гость
svat2KyRo
Подскажите куда копать ,
Ids 9.4 UC4


+1 к update версии

... а вообще, была проблема с падениями с подобными ошибками с MTEX.C на 9.4UC6
В моем случае помогло согласование (не)использования ACPI в биосе сервера и ядре ОС (а именно: отключил и там и там).


Дело в том, что каждый ДБА может рассказать много своих страшилок про ошибку в MTEX.C, которые забарывались или нет техсапортом или не техсапортом. Важно другое: даже если в данной конкретной ситуации подобрали параметры, которые не приводят к падению сервака, то это строго локальный результат, который будет жить скорее всего ограниченное время т.к. могут поменяться объемы данных, характер их распределения, умелые программеры наклепают новых запросов, появятся новые хранимые процедуры, появятся новые технологические решения и т.д. А в это время Informix исправляет баги и выпускает новые релизы. Самый лучший способ ИМХО - освежать версию время от времени. За 12 лет эксплуатации системы именно этот способ показал себя лучше всего.

Если база не дорабатывается совсем и меет неизменный цикл рабочей нагрузки, то тогда может и нет смысла обновлять версии. Может такие базы и бывают в жизни.
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35875267
vasilis
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
cpr
Дело в том, что каждый ДБА может рассказать много своих страшилок про ошибку в MTEX.C, которые забарывались или нет техсапортом или не техсапортом. Важно другое: даже если в данной конкретной ситуации подобрали параметры, которые не приводят к падению сервака, то это строго локальный результат, который будет жить скорее всего ограниченное время т.к. могут поменяться объемы данных, характер их распределения, умелые программеры наклепают новых запросов, появятся новые хранимые процедуры, появятся новые технологические решения и т.д. А в это время Informix исправляет баги и выпускает новые релизы. Самый лучший способ ИМХО - освежать версию время от времени. За 12 лет эксплуатации системы именно этот способ показал себя лучше всего.
Полностью согласен. Могу к этому еще добавить, что меняется и операционное окружение, которое иногда уже плохо стыкуется со старыми версиями IDS.
cpr
Если база не дорабатывается совсем и меет неизменный цикл рабочей нагрузки, то тогда может и нет смысла обновлять версии. Может такие базы и бывают в жизни.
Бывают и много :)
Но есть еще момент, о котором в странах СНГ часто забывают - далеко не всегда есть возможность сменить версию СУБД даже при большом желании админа:
- финансовый и лицензионный аспект
- производитель прикладного софта не может (не хочет) выпускать (тестировать) релиз под новые версии СУБД
...
Рейтинг: 0 / 0
Подскажите из за чего может падать сервер
    #35875451
АнатоЛой
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
vasilis
KyRoСкрипт которым мы делаем update statistics
странноватый способ.

+1

vasilis
Основной мой вопрос ведь был в том, чтобы увидеть - не переоптимизируются ли процедуры с включенным PDQ, чего я все равно не увидел...

+1

И, соответственно, совет: не ждите "случайных" переоптимизаций процедур, которые появятся при первом же запуске процедур после сбора статистики по таблицам - добавьте в конец скрипта update statistics следующее:
Код: plaintext
1.
2.
SET PDQPRIORITY  0 ; -- на будущее, когда мы созреем в начале скрипта увеличивать PDQPRIORITY
UPDATE STATISTICS FOR PROCEDURE; -- все процедуры
...
Рейтинг: 0 / 0
25 сообщений из 36, страница 1 из 2
Форумы / Informix [игнор отключен] [закрыт для гостей] / Подскажите из за чего может падать сервер
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]