powered by simpleCommunicator - 2.0.59     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / IBM DB2, WebSphere, IMS, U2 [игнор отключен] [закрыт для гостей] / Помогите установить причину падения БД
11 сообщений из 11, страница 1 из 1
Помогите установить причину падения БД
    #38970516
Александр Тарасенко
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Есть база:
Код: sql
1.
2.
3.
4.
5.
6.
7.
db2level
DB21085I  This instance or install (instance name, where applicable: "db2inst")
uses "64" bits and DB2 code release "SQL09079" with level identifier
"080A0107".
Informational tokens are "DB2 v9.7.0.9", "s131204", "IP23561", and Fix Pack
"9".
Product is installed at "/opt/ibm/db2/V9.7".


Произошло несколько раз ее падение, причем на выходные.
Подозрение на пользователей, которые оставили открытый файл экселя с подключением к базе.
В db2diag.log были подобные записи:
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
2015-05-18-10.14.38.909222+180 I373675566E1362     LEVEL: Severe
PID     : 10881                TID  : 140388736165632PROC : db2sysc 0
INSTANCE: db2inst              NODE : 000          DB   : SOURCES
APPHDL  : 0-47
EDUID   : 39                   EDUNAME: db2agent (SOURCES) 0
FUNCTION: DB2 UDB, DRDA Communication Manager, sqljcReceive, probe:30
MESSAGE : ZRC=0x81360010=-2127167472=SQLZ_RC_CMPARM, SQLT_SQLJC
          "CM parameter bad"
DATA #1 : String, 11 bytes
CCI Error:
DATA #2 : unsigned integer, 8 bytes
68
CALLSTCK: (Static functions may not be resolved correctly, as they are resolved to the nearest symbol)
  [0] 0x00007FAEDBE298D2 pdLog + 0x398
  [1] 0x00007FAEDCE5FA79 _Z16sqljcLogCCIErrorP10sqljCmnMgrPKcP12SQLCC_COND_Thllll + 0x15B
  [2] 0x00007FAEDC00BFD8 _Z12sqljcReceiveP10sqljCmnMgr + 0x322
  [3] 0x00007FAEDC064AD4 _Z19sqljsSecurityDriverP13sqljsDrdaAsCbP14db2UCinterfacelj + 0xBE
  [4] 0x00007FAEDC0638E2 _Z23sqljsDrdaAsAuthenticateP14db2UCinterfacelj + 0x120
  [5] 0x00007FAEDBFE447E _Z21sqlexEngAuthNegotiateP14db2UCinterface + 0x11A
  [6] 0x00007FAEDBFE3555 _Z20sqlexEngAuthenticateP14db2UCinterface + 0x221
  [7] 0x00007FAEDBF6D50E /home/db2inst/sqllib/lib64/libdb2e.so.1 + 0xEB050E
  [8] 0x00007FAEDBF6CCB2 _ZN14sqeApplication13AppLocalStartEP14db2UCinterface + 0x116
  [9] 0x00007FAEDBFCCE75 _Z11sqlelostWrpP14db2UCinterface + 0x1D


Может быть было и такое,
описанное тут .
Ошибка 121: "Превышен тайм-аут семафора" (ERROR_SEM_TIMEOUT).
Это может быть было:
" ... db2 внутри sqloReadFileInterrupt вызывает виндовую tcpRecv и получает ошибку 121."
Однако, сегодня база упала ине реагировала на попытку подключения:
db2 connect to SOURCES
Вообще никакой реакции, висит и все.
Перегрузил по db2stop - db2start, посмотрел логи db2diag.log, а там ничего.
Помогите плиз, что проверить и связаны ли эти проблемы между собой.
...
Рейтинг: 0 / 0
Помогите установить причину падения БД
    #38970537
Mark Barinstein
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Александр Тарасенко,

IC97123: DB2 INSTANCE MIGHT CRASH AFTER REPORTING 'CM PARAMETER BAD' ERROR
Поставьте FP10.
...
Рейтинг: 0 / 0
Помогите установить причину падения БД
    #38970567
Александр Тарасенко
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Но ведь вот этой части не было:

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
2014-01-03-12.13.54.391640+120 E296128A969        LEVEL:
Critical
PID     : 13515174             TID  : 28572       PROC : db2sysc
0
INSTANCE: insta1               NODE : 000         DB   : datab1
APPHDL  : 0-23548              APPID:
112.154.3.224.45490.131007124309
AUTHID  : AUTH1
EDUID   : 18572                EDUNAME: db2agentg (datab1) 0
FUNCTION: DB2 UDB, SQO Memory Management,
sqloDiagnoseFreeBlockFailure, probe:10
MESSAGE : ADM14001C  An unexpected and critical error has
occurred: "Panic".
          The instance may have been shutdown as a result.
"Automatic" FODC
          (First Occurrence Data Capture) has been invoked and
diagnostic
          information has been recorded in directory

"/home/insta1/sqllib/db2dump/FODC_Panic_2014-01-03-12.13.54.3796
47_00
          00/". Please look in this directory for detailed
evidence about what
          happened and contact IBM support if necessary to
diagnose the
          problem.
Below stack trace led to the crash:

Stack #1             Signal #11        Timestamp
2013-10-07-14.43.50.489075
0        sqloCrashOnCriticalMemoryValidationFailure
1        SQLO_MEM_POOL::diagnoseMemoryCorruptionAndCrash
2        SQLO_MEM_POOL::diagnoseMemoryCorruptionAndCrash
3
.MemTreePut.fdpr.clone.224__13SQLO_MEM_POOLFP8SMemNodeUlP17SqloC
hunkSubgroup
4        sqlofmblkEx
5        sqlcctcpfreebuffer
6        sqlccfreebuffer
7        sqlccfreebuffer
8        sqljcCmnMgrTerm
9        sqljsTerm
10       @63@sqljsCleanup
11       @63@sqljsDrdaAsInnerDriver
12       sqljsDrdaAsDriver
13       sqeAgent::RunEDU
14       sqzEDUObj::EDUDriver
15       sqloEDUEntry



в логах ?
...
Рейтинг: 0 / 0
Помогите установить причину падения БД
    #38970588
Александр Тарасенко
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
В общем, нашел начало прошлого падения:
там что-то похожее на
"Detected client termination" in db2diag.log file.

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
 2012-10-07-03.31.44.562773+480 I559988E520 LEVEL: Error

    PID : 2160 TID : 140574011156224PROC : db2sysc
    INSTANCE: db2inst1 NODE : 000 DB : SAMPLE
    APPHDL : 0-4470 APPID: 202.27.30.1.2101.121006192554
    AUTHID : PSOGALAG
    EDUID : 568 EDUNAME: db2agent (SAMPLE)
    FUNCTION: DB2 UDB, common communicati on, sqlcctest, probe:50
    MESSAGE : sqlcctest RC
    DATA #1 : Hexdump, 2 bytes
    0x00007FD9EFFF6780 : 3600

    2012-10-07-03.31.44.543149+480 I560509E538 LEVEL: Error
    PID : 2160 TID : 140574002767616PROC : db2sysc
    INSTANCE: db2inst1 NODE : 000 DB : SAMPLE
    APPHDL : 0-4510 APPID: 202.27.30.1.2286.121006192634
    AUTHID : PSOGALAD
    EDUID : 570 EDUNAME: db2agent (SAMPLE)
    FUNCTION: DB2 UDB, common communication, sqlcctcptest, probe:11
    MESSAGE : Detected client termination
    DATA #1 : Hexdump, 2 bytes
    0x00007FD9EF7F6748 : 3600 


В качестве совета рекомендуют сделать:
Function sqlcctcptest() tests if the client connection is active and function sqlcctest() tests whether the connection is still valid.
If you don't want such messages to be logged into db2diag.log file, you can set DB2CHECKCLIENTINTERVAL to zero.
For Example : Issue following:
1) db2set DB2CHECKCLIENTINTERVAL=0
2) db2stop
3) db2start
Note : This variable specifies the frequency of TCP/IP client connection verifications during an active transaction. It permits early detection of client termination, instead of waiting until after the completion of the query. If this variable is set to 0, no verification is performed.
Но правильно ли это? и что я потеряю при этом?
...
Рейтинг: 0 / 0
Помогите установить причину падения БД
    #38970590
Александр Тарасенко
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
сорри, Марк, не нгаю, важно это или нет, но приведенное из лога было на момент db2stop - db2start.
...
Рейтинг: 0 / 0
Помогите установить причину падения БД
    #38970629
Mark Barinstein
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Александр Тарасенко,

Так зачем же вы показываете записи, не относящиеся к падению?
Покажите всё, что появилось после предполагаемого падения и до следующего старта инстанса.
...
Рейтинг: 0 / 0
Помогите установить причину падения БД
    #38970708
Александр Тарасенко
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Еще раз сорри.
В общем, вот тут начало:

Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
2015-05-17-15.08.34.683142+180 I354717593E544      LEVEL: Error
PID     : 9804                 TID  : 140661076518656PROC : db2sysc 0
INSTANCE: db2inst              NODE : 000          DB   : SOURCES
APPHDL  : 0-35937              APPID: 10.0.16.105.1250.150517120743
AUTHID  : DB2INST
EDUID   : 2620                 EDUNAME: db2agent (SOURCES) 0
FUNCTION: DB2 UDB, common communication, sqlcctcptest, probe:11
MESSAGE : Detected client termination
DATA #1 : Hexdump, 2 bytes
0x00007FEE357F6B28 : 3600                                       6.

2015-05-17-15.08.34.704164+180 I354718138E526      LEVEL: Error
PID     : 9804                 TID  : 140661076518656PROC : db2sysc 0
INSTANCE: db2inst              NODE : 000          DB   : SOURCES
APPHDL  : 0-35937              APPID: 10.0.16.105.1250.150517120743
AUTHID  : DB2INST
EDUID   : 2620                 EDUNAME: db2agent (SOURCES) 0
FUNCTION: DB2 UDB, common communication, sqlcctest, probe:50
MESSAGE : sqlcctest RC
DATA #1 : Hexdump, 2 bytes
0x00007FEE357F6B60 : 3600                                       6.

2015-05-17-15.08.34.704217+180 I354718665E506      LEVEL: Error
PID     : 9804                 TID  : 140661076518656PROC : db2sysc 0
INSTANCE: db2inst              NODE : 000          DB   : SOURCES
APPHDL  : 0-35937              APPID: 10.0.16.105.1250.150517120743
AUTHID  : DB2INST
EDUID   : 2620                 EDUNAME: db2agent (SOURCES) 0
FUNCTION: DB2 UDB, base sys utilities, sqeAgent::AgentBreathingPoint, probe:10
CALLED  : DB2 UDB, common communication, sqlcctest
RETCODE : ZRC=0x00000036=54

2015-05-17-15.08.34.704327+180 I354719172E1253     LEVEL: Warning
PID     : 9804                 TID  : 140661076518656PROC : db2sysc 0
INSTANCE: db2inst              NODE : 000          DB   : SOURCES
APPHDL  : 0-35937              APPID: 10.0.16.105.1250.150517120743
AUTHID  : DB2INST
EDUID   : 2620                 EDUNAME: db2agent (SOURCES) 0
FUNCTION: DB2 UDB, base sys utilities, sqeAgent::AgentBreathingPoint, probe:16
CALLSTCK: (Static functions may not be resolved correctly, as they are resolved to the nearest symbol)
  [0] 0x00007FEE4595F8D2 pdLog + 0x398
  [1] 0x00007FEE45A56266 _Z16sqltLogCallStackjjmmm + 0x18
  [2] 0x00007FEE45AA136A _ZN8sqeAgent19AgentBreathingPointEi + 0x1A52
  [3] 0x00007FEE45ABE7F0 _ZN8sqeDBMgr23StartUsingLocalDatabaseEP8SQLE_BWAP8sqeAgentRccP8sqlo_gmt + 0x2C4
  [4] 0x00007FEE45AA7C1D _ZN14sqeApplication13AppStartUsingEP8SQLE_BWAP8sqeAgentccP5sqlcaPc + 0x233
  [5] 0x00007FEE45AA3F4E /home/db2inst/sqllib/lib64/libdb2e.so.1 + 0xEB0F4E
  [6] 0x00007FEE45AA2D54 _ZN14sqeApplication13AppLocalStartEP14db2UCinterface + 0x1B8
  [7] 0x00007FEE45B02E75 _Z11sqlelostWrpP14db2UCinterface + 0x1D
  [8] 0x00007FEE45B044C5 _Z14sqleUCengnInitP14db2UCinterfacet + 0x51B
  [9] 0x00007FEE45B03481 sqleUCagentConnect + 0x297



дальше повтор вот этих строк вплоть до того, как я сделал db2stop - db2start.
...
Рейтинг: 0 / 0
Помогите установить причину падения БД
    #38970750
Mark Barinstein
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Александр Тарасенко,

И вы расценили эти сообщения как признаки падания инстанса?
Он что, принимать новые соединения перестал, или все приложения повисли?
Если оно висит при подключении, то:
db2fodc -hang full -db SOURCES
и открывать pmr.
...
Рейтинг: 0 / 0
Помогите установить причину падения БД
    #38970760
Александр Тарасенко
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Mark BarinsteinАлександр Тарасенко,

И вы расценили эти сообщения как признаки падания инстанса?
Он что, принимать новые соединения перестал, или все приложения повисли?
Если оно висит при подключении, то:
db2fodc -hang full -db SOURCES
и открывать pmr.

мне надо победить регулярные падения БД.
Она перестала принимать соединения и реагировать на обращения. Совсем.
В принципе, если нужно было как-то поднять саму БД, то конечно я бы хотел правильно это делать.
Но нужно, чтобы не падала.
...
Рейтинг: 0 / 0
Помогите установить причину падения БД
    #39217540
Александр Тарасенко
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Марк, буду благодарен за помощь, плиз
Ситуация повторяется снова и снова
БД становится недоступной, при попытке подключиться по DB2 connect to SOURCES в командной строке все просто зависает на некоторое время и ничего не происходит.
При этом на том же инстансе висит еще одна БД, при попытке подключится соединение происходит, но не сразу, а через секунд 10-15.
При попытке соединиться через например Toad не могу подключиться ни к одной баз даже на других инстансах на этом сервере, бьет ошибку "ERROR [08001] [IBM] SQL30081N A communication error has been detected. Communication protocol being used: "TCP/IP". Communication API being used: "SOCKETS". Location where the error was detected: "10.0.0.42". Communication function detecting the error: "selectForRecvTimeout". Protocol specific error code(s): "0", "*", "*". SQLSTATE=08001" при любом соединении.
Сделал по вашему совету db2fodc -hang full -db SOURCES,
подскажите плиз, как посмотреть pmr и на что обратить внимание?
...
Рейтинг: 0 / 0
Помогите установить причину падения БД
    #39217656
Mark Barinstein
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Александр Тарасенко,

Добрый день.

PMR'ы (запросы на решение проблем) открываются здесь:
www.ibm.com/software/support/probsub.html
...
Рейтинг: 0 / 0
11 сообщений из 11, страница 1 из 1
Форумы / IBM DB2, WebSphere, IMS, U2 [игнор отключен] [закрыт для гостей] / Помогите установить причину падения БД
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]