powered by simpleCommunicator - 2.0.60     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / IBM DB2, WebSphere, IMS, U2 [игнор отключен] [закрыт для гостей] / DB Market Bad
8 сообщений из 8, страница 1 из 1
DB Market Bad
    #38117660
Larry E.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Привет всем.

Ситуация печальная. Подвисла продуктивная база для SAP (db2 9.7.0.4). Остановить базу через force, не получилось. Перегрузили LPAR. База не поднялась, db2diag.log :

2013-01-17-10.13.15.309548+120 E1493989509A949 LEVEL: Critical
PID : 7602320 TID : 75304 PROC : db2sysc 0
INSTANCE: db2bip NODE : 000 DB : BIP
APPHDL : 0-63 APPID: *LOCAL.db2bip.130117081313
AUTHID : SAPBIP
EDUID : 75304 EDUNAME: db2agent (BIP) 0
FUNCTION: DB2 UDB, base sys utilities, sqeLocalDatabase::MarkDBBad, probe:10
MESSAGE : ADM14001C An unexpected and critical error has occurred:
"DBMarkedBad". The instance may have been shutdown as a result.
"Automatic" FODC (First Occurrence Data Capture) has been invoked and
diagnostic information has been recorded in directory
"/db2/BIP/db2dump/FODC_DBMarkedBad_2013-01-17-10.13.15.307549_0000/".
Please look in this directory for detailed evidence about what
happened and contact IBM support if necessary to diagnose the
problem.

После рестарта LPAR, в директории для оперативных журналов, обнаружилось подозрительно большое кол-во файлов, а именно - 258.

Поиск привел сюда.

В db2diag.log присутствует:

2013-01-17-06.51.31.060440+120 I1492667378A589 LEVEL: Info
PID : 33226854 TID : 4114 PROC : db2sysc 0
INSTANCE: db2bip NODE : 000 DB : BIP
EDUID : 4114 EDUNAME: db2loggr (BIP) 0
FUNCTION: DB2 UDB, data protection services, sqlpgadf, probe:510
DATA #1 : <preformatted>
Database is generating log files faster than they can be archived.
4 files left before reaching maximum allowable unarchived files.
Check that the archiving is working properly.
DB2 will wait up to 5 minutes

1. Почему могла возникнуть такая ситуация с активными журналами транзакций?
2. Спас ли в такой ситуации HADR (база не поднялась, переключились на standby)?

Укладываю часть лога с ошибками, c момента, когда база работала.

Приняли решение поднять базу из бэкапа и выполнить pint in time recovery.
...
Рейтинг: 0 / 0
DB Market Bad
    #38117764
m72
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
m72
Гость
автор1. Почему могла возникнуть такая ситуация с активными журналами транзакций?
Возможно ошибка внешней библиотеки, используемой для перемещения архивных логов.
Покажите настройки для архивирования логов, м.б. будет понятнее.

автор2. Спас ли в такой ситуации HADR (база не поднялась, переключились на standby)?
Именно такой ситуации (с ошибкой в перемещении логов) не было, но аппаратный сбой на primary node
HACMP+HADR отработали без особых проблем.
...
Рейтинг: 0 / 0
DB Market Bad
    #38117786
Larry E.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
m72, имелось ввиду это ?

Log retain for recovery status = RECOVERY
User exit for logging status = YES
Catalog cache size (4KB) (CATALOGCACHE_SZ) = 2560
Log buffer size (4KB) (LOGBUFSZ) = 2048
Log file size (4KB) (LOGFILSIZ) = 65536
Number of primary log files (LOGPRIMARY) = 20
Number of secondary log files (LOGSECOND) = -1
Changed path to log files (NEWLOGPATH) =
Path to log files = /db2/BIP/db2bip/NODE0000/SQL00001/SQLOGDIR/
Overflow log path (OVERFLOWLOGPATH) =
Mirror log path (MIRRORLOGPATH) =
First active log file = S1773243.LOG
Block log on disk full (BLK_LOG_DSK_FUL) = YES
Block non logged operations (BLOCKNONLOGGED) = NO
Percent max primary log space by transaction (MAX_LOG) = 0
Num. of active log files for 1 active UOW(NUM_LOG_SPAN) = 500
Percent log file reclaimed before soft chckpt (SOFTMAX) = 300
Log retain for recovery enabled (LOGRETAIN) = RECOVERY
User exit for logging enabled (USEREXIT) = OFF
HADR log write synchronization mode (HADR_SYNCMODE) = NEARSYNC
First log archive method (LOGARCHMETH1) = DISK:/db2/BIP/log_archive/
Options for logarchmeth1 (LOGARCHOPT1) =
Second log archive method (LOGARCHMETH2) = VENDOR:/usr/tivoli/tsm/tdp_r3/db264/libtdpdb264.a
Options for logarchmeth2 (LOGARCHOPT2) = /db2/BIP/tdp_r3/vendor.env
Failover log archive path (FAILARCHPATH) = /db2/BIP/log_archive/log_failure/
Number of log archive retries on error (NUMARCHRETRY) = 5
Log archive retry Delay (secs) (ARCHRETRYDELAY) = 20
Log pages during index build (LOGINDEXBUILD) = OFF
...
Рейтинг: 0 / 0
DB Market Bad
    #38117827
CawaSPb
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Larry E.,

Первое, что в такой ситуации немедленно сделать:
Код: plaintext
db2support
результат - в IBM.


Началось всё как раз с проблемами с архивированием через logarchmeth2 (/usr/tivoli/tsm/tdp_r3/db264/libtdpdb264.a):
2013-01-17-02.42.33

После рестарта crash recovery благополучно прошёл:
2013-01-17-10.10.31.551446

Но вот почему оно дальше "жить не захотело", это уже похоже на проблему самой DB2 или файловой системы содержащей логи.
...
Рейтинг: 0 / 0
DB Market Bad
    #38117895
m72
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
m72
Гость
авторDatabase is generating log files faster than they can be archived.
2 files left before reaching maximum allowable unarchived files.
Check that the archiving is working properly.
DB2 will wait up to 5 minutes for active log S1775672.LOG to be archived.

Страшная вещь оказывается, этот SAP.

Larry E.,
М.б. оставить архивирование логов только на диск и проверить TSM?
...
Рейтинг: 0 / 0
DB Market Bad
    #38117908
m72
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
m72
Гость
p.s. в этом случае (архивирование только на диск) можно будет увеличить размер файла журнала
на столько, на сколько /db2/BIP/db2bip позволит (или до максимума).
...
Рейтинг: 0 / 0
DB Market Bad
    #38118981
Larry E.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Базу восстановили, файловая система и TSM ошибок не показали.

Вся это как минимум странно и ситуация может повториться, без PMR не обойтись. Жаль что в панике соблазнились на перезапуск LPAR, забыли собрать диагностическую информацию.

Не делайте так.

По поводу кол-ва активных логов, решили выставить параметр Number of secondary log files (LOGSECOND) = 0 и обойтись основными журналами. Посмотрим.

Марк хотелось бы прочитать Ваше мнение на счет этой ситуации.
...
Рейтинг: 0 / 0
DB Market Bad
    #38119108
Mark Barinstein
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Larry E.,

Ошибка с журналированием
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
2013-01-17-10.13.15.179591+120 I1493942044A543    LEVEL: Error
PID     : 7602320              TID  : 75304       PROC : db2sysc 0
INSTANCE: db2bip               NODE : 000         DB   : BIP
APPHDL  : 0-63                 APPID: *LOCAL.db2bip.130117081313
AUTHID  : SAPBIP  
EDUID   : 75304                EDUNAME: db2agent (BIP) 0
FUNCTION: DB2 UDB, data protection services, sqlpWriteToLog, probe:90
MESSAGE : The log state was marked bad by another process, this message is not 
          an indication of an error with the logger process.

2013-01-17-10.13.15.179760+120 I1493942588A538    LEVEL: Error
PID     : 7602320              TID  : 75304       PROC : db2sysc 0
INSTANCE: db2bip               NODE : 000         DB   : BIP
APPHDL  : 0-63                 APPID: *LOCAL.db2bip.130117081313
AUTHID  : SAPBIP  
EDUID   : 75304                EDUNAME: db2agent (BIP) 0
FUNCTION: DB2 UDB, data protection services, sqlpWriteLR, probe:13130
MESSAGE : ZRC=0x8610000D=-2045771763=SQLP_BADLOG "Log File cannot be used"
          DIA8414C Logging can not continue due to an error.

2013-01-17-10.13.15.179918+120 I1493943127A530    LEVEL: Severe
PID     : 7602320              TID  : 75304       PROC : db2sysc 0
INSTANCE: db2bip               NODE : 000         DB   : BIP
APPHDL  : 0-63                 APPID: *LOCAL.db2bip.130117081313
AUTHID  : SAPBIP  
EDUID   : 75304                EDUNAME: db2agent (BIP) 0
FUNCTION: DB2 UDB, data management, sqldInsertRow, probe:325
RETCODE : ZRC=0x8610000D=-2045771763=SQLP_BADLOG "Log File cannot be used"
          DIA8414C Logging can not continue due to an error.

Что именно случилось - надо дампы смотреть.
Может быть, что файл испортился, может - программная ошибка.
...
Рейтинг: 0 / 0
8 сообщений из 8, страница 1 из 1
Форумы / IBM DB2, WebSphere, IMS, U2 [игнор отключен] [закрыт для гостей] / DB Market Bad
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]