powered by simpleCommunicator - 2.0.59     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / IBM DB2, WebSphere, IMS, U2 [игнор отключен] [закрыт для гостей] / зависшее подключение к базе
7 сообщений из 7, страница 1 из 1
зависшее подключение к базе
    #37332594
Peter Wilson
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Здравствуйте! История следующая: вечером на тестовой базе (DB2 9.1 FP3) проводились некоторые работы. Также что-то еще на сервере вертелось, что это все жутко стало тормозить. Решил перезагрузиться. Первоначально выполнил force applications. Все подключения отвалились, за исключением одного. Начал смотреть, что он делает, а там шел откат транзакции размером примерно в 5ГБ. Проходит час, откатилось только 800 МБ. Решил перезагрузиться. Через некоторое время после перезагрузки захожу на сервер с базой, пытаюсь выполнить подключение. Подключение висит. Да, идет crash recovery. По истечению времени в db2diag.log вижу, что крэш рекавери закончился, но пошли какие-то странные ошибки. Ниже фрагмент этого:
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
102.
103.
104.
105.
106.
107.
108.
109.
110.
111.
112.
113.
114.
115.
116.
117.
118.
119.
120.
121.
122.
123.
124.
125.
126.
127.
128.
129.
130.
131.
132.
133.
134.
135.
136.
137.
138.
139.
140.
141.
142.
143.
144.
145.
146.
147.
 2011 - 07 - 01 - 00 . 40 . 53 . 739969 + 360  I2660831E369       LEVEL: Warning
PID     :  7886                  TID  : 46935395518288PROC : db2agent (TEST)  0 
INSTANCE: db2inst1             NODE :  000 
APPHDL  :  0 - 43                  APPID: *LOCAL.db2inst1. 110630184052 
AUTHID  : DB2INST1
FUNCTION: DB2 UDB, base sys utilities, sqledint, probe: 30 
MESSAGE : Crash Recovery is needed. 

 2011 - 07 - 01 - 00 . 40 . 58 . 565304 + 360  I2661201E456       LEVEL: Warning
PID     :  7886                  TID  : 46935395518288PROC : db2agent (TEST)  0 
INSTANCE: db2inst1             NODE :  000          DB   : TEST
APPHDL  :  0 - 43                  APPID: *LOCAL.db2inst1. 110630184052 
AUTHID  : DB2INST1
FUNCTION: DB2 UDB, recovery manager, sqlpresr, probe: 410 
MESSAGE : Crash recovery started. LowtranLSN 000000384BFD55DF MinbuffLSN 
          000000398029F921

 2011 - 07 - 01 - 00 . 40 . 58 . 583346 + 360  I2661658E453       LEVEL: Warning
PID     :  7886                  TID  : 46935395518288PROC : db2agent (TEST)  0 
INSTANCE: db2inst1             NODE :  000          DB   : TEST
APPHDL  :  0 - 43                  APPID: *LOCAL.db2inst1. 110630184052 
AUTHID  : DB2INST1
FUNCTION: DB2 UDB, recovery manager, sqlprecm, probe: 2000 
DATA # 1  : <preformatted>
Using parallel recovery with  9  agents  21  QSets  168  queues and  16  chunks

 2011 - 07 - 01 - 00 . 40 . 58 . 610186 + 360  E2662112E447       LEVEL: Warning
PID     :  7968                  TID  : 46935395518288PROC : db2redom (TEST)  0 
INSTANCE: db2inst1             NODE :  000          DB   : TEST
APPHDL  :  0 - 43                  APPID: *LOCAL.db2inst1. 110630184052 
AUTHID  : DB2INST1
FUNCTION: DB2 UDB, recovery manager, sqlpParallelRecovery, probe: 880 
DATA # 1  : <preformatted>
Resetting max shredder memory to  6361462  from  17203200 

 2011 - 07 - 01 - 00 . 43 . 28 . 386168 + 360  I2662560E1548      LEVEL: Warning (OS)
PID     :  9258                  TID  : 46935395518288PROC : db2agent (instance)  0 
INSTANCE: db2inst1             NODE :  000 
APPHDL  :  0 - 44                  APPID: *LOCAL.db2inst1. 110630184128 
AUTHID  : DB2INST1
FUNCTION: DB2 UDB, SQO Latch Tracing, sqlo_xsemlatch::getConflict, probe: 5 
CALLED  : OS, -, semop                            OSERR: EINTR ( 4 )
DATA # 1  : String,  24  bytes
self-correction occurred
DATA # 2  : Codepath,  8  bytes
 4 : 8 : 16 : 18 
DATA # 3  : Pointer,  8  bytes
0x0000000220014d98
DATA # 4  : signed integer,  4  bytes
 4 
DATA # 5  : Pointer,  8  bytes
0x00000002002db590
DATA # 6  : Hexdump,  24  bytes
0x00000002002DB590 : 01CC  0100   0000   0000   0000   0000   0000   0000     ................
0x00000002002DB5A0 : 00CC  0100   0000   0000                         ........
CALLSTCK: 
  [ 0 ] 0x00002AAFF85CD909 sqloXlatchNewConflict + 0x371
  [ 1 ] 0x00002AAFF8102807 /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0x956807
  [ 2 ] 0x00002AAFF8A4B021 /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0x129F021
  [ 3 ] 0x00002AAFF8A39912 /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0x128D912
  [ 4 ] 0x00002AAFF81ED5BC /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0xA415BC
  [ 5 ] 0x00002AAFF8A0E671 /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0x1262671
  [ 6 ] 0x00002AAFF8A42377 /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0x1296377
  [ 7 ] 0x00002AAFF81745E6 /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0x9C85E6
  [ 8 ] 0x00002AAFF8175D72 /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0x9C9D72
  [ 9 ] 0x00002AAFF85551BF /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0xDA91BF

 2011 - 07 - 01 - 00 . 44 . 02 . 777302 + 360  I2664109E372       LEVEL: Warning
PID     :  9121                  TID  : 46935395518288PROC : db2loggw (TEST)  0 
INSTANCE: db2inst1             NODE :  000 
FUNCTION: DB2 UDB, data protection services, sqlpgasn2, probe: 2790 
DATA # 1  : <preformatted>
Incomplete log record at end, nextLsn 0000003995603FCD recoveryLastPageLsn 0000003995603FFB

 2011 - 07 - 01 - 00 . 44 . 02 . 812747 + 360  I2664482E466       LEVEL: Warning
PID     :  7886                  TID  : 46935395518288PROC : db2agent (TEST)  0 
INSTANCE: db2inst1             NODE :  000          DB   : TEST
APPHDL  :  0 - 43                  APPID: *LOCAL.db2inst1. 110630184052 
AUTHID  : DB2INST1
FUNCTION: DB2 UDB, recovery manager, sqlprecm, probe: 4000 
MESSAGE : DIA2051W Forward phase of crash recovery has completed.  Next LSN is 
          "0000003995603FCD".

 2011 - 07 - 01 - 00 . 45 . 28 . 929148 + 360  I2664949E1548      LEVEL: Warning (OS)
PID     :  9258                  TID  : 46935395518288PROC : db2agent (instance)  0 
INSTANCE: db2inst1             NODE :  000 
APPHDL  :  0 - 44                  APPID: *LOCAL.db2inst1. 110630184128 
AUTHID  : DB2INST1
FUNCTION: DB2 UDB, SQO Latch Tracing, sqlo_xsemlatch::getConflict, probe: 5 
CALLED  : OS, -, semop                            OSERR: EINTR ( 4 )
DATA # 1  : String,  24  bytes
self-correction occurred
DATA # 2  : Codepath,  8  bytes
 4 : 8 : 16 : 18 
DATA # 3  : Pointer,  8  bytes
0x0000000220014c98
DATA # 4  : signed integer,  4  bytes
 4 
DATA # 5  : Pointer,  8  bytes
0x00000002002db590
DATA # 6  : Hexdump,  24  bytes
0x00000002002DB590 : 01CC  0100   0000   0000  984C  0120   0200   0000     .........L. ....
0x00000002002DB5A0 : 00CC  0100   0000   0000                         ........
CALLSTCK: 
  [ 0 ] 0x00002AAFF85CD909 sqloXlatchNewConflict + 0x371
  [ 1 ] 0x00002AAFF8102807 /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0x956807
  [ 2 ] 0x00002AAFF8A4B021 /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0x129F021
  [ 3 ] 0x00002AAFF8A39912 /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0x128D912
  [ 4 ] 0x00002AAFF81ED5BC /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0xA415BC
  [ 5 ] 0x00002AAFF8A0E671 /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0x1262671
  [ 6 ] 0x00002AAFF8A42377 /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0x1296377
  [ 7 ] 0x00002AAFF81745E6 /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0x9C85E6
  [ 8 ] 0x00002AAFF8175D72 /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0x9C9D72
  [ 9 ] 0x00002AAFF85551BF /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0xDA91BF

 2011 - 07 - 01 - 00 . 46 . 58 . 198244 + 360  I2666498E1523      LEVEL: Warning (OS)
PID     :  9203                  TID  : 46935395518288PROC : db2agent (TEST)  0 
INSTANCE: db2inst1             NODE :  000 
APPHDL  :  0 - 45                  APPID: *LOCAL.db2inst1. 110630184458 
AUTHID  : DB2INST1
FUNCTION: DB2 UDB, SQO Latch Tracing, sqlo_xsemlatch::getConflict, probe: 5 
CALLED  : OS, -, semop                            OSERR: EINTR ( 4 )
DATA # 1  : String,  24  bytes
self-correction occurred
DATA # 2  : Codepath,  8  bytes
 4 : 8 : 16 : 18 
DATA # 3  : Pointer,  8  bytes
0x0000000220014d98
DATA # 4  : signed integer,  4  bytes
 4 
DATA # 5  : Pointer,  8  bytes
0x00000002002db590
DATA # 6  : Hexdump,  24  bytes
0x00000002002DB590 : 01CC  0100   0000   0000  984D  0120   0200   0000     .........M. ....
0x00000002002DB5A0 : 00CC  0100   0000   0000                         ........
CALLSTCK: 
  [ 0 ] 0x00002AAFF85CD909 sqloXlatchNewConflict + 0x371
  [ 1 ] 0x00002AAFF8102807 /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0x956807
  [ 2 ] 0x00002AAFF8164CB8 /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0x9B8CB8
  [ 3 ] 0x00002AAFF816F25D /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0x9C325D
  [ 4 ] 0x00002AAFF815EFD1 /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0x9B2FD1
  [ 5 ] 0x00002AAFF815DE60 /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0x9B1E60
  [ 6 ] 0x00002AAFF81B38AC /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0xA078AC
  [ 7 ] 0x00002AAFF81B2A13 sqleUCagentConnect + 0x31B
  [ 8 ] 0x00002AAFF8212835 /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0xA66835
  [ 9 ] 0x00002AAFF81FC231 /opt/ibm/db2/V9. 1 /lib64/libdb2e.so. 1  + 0xA50231


Ошибки идут каждую минуту. Погуглив, нашел рекомендации от IBM .
Обновился до 7го фикспака. Перезагружаю сервер (иначе никак, даже force applications не срабатывают), подключаюсь. Ситуация аналогичная, но нет уже ошибок. Смотрю в каталог, где лежат журналы, они перезаписываются (метод логирования циркулярный).
Пришел к окончательному выводу, что повредились в ходе перезагрузки файлы журналов транзакции. Как мне быть?

PS Бэкапов нет, но есть возможность пересоздания из скриптов, внешних данных. Но мне интересно восстановить работоспособность базы. Обращение к IBM тоже неприемлемо, так как срок действия лицензии закончился давным-давно. Поддержи не было и подавно.

Заранее благодарю уччастников форума.
...
Рейтинг: 0 / 0
зависшее подключение к базе
    #37332795
andyf
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Peter Wilson,

вот так с ходу по логу я не вижу, что crash recovery закончилась. Закончилась "Forward stage", но есть еще "backward". Что говорит снапшот по БД?
...
Рейтинг: 0 / 0
зависшее подключение к базе
    #37332857
Mark Barinstein
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Peter Wilson,

Здравствуйте.

Что выдаёт:
Код: plaintext
db2pd -recovery -db test
...
Рейтинг: 0 / 0
зависшее подключение к базе
    #37333241
Peter Wilson
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Извиняюсь за паузу.

Марк, andyf, вот:
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
db2pd -recovery -db test

Database Partition  0  -- Database TEST -- Active -- Up 0 days 12:38:15

Recovery:
Database is not in recovery state.


Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
102.
103.
104.
105.
106.
107.
108.
109.
110.
111.
112.
113.
114.
115.
116.
117.
118.
119.
120.
121.
122.
123.
124.
125.
126.
127.
128.
129.
130.
131.
132.
133.
134.
135.
136.
137.
138.
139.
140.
141.
142.
143.
144.
145.
146.
147.
148.
149.
150.
151.
152.
153.
154.
155.
156.
157.
158.
159.
160.
161.
162.
163.
164.
165.
166.
167.
168.
169.
170.
171.
172.
173.
174.
175.
176.
177.
178.
179.
180.
181.
182.
183.
184.
185.
186.
187.
188.
189.
190.
191.
192.
193.
194.
195.
196.
197.
198.
199.
200.
201.
202.
203.
204.
205.
206.
207.
208.
209.
210.
211.
212.
213.
214.
215.
216.
217.
218.
219.
220.
221.
222.
223.
224.
225.
226.
227.
228.
229.
230.
231.
232.
233.
234.
235.
236.
237.
238.
239.
240.
241.
242.
243.
244.
245.
246.
247.
248.
249.
250.
251.
252.
253.
254.
255.
256.
257.
258.
259.
260.
261.
262.
263.
264.
265.
266.
267.
268.
269.
270.
271.
272.
273.
274.
275.
276.
277.
278.
279.
280.
281.
282.
283.
284.
285.
286.
287.
288.
289.
290.
291.
292.
293.
294.
295.
296.
297.
298.
299.
300.
301.
302.
303.
304.
305.
306.
307.
308.
309.
310.
311.
312.
313.
314.
315.
316.
317.
318.
 db2 get snapshot for database on test
              Database Snapshot

Database name                              = TEST
Database path                              = /home/db2inst1/db2inst1/NODE0000/SQL00002/
Input database alias                       = TEST
Database status                            = Active
Catalog database partition number          =  0 
Catalog network node name                  =
Operating system running at database server= LINUXAMD64
Location of the database                   = Local
First database connect timestamp           =  07 / 01 / 2011   10 : 58 : 31 . 503225 
Last reset timestamp                       =
Last backup timestamp                      =  03 / 30 / 2011   11 : 30 : 39 . 000000 
Snapshot timestamp                         =  07 / 01 / 2011   23 : 42 : 37 . 584475 

Number of automatic storage paths          =  1 
Automatic storage path                     = /home/db2inst1
      Node number                          =  0 
      File system ID                       =  64770 
      Storage path free space (bytes)      =  42334920704 
      File system used space (bytes)       =  59168727040 
      File system total space (bytes)      =  101570756608 

High water mark for connections            =  9 
Application connects                       =  421 
Secondary connects total                   =  3 
Applications connected currently           =  1 
Appls. executing in db manager currently   =  0 
Agents associated with applications        =  4 
Maximum agents associated with applications=  9 
Maximum coordinating agents                =  9 

Locks held currently                       =  0 
Lock waits                                 =  10 
Time database waited on locks (ms)         =  6868 
Lock list memory in use (Bytes)            =  4352 
Deadlocks detected                         =  0 
Lock escalations                           =  0 
Exclusive lock escalations                 =  0 
Agents currently waiting on locks          =  0 
Lock Timeouts                              =  0 
Number of indoubt transactions             =  0 

Total Private Sort heap allocated          =  0 
Total Shared Sort heap allocated           =  6 
Shared Sort heap high water mark           =  348 
Post threshold sorts (shared memory)       =  0 
Total sorts                                =  90 
Total sort time (ms)                       =  331 
Sort overflows                             =  0 
Active sorts                               =  0 
Buffer pool data logical reads             =  7575606 
Buffer pool data physical reads            =  75429 
Buffer pool temporary data logical reads   =  22 
Buffer pool temporary data physical reads  =  0 
Asynchronous pool data page reads          =  18463 
Buffer pool data writes                    =  32053 
Asynchronous pool data page writes         =  31704 
Buffer pool index logical reads            =  9241255 
Buffer pool index physical reads           =  1129332 
Buffer pool temporary index logical reads  =  0 
Buffer pool temporary index physical reads =  0 
Asynchronous pool index page reads         =  991 
Buffer pool index writes                   =  975010 
Asynchronous pool index page writes        =  974300 
Buffer pool xda logical reads              =  2 
Buffer pool xda physical reads             =  2 
Buffer pool temporary xda logical reads    =  0 
Buffer pool temporary xda physical reads   =  0 
Buffer pool xda writes                     =  0 
Asynchronous pool xda page reads           =  0 
Asynchronous pool xda page writes          =  0 
Total buffer pool read time (milliseconds) =  14557763 
Total buffer pool write time (milliseconds)=  14545290 
Total elapsed asynchronous read time       =  6379 
Total elapsed asynchronous write time      =  14506500 
Asynchronous data read requests            =  4477 
Asynchronous index read requests           =  307 
Asynchronous xda read requests             =  0 
No victim buffers available                =  1189787 
LSN Gap cleaner triggers                   =  333 
Dirty page steal cleaner triggers          =  968 
Dirty page threshold cleaner triggers      =  50629 
Time waited for prefetch (ms)              =  2598 
Unread prefetch pages                      =  77 
Direct reads                               =  61988 
Direct writes                              =  2050 
Direct read requests                       =  3944 
Direct write requests                      =  134 
Direct reads elapsed time (ms)             =  70084 
Direct write elapsed time (ms)             =  492 
Database files closed                      =  0 
Host execution elapsed time                =  44 . 851388 

Commit statements attempted                =  18843 
Rollback statements attempted              =  1 
Dynamic statements attempted               =  164575 
Static statements attempted                =  19313 
Failed statement operations                =  16 
Select SQL statements executed             =  48427 
Xquery statements executed                 =  0 
Update/Insert/Delete statements executed   =  18742 
DDL statements executed                    =  17 
Inactive stmt history memory usage (bytes) =  0 

Internal automatic rebinds                 =  0 
Internal rows deleted                      =  0 
Internal rows inserted                     =  0 
Internal rows updated                      =  0 
Internal commits                           =  22675 
Internal rollbacks                         =  0 
Internal rollbacks due to deadlock         =  0 

Rows deleted                               =  0 
Rows inserted                              =  4 
Rows updated                               =  106828 
Rows selected                              =  98718 
Rows read                                  =  591319 
Binds/precompiles attempted                =  30 
Log space available to the database (Bytes)=  14660933575 
Log space used by the database (Bytes)     =  45344825 
Maximum secondary log space used (Bytes)   =  0 
Maximum total log space used (Bytes)       =  45356212 
Secondary logs allocated currently         =  0 
Log pages read                             =  270729 
Log read time (sec.ns)                     =  2710 . 000000004 
Log pages written                          =  32082 
Log write time (sec.ns)                    =  6 . 000000004 
Number write log IOs                       =  26359 
Number read log IOs                        =  33842 
Number partial page log IOs                =  18756 
Number log buffer full                     =  6 
Log data found in buffer                   =  8485241 
Log to be redone for recovery (Bytes)      =  45522633 
Log accounted for by dirty pages (Bytes)   =  45371747 

Node number                                =  0 
File number of first active log            =  151 
File number of last active log             =  150 
File number of current active log          =  0 
File number of log being archived          = Not applicable

Package cache lookups                      =  67735 
Package cache inserts                      =  169 
Package cache overflows                    =  0 
Package cache high water mark (Bytes)      =  1100180 
Application section lookups                =  164619 
Application section inserts                =  198 

Catalog cache lookups                      =  1993 
Catalog cache inserts                      =  70 
Catalog cache overflows                    =  0 
Catalog cache high water mark              =  674480 

Workspace Information

 Shared high water mark                    =  536096 
 Corresponding shared overflows            =  0 
 Total shared section inserts              =  72 
 Total shared section lookups              =  48659 
 Private high water mark                   =  70096 
 Corresponding private overflows           =  0 
 Total private section inserts             =  126 
 Total private section lookups             =  133 
Number of hash joins                       =  17 
Number of hash loops                       =  0 
Number of hash join overflows              =  0 
Number of small hash join overflows        =  0 
Post threshold hash joins (shared memory)  =  0 
Active hash joins                          =  0 


Memory usage for database:

  Node number                                  =  0 
    Memory Pool Type                           = Backup/Restore/Util Heap
       Current size (bytes)                    =  65536 
       High water mark (bytes)                 =  196608 
       Configured size (bytes)                 =  131072000 

  Node number                                  =  0 
    Memory Pool Type                           = Package Cache Heap
       Current size (bytes)                    =  1310720 
       High water mark (bytes)                 =  1310720 
       Configured size (bytes)                 =  5636096 

  Node number                                  =  0 
    Memory Pool Type                           = Catalog Cache Heap
       Current size (bytes)                    =  720896 
       High water mark (bytes)                 =  720896 
       Configured size (bytes)                 =  2818048 

  Node number                                  =  0 
    Memory Pool Type                           = Buffer Pool Heap
       Secondary ID                            =  3 
       Current size (bytes)                    =  263585792 
       High water mark (bytes)                 =  263585792 
       Configured size (bytes)                 =  263585792 

  Node number                                  =  0 
    Memory Pool Type                           = Buffer Pool Heap
       Secondary ID                            =  2 
       Current size (bytes)                    =  33095680 
       High water mark (bytes)                 =  33095680 
       Configured size (bytes)                 =  33095680 

  Node number                                  =  0 
    Memory Pool Type                           = Buffer Pool Heap
       Secondary ID                            =  1 
       Current size (bytes)                    =  4718592 
       High water mark (bytes)                 =  720896 
       Configured size (bytes)                 =  720896 

  Node number                                  =  0 
    Memory Pool Type                           = Buffer Pool Heap
       Secondary ID                            = System 16k buffer pool
       Current size (bytes)                    =  458752 
       High water mark (bytes)                 =  458752 
       Configured size (bytes)                 =  458752 

  Node number                                  =  0 
    Memory Pool Type                           = Buffer Pool Heap
       Secondary ID                            = System 8k buffer pool
       Current size (bytes)                    =  327680 
       High water mark (bytes)                 =  327680 
       Configured size (bytes)                 =  327680 

  Node number                                  =  0 
    Memory Pool Type                           = Buffer Pool Heap
       Secondary ID                            = System 4k buffer pool
       Current size (bytes)                    =  262144 
       High water mark (bytes)                 =  262144 
       Configured size (bytes)                 =  262144 

  Node number                                  =  0 
    Memory Pool Type                           = Shared Sort Heap
       Current size (bytes)                    =  327680 
       High water mark (bytes)                 =  1769472 
       Configured size (bytes)                 =  29097984 

  Node number                                  =  0 
    Memory Pool Type                           = Lock Manager Heap
       Current size (bytes)                    =  5373952 
       High water mark (bytes)                 =  5373952 
       Configured size (bytes)                 =  5439488 

  Node number                                  =  0 
    Memory Pool Type                           = Database Heap
       Current size (bytes)                    =  6750208 
       High water mark (bytes)                 =  14352384 
      Configured size (bytes)                 =  28311552 

  Node number                                  =  0 
    Memory Pool Type                           = Other Memory
       Current size (bytes)                    =  262144 
       High water mark (bytes)                 =  262144 
       Configured size (bytes)                 =  21168128 

  Node number                                  =  0 
    Memory Pool Type                           = Application Control Heap
       Current size (bytes)                    =  65536 
       High water mark (bytes)                 =  65536 
       Configured size (bytes)                 =  1441792 

  Node number                                  =  0 
    Memory Pool Type                           = Application Control Heap
       Current size (bytes)                    =  65536 
       High water mark (bytes)                 =  65536 
       Configured size (bytes)                 =  1441792 

  Node number                                  =  0 
    Memory Pool Type                           = Application Control Heap
       Current size (bytes)                    =  65536 
       High water mark (bytes)                 =  65536 
       Configured size (bytes)                 =  1441792 

  Node number                                  =  0 
    Memory Pool Type                           = Application Control Heap
       Current size (bytes)                    =  65536 
       High water mark (bytes)                 =  65536 
       Configured size (bytes)                 =  1441792 

  Node number                                  =  0 
    Memory Pool Type                           = Application Control Heap
       Current size (bytes)                    =  65536 
       High water mark (bytes)                 =  65536 
       Configured size (bytes)                 =  1441792 

  Node number                                  =  0 
    Memory Pool Type                           = Application Control Heap
       Current size (bytes)                    =  65536 
       High water mark (bytes)                 =  65536 
       Configured size (bytes)                 =  1441792 

  Node number                                  =  0 
    Memory Pool Type                           = Application Control Heap
       Current size (bytes)                    =  65536 
       High water mark (bytes)                 =  65536 
       Configured size (bytes)                 =  1441792 
  Node number                                  =  0 
    Memory Pool Type                           = Application Control Heap
       Current size (bytes)                    =  65536 
       High water mark (bytes)                 =  65536 
       Configured size (bytes)                 =  1441792 

  Node number                                  =  0 
    Memory Pool Type                           = Application Control Heap
       Current size (bytes)                    =  655360 
       High water mark (bytes)                 =  655360 
       Configured size (bytes)                 =  1441792 

  Node number                                  =  0 
    Memory Pool Type                           = Application Group Shared Heap
       Current size (bytes)                    =  43057152 
       High water mark (bytes)                 =  43057152 
       Configured size (bytes)                 =  86147128 

Показалось, что все работает нормально. Захожу на сервер, смотрю, что все в порядке, база работает (в промежутке с 18.00 до 0.00 физически не мог открыть vnc-сессию).

Снова смотрю db2diag.log, вижу такую картину:

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
 2011 - 07 - 01 - 15 . 42 . 21 . 403077 + 360  I5546744E421       LEVEL: Warning
PID     :  7898                  TID  : 47917387835296PROC : db2agent (TEST)  0 
INSTANCE: db2inst1             NODE :  000          DB   : TEST
APPHDL  :  0 - 11                  APPID: *LOCAL.db2inst1. 110701045831 
AUTHID  : DB2INST1
FUNCTION: DB2 UDB, recovery manager, sqlpresr, probe: 3170 
MESSAGE : Crash recovery completed. Next LSN is 0000003ABEBA000C
...


Ну и далее пошел сбор статистики.
Получается, что у меня, в результате обрыва длинной транзакции, был долгий крэш-рекавери? Он может быть порядка 10-15 часов?
...
Рейтинг: 0 / 0
зависшее подключение к базе
    #37333274
Peter Wilson
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
В дополнение к предыдущему посту. В первой половине дня делался перезагруз сервера БД (в процессе нескольких моментов, ну и после установки фикспака). В диаглоге нашел момент, когда выполняется крэш-рекавери:

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
 2011 - 07 - 01 - 10 . 58 . 32 . 832834 + 360  I5467922E369       LEVEL: Warning
PID     :  7898                  TID  : 47917387835296PROC : db2agent (TEST)  0 
INSTANCE: db2inst1             NODE :  000 
APPHDL  :  0 - 11                  APPID: *LOCAL.db2inst1. 110701045831 
AUTHID  : DB2INST1
FUNCTION: DB2 UDB, base sys utilities, sqledint, probe: 30 
MESSAGE : Crash Recovery is needed. 

 2011 - 07 - 01 - 10 . 58 . 37 . 619502 + 360  I5468292E456       LEVEL: Warning
PID     :  7898                  TID  : 47917387835296PROC : db2agent (TEST)  0 
INSTANCE: db2inst1             NODE :  000          DB   : TEST
APPHDL  :  0 - 11                  APPID: *LOCAL.db2inst1. 110701045831 
AUTHID  : DB2INST1
FUNCTION: DB2 UDB, recovery manager, sqlpresr, probe: 410 
MESSAGE : Crash recovery started. LowtranLSN 000000384BFD55DF MinbuffLSN 
          0000003A6BE296B6

 2011 - 07 - 01 - 10 . 58 . 37 . 636982 + 360  I5468749E452       LEVEL: Warning
PID     :  7898                  TID  : 47917387835296PROC : db2agent (TEST)  0 
INSTANCE: db2inst1             NODE :  000          DB   : TEST
APPHDL  :  0 - 11                  APPID: *LOCAL.db2inst1. 110701045831 
AUTHID  : DB2INST1
FUNCTION: DB2 UDB, recovery manager, sqlprecm, probe: 2000 
DATA # 1  : <preformatted>
Using parallel recovery with  3  agents  21  QSets  63  queues and  16  chunks

 2011 - 07 - 01 - 11 . 04 . 37 . 101992 + 360  I5470016E305       LEVEL: Warning
PID     :  8145                  TID  : 47917387835296PROC : db2lfr (TEST)  0 
INSTANCE: db2inst1             NODE :  000 
FUNCTION: DB2 UDB, data protection services, sqlpgarl, probe: 99 
MESSAGE : INFO ONLY: Found an old page in the log file

 2011 - 07 - 01 - 11 . 04 . 37 . 237185 + 360  I5470322E372       LEVEL: Warning
PID     :  8144                  TID  : 47917387835296PROC : db2loggw (TEST)  0 
INSTANCE: db2inst1             NODE :  000 
FUNCTION: DB2 UDB, data protection services, sqlpgasn2, probe: 2790 
DATA # 1  : <preformatted>
Incomplete log record at end, nextLsn 0000003A8087AF32 recoveryLastPageLsn 0000003A8087AFFB

 2011 - 07 - 01 - 11 . 04 . 37 . 256356 + 360  I5470695E466       LEVEL: Warning
PID     :  7898                  TID  : 47917387835296PROC : db2agent (TEST)  0 
INSTANCE: db2inst1             NODE :  000          DB   : TEST
APPHDL  :  0 - 11                  APPID: *LOCAL.db2inst1. 110701045831 
AUTHID  : DB2INST1
FUNCTION: DB2 UDB, recovery manager, sqlprecm, probe: 4000 
MESSAGE : DIA2051W Forward phase of crash recovery has completed.  Next LSN is 
          "0000003A8087AF32".

После последней записи все вставало и база никаких сообщений в базу не писала. Следовательно, выполнялся долгий крэш-рекавери, и запись "Forward phase of crash recovery has completed" не означает еще полного восстановления БД.
Остается, что нужно было просто потерпеть какое-то время, дожидаясь финала с появлением записи "Crash recovery completed". Ну и установка фикспака, я полагаю, спасла все-таки положение.
...
Рейтинг: 0 / 0
зависшее подключение к базе
    #37335348
andyf
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Peter Wilson,

возможно, откатывалась та самая транзакция в 5ГБ, из-за которой всё и началось.
...
Рейтинг: 0 / 0
зависшее подключение к базе
    #37382494
Denim89
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
test
...
Рейтинг: 0 / 0
7 сообщений из 7, страница 1 из 1
Форумы / IBM DB2, WebSphere, IMS, U2 [игнор отключен] [закрыт для гостей] / зависшее подключение к базе
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]