|
|
|
ONBAR -- page is corrupt
|
|||
|---|---|---|---|
|
#18+
СУБД: IDS 9.40 CPU: Intel Pentium D (диспетчер оборудования показывает 2 шт) ОС: Windows 2003 Server Настроил ISM запустил onbar -b -w сначала все шло как положено, а потом нагрузка на процах упала и informix как минимум серьезно задумался. -----------------> Из ONCONFIG # System Configuration SERVERNUM 0 # Unique id corresponding to a server instance DBSERVERNAME nikolayev # Name of default Dynamic Server DBSERVERALIASES # List of alternate dbservernames NETTYPE onsoctcp,1,,NET # Override sqlhosts nettype parameters DEADLOCK_TIMEOUT 60 # Max time to wait of lock in distributed env. RESIDENT 1 # Forced residency flag (Yes = 1, No = 0) MULTIPROCESSOR 1 # 0 for single-processor, 1 for multi-processor NUMCPUVPS 3 # Number of user (cpu) vps SINGLE_CPU_VP 0 # If non-zero, limit number of cpu vps to one NOAGE 0 # Process aging AFF_SPROC 0 # Affinity start processor AFF_NPROCS 2 # Affinity number of processors -----------------> Из лога базы 12:44:34 Maximum server connections 60 12:44:51 Level 0 Archive started on rootdbs, logdbs, phydbs, ......... * * * 12:51:15 Assert Warning: Archive detects that page 201:8960 is corrupt. 12:51:15 IBM Informix Dynamic Server Version 9.40.TC7 12:51:15 Who: Session(161, informix@xxx.xxxx, 3268, 00000000) Thread(1106, arcbackup1, 0, 1) File: rsarcbu.c Line: 2791 12:51:15 stack trace for pid 1892 written to c:\tmp\af.83a0a0e 12:51:15 See Also: c:\tmp\af.83a0a0e 12:51:18 Releasing server from system block 12:51:21 Archive detects that page 201:8960 is corrupt. 12:57:09 VP Notify mechanism incomplete after 5 minutes. This can be due to slow network file access. Will try 12 more times 13:03:01 VP Notify mechanism incomplete after 5 minutes. This can be due to slow network file access. Will try 11 more times 13:08:52 VP Notify mechanism incomplete after 5 minutes. This can be due to slow network file access. Will try 10 more times 13:14:44 VP Notify mechanism incomplete after 5 minutes. This can be due to slow network file access. Will try 9 more times Подскажите, пожалуйста: Assert Warning: Archive detects that page 201:8960 is corrupt. - что это за зверь и как с ним бороться; VP Notify mechanism incomplete after 5 minutes. This can be due to slow network file access. Will try 12 more times - что это значит (чего он задумался) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.06.2006, 14:53 |
|
||
|
ONBAR -- page is corrupt
|
|||
|---|---|---|---|
|
#18+
Дополнение: файлы базы лежат на RAID с зеркалированием. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.06.2006, 15:23 |
|
||
|
ONBAR -- page is corrupt
|
|||
|---|---|---|---|
|
#18+
Вот что по этому поводу говорится на сайте Интернациональных Деловых Машин. (Правда касаемо IDS 10, но думаю и для 9.40 уместно). Corrupt Page During an Archive The message Archive detects that page is corrupt indicates that page validation failed. During an archive, the database server validates every page before writing it to the archive device. This validation checks that the elements on the page are consistent with the expected values. When a page fails this validation, a message similar to the following is written to the online.log file: 15:06:37 Assert Failed: Archive detects that page 0xc00021 is corrupt. 15:06:37 IBM Informix Dynamic Server Version 9.40.UC1 15:06:37 Who: Session(25, informix@cronus, 67612, 1085259772) Thread(50, arcbackup1, 40acf758, 4) File: rsarcbu.c Line: 2549 15:06:37 stack trace for pid 67367 written to /tmp/af.41ad7b9 15:06:37 See Also: /tmp/af.41ad7b9 The page number is printed in hexadecimal. The format for page number is 0xCCCPPPPP where CCC represents the chunk number, and PPPPP represents the page number. For this example, the corrupted page is in chunk 0xc (12 decimal) and page 0x21 (33 decimal). The archive aborts after detecting 10 corrupt pages. The online.log file displays the full error message, including the page address, for the first 10 errors. Subsequently, only the count of the number of corrupt pages is put in to the online.log. When you receive this message, identify which table the corrupt page belongs to by examining the output of the oncheck –pe command. To determine the extent of the corruption, execute the oncheck –cID command for that table. A corrupt page is saved onto the backup media. During a restore, the corrupt page is returned in its corrupt form. No errors messages are written to the online.log when corrupt pages are restored, only when they are archived. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.06.2006, 17:01 |
|
||
|
ONBAR -- page is corrupt
|
|||
|---|---|---|---|
|
#18+
Это значит, что у тебя битая страница, на которой затыкается нить arcbackup1 и вешает сервер (точнее, CPU VP). Это обнаруживает другой процесс и начинает жаловаться в логе. ("VP Notify mechanism incomplete after 5 minutes"). Сервер перестартовать, данные восстанавливать из архива. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.06.2006, 20:31 |
|
||
|
ONBAR -- page is corrupt
|
|||
|---|---|---|---|
|
#18+
Дополнения : 1. скорей всего, проблема не в дисках, страница была повреждена из-за внутреннего бага информикса. 2. можно попытаться починить ее вручную дисковым редактором - нить archbackup проверяет а) совпадение адреса страницы с реальным и б) совпадение timestamps в начале и в конце страницы. Если эти два места отредактировать, то архивирование пройдет. 3. хотелось бы увидеть содержимое af файла, в той части где пишут про страницу 201:8960 В таком вот аксепте ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.06.2006, 20:37 |
|
||
|
ONBAR -- page is corrupt
|
|||
|---|---|---|---|
|
#18+
ВыбегаллоДополнения : 1. скорей всего, проблема не в дисках, страница была повреждена из-за внутреннего бага информикса. 2. можно попытаться починить ее вручную дисковым редактором - нить archbackup проверяет а) совпадение адреса страницы с реальным и б) совпадение timestamps в начале и в конце страницы. Если эти два места отредактировать, то архивирование пройдет. 3. хотелось бы увидеть содержимое af файла, в той части где пишут про страницу 201:8960 В таком вот аксепте 1. Круто! 2. Что значит: дисковым редактором? База лежит на NTFS. 3. Первое упоминание перед бинарным массивом в начале файла нужно? Какое-то оно нечитаемо-бинарное и большое. Далее: C:\Informix\bin\onstat -g arc: IBM Informix Dynamic Server Version 9.40.TC7 -- On-Line -- Up 03:03:04 -- 485248 Kbytes num DBSpace Q Size Q Len Buffer partnum size scanner 181 m482i3 0 0 201:8960 Dbspaces - Archive Status name number level date log log-position m482i3 181 0 05/30/2006.08:24 4562 0x4ca1018 Вот. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.06.2006, 13:45 |
|
||
|
ONBAR -- page is corrupt
|
|||
|---|---|---|---|
|
#18+
ВыбегаллоЭто значит, что у тебя битая страница, на которой затыкается нить arcbackup1 и вешает сервер (точнее, CPU VP) . Это обнаруживает другой процесс и начинает жаловаться в логе. ("VP Notify mechanism incomplete after 5 minutes"). Сервер перестартовать, данные восстанавливать из архива. Вешает таки СУБД: невозможно было к ниму никак достучаться. И тут напрашивается вопрос: 12:51:18 Releasing server from system block 12:51:21 Archive detects that page 201:8960 is corrupt. 12:57:09 VP Notify mechanism incomplete after 5 minutes. This can be due to slow network file access. Will try 12 more times 13:03:01 VP Notify mechanism incomplete after 5 minutes. This can be due to slow network file access. Will try 11 more times 13:08:52 VP Notify mechanism incomplete after 5 minutes. This can be due to slow network file access. Will try 10 more times 13:14:44 VP Notify mechanism incomplete after 5 minutes. This can be due to slow network file access. Will try 9 more times Можно ли как-то уменьшить интервал и количество попыток? И будет ли от этого толк? А то как-то не правильно получается: обнаружено повреждение, запись в лог пошла и вместо того, чтобы продолжить дальше или отказаться от операции СУБД виснет (я так понял на часок) :( ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.06.2006, 13:58 |
|
||
|
ONBAR -- page is corrupt
|
|||
|---|---|---|---|
|
#18+
Середа ВыбегаллоДополнения : 1. скорей всего, проблема не в дисках, страница была повреждена из-за внутреннего бага информикса. 2. можно попытаться починить ее вручную дисковым редактором - нить archbackup проверяет а) совпадение адреса страницы с реальным и б) совпадение timestamps в начале и в конце страницы. Если эти два места отредактировать, то архивирование пройдет. 3. хотелось бы увидеть содержимое af файла, в той части где пишут про страницу 201:8960 В таком вот аксепте 1. Круто! 2. Что значит: дисковым редактором? База лежит на NTFS. 1. Из програм без багов я знаю только "hello world". 2. Если непонятно что такое "дисковый редактор", то лучше не трогать, а сразу восстанавливаться из архива. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.06.2006, 23:02 |
|
||
|
ONBAR -- page is corrupt
|
|||
|---|---|---|---|
|
#18+
Середа ВыбегаллоЭто значит, что у тебя битая страница, на которой затыкается нить arcbackup1 и вешает сервер (точнее, CPU VP) . Это обнаруживает другой процесс и начинает жаловаться в логе. ("VP Notify mechanism incomplete after 5 minutes"). Сервер перестартовать, данные восстанавливать из архива. Вешает таки СУБД: невозможно было к ниму никак достучаться. И тут напрашивается вопрос: 12:51:18 Releasing server from system block 12:51:21 Archive detects that page 201:8960 is corrupt. 12:57:09 VP Notify mechanism incomplete after 5 minutes. This can be due to slow network file access. Will try 12 more times 13:03:01 VP Notify mechanism incomplete after 5 minutes. This can be due to slow network file access. Will try 11 more times 13:08:52 VP Notify mechanism incomplete after 5 minutes. This can be due to slow network file access. Will try 10 more times 13:14:44 VP Notify mechanism incomplete after 5 minutes. This can be due to slow network file access. Will try 9 more times Можно ли как-то уменьшить интервал и количество попыток? И будет ли от этого толк? А то как-то не правильно получается: обнаружено повреждение, запись в лог пошла и вместо того, чтобы продолжить дальше или отказаться от операции СУБД виснет (я так понял на часок) :( Интервал не уменьшить и число попыток не изменить. Можно позвонить в поддержку и заявить баг. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.06.2006, 23:04 |
|
||
|
ONBAR -- page is corrupt
|
|||
|---|---|---|---|
|
#18+
ВыбегаллоЕсли непонятно что такое "дисковый редактор", то лучше не трогать, а сразу восстанавливаться из архива.Похоже, что у нас это называется "хексовый" редактор :) - смотрел параллельные темы. Завтра буду с товарищем смотреть чего у них есть на тему архивов. Пару месяцев база "админилась" админом приложений у которого к базе было только одно требование... он даже в логи не особо смотрел :( ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.06.2006, 23:16 |
|
||
|
|

start [/forum/topic.php?fid=44&msg=33770030&tid=1608650]: |
0ms |
get settings: |
6ms |
get forum list: |
10ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
39ms |
get topic data: |
9ms |
get forum data: |
2ms |
get page messages: |
41ms |
get tp. blocked users: |
1ms |
| others: | 204ms |
| total: | 316ms |

| 0 / 0 |
