powered by simpleCommunicator - 2.0.56     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Informix [игнор отключен] [закрыт для гостей] / Проблема с восстановлением из архива
16 сообщений из 16, страница 1 из 1
Проблема с восстановлением из архива
    #36565767
некому
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Сервер IDS 9.40UC2 под RHEL 4.6
При восстановлении из резервной копии с помощью ontape -r получаю неработающий сервер с сообщениями об ощибках:
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
 12 : 29 : 19   Assert Failed: pthdrpage:ptalloc:bad partn page
 12 : 29 : 19   IBM Informix Dynamic Server Version  9 . 40 .UC2
 12 : 29 : 19    Who: Session( 1 , informix@g- 07 ,  0 , 0x65df2018)
                Thread( 13 , main_loop(), 65dc1018,  1 )
                File: rspartn.c Line:  5729 
 12 : 29 : 19    Results: Cannot use TBLSpace page for TBLSpace  9437185 
 12 : 29 : 19    Action: Run 'oncheck -pt 9437185'
 12 : 29 : 19   stack trace for pid  2391  written to /tmp/af.3f5425e
 12 : 29 : 19    See Also: /tmp/af.3f5425e
 12 : 29 : 21   pthdrpage:ptalloc:bad partn page
 12 : 29 : 21   Assert Failed: Chunk  13  is being taken OFFLINE.
 12 : 29 : 21   IBM Informix Dynamic Server Version  9 . 40 .UC2
 12 : 29 : 21    Who: Session( 1 , informix@g- 07 ,  0 , 0x65df2018)
                Thread( 13 , main_loop(), 65dc1018,  1 )
                File: rspartn.c Line:  5742 
 12 : 29 : 21    Results: Cannot Open DBspace  9 .
 12 : 29 : 21    Action: Restore chunk from archive.
 12 : 29 : 21   stack trace for pid  2391  written to /tmp/af.3f5425e
 12 : 29 : 21    See Also: /tmp/af.3f5425e
 12 : 29 : 22   Chunk  13  is being taken OFFLINE.
 12 : 29 : 22   Assert Warning: Chunk  13  is being taken OFFLINE.
 12 : 29 : 22   IBM Informix Dynamic Server Version  9 . 40 .UC2
 12 : 29 : 22    Who: Session( 1 , informix@g- 07 ,  0 , 0x65df2018)
                Thread( 13 , main_loop(), 65dc1018,  3 )
                File: rsmirror.c Line:  1860 
 12 : 29 : 22    Results: Dynamic Server will block at next checkpoint
 12 : 29 : 22    Action: Shutdown (onmode -k) or override (onmode -O)
 12 : 29 : 22   stack trace for pid  2393  written to /tmp/af.3f5425e
 12 : 29 : 22    See Also: /tmp/af.3f5425e
 12 : 29 : 22   Chunk  13  is being taken OFFLINE.
 12 : 29 : 22   Cannot Open DBspace  9 .
 12 : 29 : 22   Cannot change to Quiescent Mode.

На сервере, с которого делалась резервная копия имеем:

Запрос: select * from systabname where partnum = 9437185 дает:

Код: plaintext
1.
2.
3.
4.
5.
partnum   9437185 
dbsname  datadbs2
owner    informix
tabname  TBLSpace
collate


Выполнение 'oncheck -pt 9437185' дает:

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
TBLspace Report for Unknown:Unknown. 900001 

ISAM error:  no record found.

ISAM error:  no record found.

    Physical Address                13 : 4 
    Creation date                   08 / 25 / 2009   16 : 19 : 44 
    TBLspace Flags                  2801        Page Locking
                                              TBLspace use  4  bit bit-maps
                                              Permanent System TBLspace

    Maximum row size                92 
    Number of special columns       0 
    Number of keys                  0 
    Number of extents               2 
    Current serial value            1 
    First extent size               50 
    Next extent size                50 
    Number of pages allocated       100 
    Number of pages used            68 
    Number of data pages            0 
    Number of rows                  0 
    Partition partnum               9437185 
    Partition lockid                9437185 

    Extents
         Logical Page     Physical Page        Size
                     0                13 : 3            50 
                    50           13 : 741367            50 

На сервере, который восстанавливаю:
DBSpace datadbs2 состоит из одного чанка и находится в OffLine.
Этот DBSpace восстановился до нормального размера, а следующие за ним не восстановились.

Т.к. восстановление из архива было плановым, есть время спокойно подумать, что делать дальше.
Т.к. в этом DBSpace занято всего 1.5 ГБ под таблицы справочники, то можно просто перенести их в другое место и грохнуть пустой DBSpace.
Но хотелось бы узнать и другие пути решения проблемы.
Так же тревожит, что у меня нет актуальных резервных копий :-(

Прошу советов.
...
Рейтинг: 0 / 0
Проблема с восстановлением из архива
    #36566047
zaiets
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
повторное восстановление дает такой же результат?
Чанки как делали?
...
Рейтинг: 0 / 0
Проблема с восстановлением из архива
    #36566291
vasilis
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
некому
Т.к. восстановление из архива было плановым, есть время спокойно подумать, что делать дальше.
Т.к. в этом DBSpace занято всего 1.5 ГБ под таблицы справочники, то можно просто перенести их в другое место и грохнуть пустой DBSpace.
Но хотелось бы узнать и другие пути решения проблемы.
Так же тревожит, что у меня нет актуальных резервных копий :-(
Прошу советов.
Чтобы дать хоть какие-то советы нужно понять все, что вы написали.
Лично мне далеко не все понятно.
Например:
Что мешает сделать актуальную резервную копию ?
Как (какой командой) вы делали копию, с которой восстанвливаетесь ?
На каком сервере выполнялся oncheck ?
Зачем переносить таблицы и грохать пустой dbspace и на каком сервере?
Ранее вы делали такое восстановление сервера с резервной копии и на этой платформе ?
...
Рейтинг: 0 / 0
Проблема с восстановлением из архива
    #36566521
klepa
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
vasilisнекому
Т.к. восстановление из архива было плановым, есть время спокойно подумать, что делать дальше.
Т.к. в этом DBSpace занято всего 1.5 ГБ под таблицы справочники, то можно просто перенести их в другое место и грохнуть пустой DBSpace.
Но хотелось бы узнать и другие пути решения проблемы.
Так же тревожит, что у меня нет актуальных резервных копий :-(
Прошу советов.
Чтобы дать хоть какие-то советы нужно понять все, что вы написали.
Лично мне далеко не все понятно.
Например:
Что мешает сделать актуальную резервную копию ?
Как (какой командой) вы делали копию, с которой восстанвливаетесь ?
На каком сервере выполнялся oncheck ?
Зачем переносить таблицы и грохать пустой dbspace и на каком сервере?
Ранее вы делали такое восстановление сервера с резервной копии и на этой платформе ?
...
Рейтинг: 0 / 0
Проблема с восстановлением из архива
    #36567296
zaiets
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Может среди нас и есть провидцы, но большинство к ним не относится.
Форум может помочь, но обучаться с 0 в форуме это самоубийство.
если не знаете что у вас спросили, то просто опишите ПОДРОБНЫЙ
порядок ваших действий с командами.

Тут после работы ходил в бювет за водичкой и чет вспомнилась подобная ситуация.
еще вопросы:
1. вы восстанавливаетесь с помощью утилиты onbar?
2. в момент восстановления на сервере, откуда был сделан архив активно пишутся логи?
...
Рейтинг: 0 / 0
Проблема с восстановлением из архива
    #36567918
vasilis
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
zaietsесли не знаете что у вас спросили, то просто опишите ПОДРОБНЫЙ
порядок ваших действий с командами.
абсолютно верно, а то вопросов можно задавать много ...
zaiets1. вы восстанавливаетесь с помощью утилиты onbar?
нет
некомуПри восстановлении из резервной копии с помощью ontape -r
zaiets2. в момент восстановления на сервере, откуда был сделан архив активно пишутся логи? тут я сам вопрос не понял :)
...
Рейтинг: 0 / 0
Проблема с восстановлением из архива
    #36567989
zaiets
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Ага - ontape в самом начале написано - не досмотрел.

была подобная ситуация с onbar.
Когда восстанавливали тестовый сервер с помощью onbar и во время лог. восстановления
основной сервер активно писал логи (логи маленькие), восстановление тоже вылетало
с подобной ошибкой. Поэтому и этот непонятный вопрос.
Тогда поличилось восстановлением на указанный момент.

С ontape вроде ни разу не было подобных проблем, правда все время работаем с raw devices.
ошибка вроде как при лог восстановлении - если никак не восстанавливается - можно сделать физ. восстановление и перевести сервер в стандард.
...
Рейтинг: 0 / 0
Проблема с восстановлением из архива
    #36568119
некому
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Спасибо за участие.
Постараюсь ответить на ваши вопросы:

авторЧто мешает сделать актуальную резервную копию ?

Я имел ввиду, что архив, с которого не получается восстановиться, не совсем архив :-)

авторКак (какой командой) вы делали копию, с которой восстанвливаетесь ?

ontape -s -L 0 . архивирование делается каждую ночь в 23.30. В это время нагрузка на сервер минимальна.

авторНа каком сервере выполнялся oncheck ?

На сервере, где создавался архив.

авторЗачем переносить таблицы и грохать пустой dbspace и на каком сервере?

На сервере, где создавался архив. Т.к. мне кажется, что проблема именно в этом dbspace

Код: plaintext
1.
2.
 11 : 46 : 59   Assert Failed: Page Check Error in rsclose_phr: bad chunk free list page
 12 : 00 : 31    Results: Cannot use TBLSpace page for TBLSpace  9437185 
 12 : 00 : 31    Action: Run 'oncheck -pt 9437185'

Наблюдая за процессом восстановления могу сказать, то вначале создается несколько чанков, затем они заполняются данными.
Затем создается тот самый проблемный Chunk 13. После того, как он достигнет своего реального размера в логе полявляются сообщения об ошибках, а ontape спрашивает "Восстановить архив 1 уровня?". Т.е. это случается в момент когда в созданный чанк начинают заливаться данные из архива.
Остальные чанки не создаются, т.е. файлы остаются нулевого размера.

Вот еще раз кусок лога (более полный):

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
 11 : 46 : 57   Checkpoint loguniq  130955 , logpos 0x349018, timestamp:  2038034093 

 11 : 46 : 57   Maximum server connections  0 
 11 : 46 : 58   Assert Failed: Page Check Error in rsclose_phr: bad chunk free list page
 11 : 46 : 58   IBM Informix Dynamic Server Version  9 . 40 .UC2
 11 : 46 : 58    Who: Session( 13 , informix@g- 07 ,  26632 , 0x7fbf3460)
                Thread( 28 , ontape, 7fbc52c8,  5 )
                File: rsdebug.c Line:  1034 
 11 : 46 : 58    Results: Possible inconsistencies in a Chunk Freelist page
 11 : 46 : 58    Action: Run 'oncheck -ce' and/or restore affected DBSpace
 11 : 46 : 58   stack trace for pid  26638  written to /tmp/af.40489f2
 11 : 46 : 58    See Also: /tmp/af.40489f2
 11 : 46 : 59   Page Check Error in rsclose_phr: bad chunk free list page
 11 : 46 : 59   Assert Failed: Page Check Error in rsclose_phr: bad chunk free list page
 11 : 46 : 59   IBM Informix Dynamic Server Version  9 . 40 .UC2
 11 : 46 : 59    Who: Session( 13 , informix@g- 07 ,  26632 , 0x7fbf3460)
                Thread( 28 , ontape, 7fbc52c8,  5 )
                File: rsdebug.c Line:  1034 
 11 : 46 : 59    Results: Possible inconsistencies in a Chunk Freelist page
 11 : 46 : 59    Action: Run 'oncheck -ce' and/or restore affected DBSpace
 11 : 46 : 59   stack trace for pid  26638  written to /tmp/af.40489f2
 11 : 46 : 59    See Also: /tmp/af.40489f2
 11 : 47 : 01   Page Check Error in rsclose_phr: bad chunk free list page
 11 : 47 : 01   Physical Restore of rootdbs, plogdbs, llogdbs, datadbs1, datadbs2, inddbs, datadbs3, datadbs4 Completed.
 11 : 47 : 01   Checkpoint Completed:  duration was  0  seconds.
 11 : 47 : 01   Checkpoint loguniq  130955 , logpos 0x349018, timestamp:  2038034101 

 11 : 47 : 01   Maximum server connections  0 
 12 : 00 : 19   No logical log restore will be performed.
 12 : 00 : 19   Preparing Physical Log for Fast Recovery ...
 12 : 00 : 19   Clearing the physical and logical logs has started
 12 : 00 : 31   Cleared  763  MB of the physical and logical logs in  12  seconds
 12 : 00 : 31   Assert Failed: pthdrpage:ptalloc:bad partn page
 12 : 00 : 31   IBM Informix Dynamic Server Version  9 . 40 .UC2
 12 : 00 : 31    Who: Session( 1 , informix@g- 07 ,  0 , 0x7fbf2018)
                Thread( 11 , main_loop(), 7fbc1018,  4 )
                File: rspartn.c Line:  5729 
 12 : 00 : 31    Results: Cannot use TBLSpace page for TBLSpace  9437185 
 12 : 00 : 31    Action: Run 'oncheck -pt 9437185'
 12 : 00 : 31   stack trace for pid  26637  written to /tmp/af.3f38d1f
 12 : 00 : 31    See Also: /tmp/af.3f38d1f
 12 : 00 : 33   pthdrpage:ptalloc:bad partn page
 12 : 00 : 33   Assert Failed: Chunk  13  is being taken OFFLINE.
 12 : 00 : 33   IBM Informix Dynamic Server Version  9 . 40 .UC2
 12 : 00 : 33    Who: Session( 1 , informix@g- 07 ,  0 , 0x7fbf2018)
                Thread( 11 , main_loop(), 7fbc1018,  4 )
                File: rspartn.c Line:  5742 
 12 : 00 : 33    Results: Cannot Open DBspace  9 .
 12 : 00 : 33    Action: Restore chunk from archive.
 12 : 00 : 33   stack trace for pid  26637  written to /tmp/af.3f38d1f
 12 : 00 : 33    See Also: /tmp/af.3f38d1f
 12 : 00 : 34   Chunk  13  is being taken OFFLINE.
 12 : 00 : 35   Assert Warning: Chunk  13  is being taken OFFLINE.
 12 : 00 : 35   IBM Informix Dynamic Server Version  9 . 40 .UC2
 12 : 00 : 35    Who: Session( 1 , informix@g- 07 ,  0 , 0x7fbf2018)
                Thread( 11 , main_loop(), 7fbc1018,  4 )
                File: rsmirror.c Line:  1860 
 12 : 00 : 35    Results: Dynamic Server will block at next checkpoint
 12 : 00 : 35    Action: Shutdown (onmode -k) or override (onmode -O)
 12 : 00 : 35   stack trace for pid  26637  written to /tmp/af.3f38d1f
 12 : 00 : 35    See Also: /tmp/af.3f38d1f
 12 : 00 : 35   Chunk  13  is being taken OFFLINE.
 12 : 00 : 35   Cannot Open DBspace  9 .
 12 : 00 : 35   Cannot change to Quiescent Mode.

авторРанее вы делали такое восстановление сервера с резервной копии и на этой платформе ?

Восстановление делаю ~1 раз в два месяца. Последнее успешное восстановление было как раз 2 месяца назад. Пока эту копию найти не могу, т.к. политика компании, в которой я работаю, не предусматривает длительное хранение архивов.
Восстановление пытался делать на сервере, который был снят с боевого дежурства. На нем раньше крутилась другая БД ( больше по объему). Конфигурация всех серверов одинакова.
Также я попробовал восстановить на этом сервере ту БД, которая на нем была раньше. Она восстановилась успешно.
Попытки восстановить проблемную БД из 4 имеющихся архивом закончились неудачей с одинаковой ощибкой.
Была предпринята попытка восстановить проблемную БД на другом тестовом сервере. Ошибка та же.

авторЧанки как делали?

Чанки на файлах. Создавалить по такой схеме:

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
#!/bin/bash

### TOUCH

touch /inf_data/rootdbs

### CHMOD

chmod  660  /inf_data/*dbs*

### LINK

ln -s /inf_data/rootdbs /usr/informix/dsk/rootdbs
...
Рейтинг: 0 / 0
Проблема с восстановлением из архива
    #36568291
zaiets
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
автор
Я имел ввиду, что архив, с которого не получается восстановиться, не совсем архив :-)


Если сделанній с помощью ontape - то архив, хотя здесь часто путаница
между резервной и архивной копией


автор
Наблюдая за процессом восстановления могу сказать, то вначале создается несколько чанков, затем они заполняются данными.
Затем создается тот самый проблемный Chunk 13. После того, как он достигнет своего реального размера в логе полявляются сообщения об ошибках, а ontape спрашивает "Восстановить архив 1 уровня?". Т.е. это случается в момент когда в созданный чанк начинают заливаться данные из архива.
Остальные чанки не создаются, т.е. файлы остаются нулевого размера.

1. При восстановлении с архива 0 файлы должны быть не нулевыми.
2. ошибка возникает совсем не в момент когда в чанки начинают заливаться данные.

Смотрим лог:
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
 11 : 46 : 57   Checkpoint loguniq  130955 , logpos 0x349018, timestamp:  2038034093 

 11 : 47 : 01   Physical Restore of rootdbs, plogdbs, llogdbs, datadbs1, datadbs2, inddbs, datadbs3, datadbs4 Completed.
 11 : 47 : 01   Checkpoint Completed:  duration was  0  seconds.
 11 : 47 : 01   Checkpoint loguniq  130955 , logpos 0x349018, timestamp:  2038034101 

 11 : 47 : 01   Maximum server connections  0 
 12 : 00 : 19   No logical log restore will be performed.
 12 : 00 : 19   Preparing Physical Log for Fast Recovery ...
 12 : 00 : 19   Clearing the physical and logical logs has started
 12 : 00 : 31   Cleared  763  MB of the physical and logical logs in  12  seconds
 12 : 00 : 31   Assert Failed: pthdrpage:ptalloc:bad partn page
Ошибка возникает в тот момент, когда должно бы появиться запись:

Код: plaintext
1.
...  Physical Recovery Started at Page ...

В данном случае я могу гадать только на кофейной гуще - что-то не то с логами.
Скорее нужно обращаться в саппорт.

автор
Также я попробовал восстановить на этом сервере ту БД, которая на нем была раньше. Она восстановилась успешно.
Попытки восстановить проблемную БД из 4 имеющихся архивом закончились неудачей с одинаковой ощибкой.
Была предпринята попытка восстановить проблемную БД на другом тестовом сервере. Ошибка та же.


Эти 4 архива были свежие?
и за 2 месяца на сервере не было никаких нештатных ситуаций?

Могу предложить проверить тиакой вариант восстановления:
ontape -p
onmode -d secondary xxx (на прописанный в sqlhosts но не существующий сервер)
onmode -d standard

возможно прокатит, когда-то таким пользовались на 9.21, но это было давно
...
Рейтинг: 0 / 0
Проблема с восстановлением из архива
    #36568317
некому
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
автор1. При восстановлении с архива 0 файлы должны быть не нулевыми.
2. ошибка возникает совсем не в момент когда в чанки начинают заливаться данные.

Чанки на файлах. Когда они создаются командой touch, то их размер равен 0.
Если во время восстановления наблюдать за активностью дисковой подсистемы, то хорошо видно, что сначала создаются файлы нужного размера, затем туда заливаются данные из архива. Т.е. вначале идет запись на жесткий диск с чанками и размер файлов чанков растет (скажем 5 минут). При этом с диска с архивом ничего не читается. Затем идет чтение с диска с архивом и запись на жесткий диск с чанками (еще 5 минут).
К сож. картинки с виртуалки под рукой нет, но наверное на винде это хорошо видно.
...
Рейтинг: 0 / 0
Проблема с восстановлением из архива
    #36568360
некому
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
авторМогу предложить проверить тиакой вариант восстановления:
ontape -p
Сделал физическое восстановление. Не помогло :-((
Затык на том же месте.
...
Рейтинг: 0 / 0
Проблема с восстановлением из архива
    #36568374
vasilis
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
некому[quot автор]К сож. картинки с виртуалки под рукой нет
А сервер у вас на виртуалке стоит ?
...
Рейтинг: 0 / 0
Проблема с восстановлением из архива
    #36568376
некому
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
авторЭти 4 архива были свежие?
и за 2 месяца на сервере не было никаких нештатных ситуаций?

Каждые две недели. При этом 2 месяца и 2 дня назад на этом сервере была натянута репликация. Т.е. на это время был рабочий архив.

Были падения сервера. Все таки версия не слишком удачная :-((
...
Рейтинг: 0 / 0
Проблема с восстановлением из архива
    #36568382
некому
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
авторА сервер у вас на виртуалке стоит ?

пытался восстанавливать и на виртуалке тоже.
...
Рейтинг: 0 / 0
Проблема с восстановлением из архива
    #36568517
zaiets
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Скорее за все битый архив и вполне возможно это как-то связано с падениями.
Хотя вполне возможно что и признаная бага.
Версия старая и вполне возможно, что ошибки таки какие-то были.
Попробуйте восстановиться не на uc2 а на версии постарше - uc9
вроде последняя (мы остановились на fc6 в свое время)
...
Рейтинг: 0 / 0
Проблема с восстановлением из архива
    #36569944
некому
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Спасибо, коллеги!
Проблема решилась.
Это я накосячил с линками.
...
Рейтинг: 0 / 0
16 сообщений из 16, страница 1 из 1
Форумы / Informix [игнор отключен] [закрыт для гостей] / Проблема с восстановлением из архива
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]