Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Informix [игнор отключен] [закрыт для гостей] / IDS Exception Caught / 20 сообщений из 20, страница 1 из 1
30.11.2009, 17:56
    #36339576
Sapfeer
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS Exception Caught
Не знаю, как у меня так получилось, но после некоторых действий IDS отказался запускаться... По поводу моей конфигурации уже было пару тем, на этот раз придется описать ситуацию подробнее... Есть два Sun Fire V490, два Sun StorageTek 3500fc и один Brocade 200E. На этом оборудовании крутятся Sun Solaris 10 5/08 и Sun Cluster 3.2. Сам IDS установлен на ZFS пул, который зеркалируется между массивами. На прошлой неделе, пока IDS работал на одном из серверов, к нему добавили новое пространство и, соответвенно, чанк, но на другом сервере ссылку я не создал - просто забыл... После этого после переноса на другой сервер, на котором не было ссылки, IDS некоторое время вел себя весьма предсказуемо - в логах ругался на "плохое" пространство и блокировал работу по checkpoint'у. В этой теме обсуждалась схожая ситуация, но на этот раз я не стал запускать onmode -O сразу, а просто попытался выключить сервер и добавить ссылку на недостающее пространство, но это оказалось не так просто - после команды onmode -k и двух подтверждений, сервер погружался в глубокий сон - никаких новых сообщений в журналах и никакого ответа от команды... Ждал я достаточно долго, но ничего нового не происходило... Даже запуск onmode -O не помогал, причем по ее выходу можно было понять, что сервер уже не работает:

Код: plaintext
1.
2.
3.
4.
5.
/opt/IBM/informix $ onmode -O
This will render any spaces which have incurred disabling IO errors unusable
and require them to be restored from an archive.
Do you wish to continue (y/n)? y
The server did not respond within  120  seconds.  Timing out.
There have been no disabling IO errors on any non-critical spaces.

После этого я решил его убить через kill -9, что, естественно сработало. Дальше, чтобы вновь его запустить, почистил shared memory (ipcs, ipcrm), но после этого IDS отказался запускаться, как потом оказалось, из-за нехватки места в директории запуска informix'а, хотя я выделял его более чем достаточно - 1 ГБ, в то время, как установочные файлы занимают не более 600 МБ. Далее я увеличил место в директории, откуда запускается IDS с 1 до 3х ГБ, но при запуске сервер выдал новую ошибку:

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
 14 : 46 : 08   Logical Recovery Started.
 14 : 46 : 08    10  recovery worker threads will be started.
 14 : 46 : 08   stack trace for pid  14416  written to /opt/IBM/informix/tmp/af.3fcb080
 14 : 46 : 08   Assert Failed: No Exception Handler
 14 : 46 : 08   IBM Informix Dynamic Server Version  11 . 10 .UC3    
 14 : 46 : 08    Who: Session( 7 , informix@istok,  0 , b109898)
		Thread( 20 , xchg_1. 3 , b0dda88,  1 )
		File: mtex.c Line:  491 
 14 : 46 : 08    Results: Exception Caught. Type: MT_EX_OS, Context: mem
 14 : 46 : 08    Action: Please notify IBM Informix Technical Support.
 14 : 46 : 08    See Also: /opt/IBM/informix/tmp/af.3fcb080, shmem.3fcb080. 0 
 14 : 46 : 11   mtex.c, line  491 , thread  20 , proc id  14416 , No Exception Handler.
 14 : 46 : 11   PANIC: Attempting to bring system down
 14 : 46 : 11   semctl: errno =  22 

 14 : 46 : 11   semctl: errno =  22 

 14 : 46 : 11   semctl: errno =  22 
Что за процесс скрывается под PID 14416 сейчас сказать не могу, буду на месте только завтра... Перенос на другой сервер и перезагрузка ОС не помогли. Не помогла даже переустановка IDS. Подозреваю, что виной всему моя некомпетентность, но я до сих пор не могу понять в каком именно месте и что я сделал не так... Если нужно, могу предоставить более подробную...
...
Рейтинг: 0 / 0
30.11.2009, 18:50
    #36339664
onstat-
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS Exception Caught
Шо опять ?

IMHO Ваша ошибка - запуск onmode -O.


Содержимое файла /opt/IBM/informix/tmp/af.3fcb080
может пролить свет на суть проблемы.



Если в отпавшем чанке были логические журналы - готовьте бэкап к рестору.
...
Рейтинг: 0 / 0
30.11.2009, 19:07
    #36339682
Sapfeer
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS Exception Caught
onstat-IMHO Ваша ошибка - запуск onmode -O.
Ну я же не сразу ее запустил... IDS вообще не проявлял никаких признаков жизни... Что мне оставалось делать в этой ситуации?.. Informix был в насмерть заблокированном состоянии... К тому же, она все равно не сработала - при следующем старте в журнале опять появилось сообщение о "плохом" чанке...

onstat-Содержимое файла /opt/IBM/informix/tmp/af.3fcb080 может пролить свет на суть проблемы.
af.3fcb080

onstat-Если в отпавшем чанке были логические журналы - готовьте бэкап к рестору.
К счастью, в этам чанке была очередная база, которую можно без особых проблем восстановить...
...
Рейтинг: 0 / 0
30.11.2009, 20:07
    #36339738
onstat-
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS Exception Caught
автор
Сам IDS установлен на ZFS пул, который зеркалируется между массивами.



Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
/opt/IBM/informix/bin/onstat -d:

IBM Informix Dynamic Server Version 11.10.UC3     -- Fast Recovery -- Up 00:00:13 -- 31744 Kbytes
Blocked:

Dbspaces
address  number   flags      fchunk   nchunks  pgsize   flags    owner    name
b0557f8  1        0x60001    1        1        2048     N  B     informix rootdbs
b11a248  2        0x42001    2        1        2048     N TB     informix tempdbs
b11a3a8  3        0x40001    3        1        2048     N  B     informix workdbs
b11a508  4        0x40011    4        1        4096     N BB     informix blobdbs
b11a668  5        0x40001    5        1        2048     N  B     informix physdbs
b11a7c8  6        0x40001    6        1        2048     N  B     informix logdbs
b11a928  7        0x40001    7        1        2048     N  B     informix datadbs
b11aa88  8        0x60005    8        1        2048     ND B     informix actualdbs
 8 active, 2047 maximum

Note: For BLOB chunks, the number of free pages shown is out of date.
      Run 'onstat -d update' for current stats.

Chunks
address  chunk/dbs     offset     size       free       bpages     flags pathname
b055958  1      1      16         32768      22887                 PO-B  /global/CBFD/dbspaces/rootdbs
b11abe8  2      2      32784      4096       4043                  PO-B  /global/CBFD/dbspaces/rootdbs
b11adc0  3      3      16         8388608    4425083               PO-B  /global/CBFD/dbspaces/cbfddbs
b108c30  4      4      8388624    5242880   ~2621440    2621440    POBB  /global/CBFD/dbspaces/cbfddbs
b108e08  5      5      36880      16384      8331                  PO-B  /global/CBFD/dbspaces/rootdbs
b055b78  6      6      53264      16384      139                   PO-B  /global/CBFD/dbspaces/rootdbs
b055d50  7      7      0          2097152    1689429               PO-B  /global/CBFD/dbspaces/datadbs
b893018  8      8      0          1024000    0                     PD-B  /dev/rdsk/c4t600C0FF0000000000B12C6516024A700d0s3
 8 active, 32766 maximum

NOTE: The values in the "size" and "free" columns for DBspace chunks are
      displayed in terms of "pgsize" of the DBspace to which they belong.

Expanded chunk capacity mode: always



автор
но я до сих пор не могу понять в каком именно месте и что я сделал не так...


Кто вам посоветовал по такому пути подключать чанк?
Пусть SUN-гуру меня поправят , но ИМХО такой чанк от вас может уплыть
даже в случае обычной перезагрузки, смены преферед контроллера в массиве, установки патча на ОС и прочих мало зависящих от СУБД действий.
Возможно уже сейчас на обоих узлах кластера он сейчас имеет совсем другое имя.
...
Рейтинг: 0 / 0
30.11.2009, 20:11
    #36339740
Sapfeer
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS Exception Caught
onstat-Кто вам посоветовал по такому пути подключать чанк?
Этот чанк вообще не я добавлял... И я прекрасно понимаю, что чанки на сырые устройство нужно подключать только через символические ссылки, но я не совсем понимаю, какое это отношение имеет к генерации исключения во время запуска informix'а...
...
Рейтинг: 0 / 0
30.11.2009, 20:14
    #36339746
onstat-
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS Exception Caught
В AF все написано :

автор
14:46:02 Results: Cannot use TBLSpace page for TBLSpace 8388609
14:46:02 Action: Run 'oncheck -pt 8388609'
14:46:02 stack trace for pid 14416 written to /opt/IBM/informix/tmp/af.3f6b07a
14:46:02 See Also: /opt/IBM/informix/tmp/af.3f6b07a, shmem.3f6b07a.0
14:46:05 pthdrpage:ptalloc:bad partn page
14:46:05 Assert Failed: Chunk 8 is being taken OFFLINE.
14:46:05 IBM Informix Dynamic Server Version 11.10.UC3
14:46:05 Who: Session(7, informix@server1, 0, b109898)
Thread(14, fast_rec, b0db778, 1)
File: rspartn.c Line: 7121
14:46:05 Results: Cannot Open DBspace 8.
14:46:05 Action: Restore space containing this chunk from the archive.
14:46:05 stack trace for pid 14416 written to /opt/IBM/informix/tmp/af.3f6b07a
...
Рейтинг: 0 / 0
30.11.2009, 20:25
    #36339758
onstat-
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS Exception Caught
Sapfeeronstat-Кто вам посоветовал по такому пути подключать чанк?
Этот чанк вообще не я добавлял... И я прекрасно понимаю, что чанки на сырые устройство нужно подключать только через символические ссылки, но я не совсем понимаю, какое это отношение имеет к генерации исключения во время запуска informix'а...

Та можно и не через символические, символические это для удобства.
Если бы линк шел на этот же девайс , думаю это вас мало спасло бы ,
потому что он уже в офлайне.
Его нужно ресторить.

Если Вы видете предложение Infomix сделать onmode -O
десять раз проверьте, что потеряно и можно ли все вернуть на место ,
а потом уже принимайте решение.

Ну я малі діти чес слово :(

з.ы. Без обид .
...
Рейтинг: 0 / 0
30.11.2009, 22:17
    #36339861
Sapfeer
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS Exception Caught
onstat-,

Я не обижаюсь, все хорошо.

Я извиняюсь, но наверное я не совсем точно выражаюсь, а сообщения из журнала особой информации не несут... У меня нет проблем с чанком, у меня informix вообще не стартует... Вот сообщение из журнала:
Код: plaintext
 14 : 46 : 11   PANIC: Attempting to bring system down
И вот эта запись меня тоже немножко смущает
Код: plaintext
 14 : 46 : 08    Action: Please notify IBM Informix Technical Support.
...
Рейтинг: 0 / 0
01.12.2009, 09:53
    #36340319
onstat-
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS Exception Caught
Sapfeer onstat-,

Я не обижаюсь, все хорошо.

Я извиняюсь, но наверное я не совсем точно выражаюсь, а сообщения из журнала особой информации не несут... У меня нет проблем с чанком, у меня informix вообще не стартует... Вот сообщение из журнала:
Код: plaintext
 14 : 46 : 11   PANIC: Attempting to bring system down
И вот эта запись меня тоже немножко смущает
Код: plaintext
 14 : 46 : 08    Action: Please notify IBM Informix Technical Support.


Это для Вас они ничего не несут.
Проблемы с чанком у informix-a , Вы ему сказали onmode -O он Вас послушался отметил
себе в системном каталоге, что чанк находится в офлайне.

Восстановите 8 дбспейс из архива, накатите журналы , и поднимется.
...
Рейтинг: 0 / 0
01.12.2009, 11:08
    #36340540
Sapfeer
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS Exception Caught
onstat-Восстановите 8 дбспейс из архива, накатите журналы , и поднимется.
Я что-то совсем уже запутался... Даже если пространство и чанк в оффлайне, может ли из-за этого сервер вообще не запускаться, на oninit -v выдавать фразы вроде "IDS did not started successfully" и вылетать с исключением?.. Я все это спрашиваю потому, что архива данного чанка и журналов у меня нет, обычно мы используем просто ежедневную выгрузку данных... Что в данном случае будет проще сделать - переинициализировать сервер заново или пытаться запустить его в данной конфигурации и пересоздать пространство и чанк?..
...
Рейтинг: 0 / 0
01.12.2009, 13:40
    #36341047
KyRo
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS Exception Caught
Идеальный выход из Вашего положения - это вернуть физическое устройство , на котором находился чанк и восстановить базу из бекапа . Но раз бекапа нет , то базу уже не вернуть.
...
Рейтинг: 0 / 0
01.12.2009, 14:03
    #36341123
Sapfeer
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS Exception Caught
KyRo ,
Мне не нужна база. Мне нужен сервер. Просто чтобы он хотя бы запустился... База была создана пару недель назад, информации там толком нет. К тому же все таблицы уже перенесены на другие пространства. Физическое устройство, кстати, на месте...
...
Рейтинг: 0 / 0
01.12.2009, 14:57
    #36341279
KyRo
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS Exception Caught
Ну тогда инициализация и создание спейсов по новому.
...
Рейтинг: 0 / 0
01.12.2009, 16:56
    #36341594
vasilis
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS Exception Caught
Sapfeer... после этого IDS отказался запускаться, как потом оказалось, из-за нехватки места в директории запуска informix'а, хотя я выделял его более чем достаточно - 1 ГБ, в то время, как установочные файлы занимают не более 600 МБ. Далее я увеличил место в директории, откуда запускается IDS с 1 до 3х ГБ, но при запуске сервер выдал новую ошибку:
...
14:46:08 See Also: /opt/IBM/informix/tmp/af.3fcb080, shmem.3fcb080.0
На будущее.
Во время аварийных завершений сервер пишет два вида дампов, которые могут быть довольно большими (размером с ОП, занимаемой IDS). Их местоположение (и необходимость) определяются в onconfig. Т.о. вам всегда нужно иметь достаточно места для записи файлов аварийного завершения (а это может быть и несколько Гиг) да еще и регулярно их чистить (переносить), если такие дампы пишутся регулярно.
...
Рейтинг: 0 / 0
01.12.2009, 17:12
    #36341660
Sapfeer
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS Exception Caught
Спасибо все за советы. Теперь несмотря ни на что буду делать бэкапы

vasilis ,
Буду знать... Вы подтверждаете, что в моем случае только переинициализация поможет заново запустить сервер?
...
Рейтинг: 0 / 0
01.12.2009, 17:15
    #36341667
vasilis
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS Exception Caught
Sapfeer
Я извиняюсь, но наверное я не совсем точно выражаюсь, а сообщения из журнала особой информации не несут... У меня нет проблем с чанком, у меня informix вообще не стартует...
Странно. Если я немного перефразирую вашу же фразу - "У меня нет проблем с отвалившимся колесом, у меня машина вообще не едет" - она вас не смущает ?
Sapfeer
И вот эта запись меня тоже немножко смущает
Код: plaintext
 14 : 46 : 08    Action: Please notify IBM Informix Technical Support.

А чем смущает? Обычно она как находка для тех админов (компаний), у которых есть оплаченный официальній сапорт и можно свои проблемы переложить на чужие плечи, хотя бы на время :)
...
Рейтинг: 0 / 0
01.12.2009, 17:21
    #36341690
vasilis
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS Exception Caught
SapfeerСпасибо все за советы. Теперь несмотря ни на что буду делать бэкапы
А что вам мешало их делать до этого ?
Как много раз уже здесь говорили "Бэкапов много не бывает"
и никакие кластеры и зеркалирования никогда не заменяли стандартный бэкап ( и логических журналов в том числе).

Sapfeer vasilis ,
Буду знать... Вы подтверждаете, что в моем случае только переинициализация поможет заново запустить сервер?
В вашем случае - да. Это наиболее быстрый и безопасный способ восстановить работоспособность вашей тестовой системы и продолжить изучение Информикс.
...
Рейтинг: 0 / 0
01.12.2009, 17:27
    #36341703
Sapfeer
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS Exception Caught
vasilisА чем смущает? Обычно она как находка для тех админов (компаний), у которых есть оплаченный официальній сапорт и можно свои проблемы переложить на чужие плечи, хотя бы на время :)
Я не уверен, но, возможно, у нас поддержка кончилась пару месяцев назад...
...
Рейтинг: 0 / 0
01.12.2009, 17:37
    #36341725
Sapfeer
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS Exception Caught
vasilisА что вам мешало их делать до этого ?
Как много раз уже здесь говорили "Бэкапов много не бывает"
и никакие кластеры и зеркалирования никогда не заменяли стандартный бэкап ( и логических журналов в том числе).
Мешало отсутствие времени на изучение технологии... Все-таки придется найти...

SapfeerВ вашем случае - да. Это наиболее быстрый и безопасный способ восстановить работоспособность вашей тестовой системы и продолжить изучение Информикс.
В скором времени эта система должна стать не тестовой... Она просто еще не эксплуатируется, а находится в стадии разработки...
...
Рейтинг: 0 / 0
01.12.2009, 17:51
    #36341759
vasilis
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
IDS Exception Caught
SapfeervasilisА чем смущает? Обычно она как находка для тех админов (компаний), у которых есть оплаченный официальній сапорт и можно свои проблемы переложить на чужие плечи, хотя бы на время :)
Я не уверен, но, возможно, у нас поддержка кончилась пару месяцев назад...
Возобновляйте, срочно. Убеждайте начальство и приводите финансовые аргументы (потери от простоя важной системы обычно не идут ни в какое сравнение с оплатой саппорта). В вашем случае, думаю, местный саппорт бы мог легко помочь - просто оключив дефектный чанк своей специальной тулзой.
P.S. Бэкапы нужны в любом случае :)
...
Рейтинг: 0 / 0
Форумы / Informix [игнор отключен] [закрыт для гостей] / IDS Exception Caught / 20 сообщений из 20, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]