|
IDS Exception Caught
|
|||
---|---|---|---|
#18+
Не знаю, как у меня так получилось, но после некоторых действий IDS отказался запускаться... По поводу моей конфигурации уже было пару тем, на этот раз придется описать ситуацию подробнее... Есть два Sun Fire V490, два Sun StorageTek 3500fc и один Brocade 200E. На этом оборудовании крутятся Sun Solaris 10 5/08 и Sun Cluster 3.2. Сам IDS установлен на ZFS пул, который зеркалируется между массивами. На прошлой неделе, пока IDS работал на одном из серверов, к нему добавили новое пространство и, соответвенно, чанк, но на другом сервере ссылку я не создал - просто забыл... После этого после переноса на другой сервер, на котором не было ссылки, IDS некоторое время вел себя весьма предсказуемо - в логах ругался на "плохое" пространство и блокировал работу по checkpoint'у. В этой теме обсуждалась схожая ситуация, но на этот раз я не стал запускать onmode -O сразу, а просто попытался выключить сервер и добавить ссылку на недостающее пространство, но это оказалось не так просто - после команды onmode -k и двух подтверждений, сервер погружался в глубокий сон - никаких новых сообщений в журналах и никакого ответа от команды... Ждал я достаточно долго, но ничего нового не происходило... Даже запуск onmode -O не помогал, причем по ее выходу можно было понять, что сервер уже не работает: Код: plaintext 1. 2. 3. 4. 5.
После этого я решил его убить через kill -9, что, естественно сработало. Дальше, чтобы вновь его запустить, почистил shared memory (ipcs, ipcrm), но после этого IDS отказался запускаться, как потом оказалось, из-за нехватки места в директории запуска informix'а, хотя я выделял его более чем достаточно - 1 ГБ, в то время, как установочные файлы занимают не более 600 МБ. Далее я увеличил место в директории, откуда запускается IDS с 1 до 3х ГБ, но при запуске сервер выдал новую ошибку: Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18.
... |
|||
:
Нравится:
Не нравится:
|
|||
30.11.2009, 17:56 |
|
IDS Exception Caught
|
|||
---|---|---|---|
#18+
Шо опять ? IMHO Ваша ошибка - запуск onmode -O. Содержимое файла /opt/IBM/informix/tmp/af.3fcb080 может пролить свет на суть проблемы. Если в отпавшем чанке были логические журналы - готовьте бэкап к рестору. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.11.2009, 18:50 |
|
IDS Exception Caught
|
|||
---|---|---|---|
#18+
onstat-IMHO Ваша ошибка - запуск onmode -O. Ну я же не сразу ее запустил... IDS вообще не проявлял никаких признаков жизни... Что мне оставалось делать в этой ситуации?.. Informix был в насмерть заблокированном состоянии... К тому же, она все равно не сработала - при следующем старте в журнале опять появилось сообщение о "плохом" чанке... onstat-Содержимое файла /opt/IBM/informix/tmp/af.3fcb080 может пролить свет на суть проблемы. af.3fcb080 onstat-Если в отпавшем чанке были логические журналы - готовьте бэкап к рестору. К счастью, в этам чанке была очередная база, которую можно без особых проблем восстановить... ... |
|||
:
Нравится:
Не нравится:
|
|||
30.11.2009, 19:07 |
|
IDS Exception Caught
|
|||
---|---|---|---|
#18+
автор Сам IDS установлен на ZFS пул, который зеркалируется между массивами. Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37.
автор но я до сих пор не могу понять в каком именно месте и что я сделал не так... Кто вам посоветовал по такому пути подключать чанк? Пусть SUN-гуру меня поправят , но ИМХО такой чанк от вас может уплыть даже в случае обычной перезагрузки, смены преферед контроллера в массиве, установки патча на ОС и прочих мало зависящих от СУБД действий. Возможно уже сейчас на обоих узлах кластера он сейчас имеет совсем другое имя. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.11.2009, 20:07 |
|
IDS Exception Caught
|
|||
---|---|---|---|
#18+
onstat-Кто вам посоветовал по такому пути подключать чанк? Этот чанк вообще не я добавлял... И я прекрасно понимаю, что чанки на сырые устройство нужно подключать только через символические ссылки, но я не совсем понимаю, какое это отношение имеет к генерации исключения во время запуска informix'а... ... |
|||
:
Нравится:
Не нравится:
|
|||
30.11.2009, 20:11 |
|
IDS Exception Caught
|
|||
---|---|---|---|
#18+
В AF все написано : автор 14:46:02 Results: Cannot use TBLSpace page for TBLSpace 8388609 14:46:02 Action: Run 'oncheck -pt 8388609' 14:46:02 stack trace for pid 14416 written to /opt/IBM/informix/tmp/af.3f6b07a 14:46:02 See Also: /opt/IBM/informix/tmp/af.3f6b07a, shmem.3f6b07a.0 14:46:05 pthdrpage:ptalloc:bad partn page 14:46:05 Assert Failed: Chunk 8 is being taken OFFLINE. 14:46:05 IBM Informix Dynamic Server Version 11.10.UC3 14:46:05 Who: Session(7, informix@server1, 0, b109898) Thread(14, fast_rec, b0db778, 1) File: rspartn.c Line: 7121 14:46:05 Results: Cannot Open DBspace 8. 14:46:05 Action: Restore space containing this chunk from the archive. 14:46:05 stack trace for pid 14416 written to /opt/IBM/informix/tmp/af.3f6b07a ... |
|||
:
Нравится:
Не нравится:
|
|||
30.11.2009, 20:14 |
|
IDS Exception Caught
|
|||
---|---|---|---|
#18+
Sapfeeronstat-Кто вам посоветовал по такому пути подключать чанк? Этот чанк вообще не я добавлял... И я прекрасно понимаю, что чанки на сырые устройство нужно подключать только через символические ссылки, но я не совсем понимаю, какое это отношение имеет к генерации исключения во время запуска informix'а... Та можно и не через символические, символические это для удобства. Если бы линк шел на этот же девайс , думаю это вас мало спасло бы , потому что он уже в офлайне. Его нужно ресторить. Если Вы видете предложение Infomix сделать onmode -O десять раз проверьте, что потеряно и можно ли все вернуть на место , а потом уже принимайте решение. Ну я малі діти чес слово :( з.ы. Без обид . ... |
|||
:
Нравится:
Не нравится:
|
|||
30.11.2009, 20:25 |
|
IDS Exception Caught
|
|||
---|---|---|---|
#18+
onstat-, Я не обижаюсь, все хорошо. Я извиняюсь, но наверное я не совсем точно выражаюсь, а сообщения из журнала особой информации не несут... У меня нет проблем с чанком, у меня informix вообще не стартует... Вот сообщение из журнала: Код: plaintext
Код: plaintext
... |
|||
:
Нравится:
Не нравится:
|
|||
30.11.2009, 22:17 |
|
IDS Exception Caught
|
|||
---|---|---|---|
#18+
Sapfeer onstat-, Я не обижаюсь, все хорошо. Я извиняюсь, но наверное я не совсем точно выражаюсь, а сообщения из журнала особой информации не несут... У меня нет проблем с чанком, у меня informix вообще не стартует... Вот сообщение из журнала: Код: plaintext
Код: plaintext
Это для Вас они ничего не несут. Проблемы с чанком у informix-a , Вы ему сказали onmode -O он Вас послушался отметил себе в системном каталоге, что чанк находится в офлайне. Восстановите 8 дбспейс из архива, накатите журналы , и поднимется. ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2009, 09:53 |
|
IDS Exception Caught
|
|||
---|---|---|---|
#18+
onstat-Восстановите 8 дбспейс из архива, накатите журналы , и поднимется. Я что-то совсем уже запутался... Даже если пространство и чанк в оффлайне, может ли из-за этого сервер вообще не запускаться, на oninit -v выдавать фразы вроде "IDS did not started successfully" и вылетать с исключением?.. Я все это спрашиваю потому, что архива данного чанка и журналов у меня нет, обычно мы используем просто ежедневную выгрузку данных... Что в данном случае будет проще сделать - переинициализировать сервер заново или пытаться запустить его в данной конфигурации и пересоздать пространство и чанк?.. ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2009, 11:08 |
|
IDS Exception Caught
|
|||
---|---|---|---|
#18+
Идеальный выход из Вашего положения - это вернуть физическое устройство , на котором находился чанк и восстановить базу из бекапа . Но раз бекапа нет , то базу уже не вернуть. ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2009, 13:40 |
|
IDS Exception Caught
|
|||
---|---|---|---|
#18+
KyRo , Мне не нужна база. Мне нужен сервер. Просто чтобы он хотя бы запустился... База была создана пару недель назад, информации там толком нет. К тому же все таблицы уже перенесены на другие пространства. Физическое устройство, кстати, на месте... ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2009, 14:03 |
|
IDS Exception Caught
|
|||
---|---|---|---|
#18+
Ну тогда инициализация и создание спейсов по новому. ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2009, 14:57 |
|
IDS Exception Caught
|
|||
---|---|---|---|
#18+
Sapfeer... после этого IDS отказался запускаться, как потом оказалось, из-за нехватки места в директории запуска informix'а, хотя я выделял его более чем достаточно - 1 ГБ, в то время, как установочные файлы занимают не более 600 МБ. Далее я увеличил место в директории, откуда запускается IDS с 1 до 3х ГБ, но при запуске сервер выдал новую ошибку: ... 14:46:08 See Also: /opt/IBM/informix/tmp/af.3fcb080, shmem.3fcb080.0 На будущее. Во время аварийных завершений сервер пишет два вида дампов, которые могут быть довольно большими (размером с ОП, занимаемой IDS). Их местоположение (и необходимость) определяются в onconfig. Т.о. вам всегда нужно иметь достаточно места для записи файлов аварийного завершения (а это может быть и несколько Гиг) да еще и регулярно их чистить (переносить), если такие дампы пишутся регулярно. ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2009, 16:56 |
|
IDS Exception Caught
|
|||
---|---|---|---|
#18+
Спасибо все за советы. Теперь несмотря ни на что буду делать бэкапы vasilis , Буду знать... Вы подтверждаете, что в моем случае только переинициализация поможет заново запустить сервер? ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2009, 17:12 |
|
IDS Exception Caught
|
|||
---|---|---|---|
#18+
Sapfeer Я извиняюсь, но наверное я не совсем точно выражаюсь, а сообщения из журнала особой информации не несут... У меня нет проблем с чанком, у меня informix вообще не стартует... Странно. Если я немного перефразирую вашу же фразу - "У меня нет проблем с отвалившимся колесом, у меня машина вообще не едет" - она вас не смущает ? Sapfeer И вот эта запись меня тоже немножко смущает Код: plaintext
А чем смущает? Обычно она как находка для тех админов (компаний), у которых есть оплаченный официальній сапорт и можно свои проблемы переложить на чужие плечи, хотя бы на время :) ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2009, 17:15 |
|
IDS Exception Caught
|
|||
---|---|---|---|
#18+
SapfeerСпасибо все за советы. Теперь несмотря ни на что буду делать бэкапы А что вам мешало их делать до этого ? Как много раз уже здесь говорили "Бэкапов много не бывает" и никакие кластеры и зеркалирования никогда не заменяли стандартный бэкап ( и логических журналов в том числе). Sapfeer vasilis , Буду знать... Вы подтверждаете, что в моем случае только переинициализация поможет заново запустить сервер? В вашем случае - да. Это наиболее быстрый и безопасный способ восстановить работоспособность вашей тестовой системы и продолжить изучение Информикс. ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2009, 17:21 |
|
IDS Exception Caught
|
|||
---|---|---|---|
#18+
vasilisА чем смущает? Обычно она как находка для тех админов (компаний), у которых есть оплаченный официальній сапорт и можно свои проблемы переложить на чужие плечи, хотя бы на время :) Я не уверен, но, возможно, у нас поддержка кончилась пару месяцев назад... ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2009, 17:27 |
|
IDS Exception Caught
|
|||
---|---|---|---|
#18+
vasilisА что вам мешало их делать до этого ? Как много раз уже здесь говорили "Бэкапов много не бывает" и никакие кластеры и зеркалирования никогда не заменяли стандартный бэкап ( и логических журналов в том числе). Мешало отсутствие времени на изучение технологии... Все-таки придется найти... SapfeerВ вашем случае - да. Это наиболее быстрый и безопасный способ восстановить работоспособность вашей тестовой системы и продолжить изучение Информикс. В скором времени эта система должна стать не тестовой... Она просто еще не эксплуатируется, а находится в стадии разработки... ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2009, 17:37 |
|
IDS Exception Caught
|
|||
---|---|---|---|
#18+
SapfeervasilisА чем смущает? Обычно она как находка для тех админов (компаний), у которых есть оплаченный официальній сапорт и можно свои проблемы переложить на чужие плечи, хотя бы на время :) Я не уверен, но, возможно, у нас поддержка кончилась пару месяцев назад... Возобновляйте, срочно. Убеждайте начальство и приводите финансовые аргументы (потери от простоя важной системы обычно не идут ни в какое сравнение с оплатой саппорта). В вашем случае, думаю, местный саппорт бы мог легко помочь - просто оключив дефектный чанк своей специальной тулзой. P.S. Бэкапы нужны в любом случае :) ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2009, 17:51 |
|
|
start [/forum/topic.php?fid=44&msg=36339758&tid=1607688]: |
0ms |
get settings: |
10ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
48ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
51ms |
get tp. blocked users: |
2ms |
others: | 13ms |
total: | 160ms |
0 / 0 |