|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
Добрый день! Помогите плиз с проблемой. Каждый понедельник или вторник (первый рабочий день недели) с 8 до 9:30 БД падает. Скорее всего, причина этой остановки, какая-то джоб или операция. В этот период запускается сотни операции, не могу вычислить этот процесс. Код: plsql 1. 2. 3. 4. 5. 6. 7.
Во вложении файл трассировки за 29.06.21 вторник (понедельник у нас был выходной). ... |
|||
:
Нравится:
Не нравится:
|
|||
05.07.2021, 16:26 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
Именно "падает" и именно БД? Пока что вижу только неудачный коннект к действующему экземпляру. https://www.tekstream.com/resource-center/ora-609-opiodr-aborting-process-unknown-ospid/ ... |
|||
:
Нравится:
Не нравится:
|
|||
05.07.2021, 16:31 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
andrey_anonymous, Оракл становится не доступным, заново стартуем БД. ... |
|||
:
Нравится:
Не нравится:
|
|||
05.07.2021, 16:40 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
SoRa, файлы инцидентов за тот промежуток времени лучше приложите и трейс PMON ... |
|||
:
Нравится:
Не нравится:
|
|||
05.07.2021, 16:49 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
Sayan Malakshinov, Код: plsql 1. 2. 3.
Код: plsql 1.
ну и alert.log 10000 строк Код: plsql 1.
... |
|||
:
Нравится:
Не нравится:
|
|||
05.07.2021, 16:53 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
Sayan Malakshinov, Файл во вложении. ... |
|||
:
Нравится:
Не нравится:
|
|||
05.07.2021, 17:00 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
Vadim Lejnin, Написал уже автор"Во вложении файл трассировки за 29.06.21 вторник (понедельник у нас был выходной)." Актуальный файл прикрепил. ... |
|||
:
Нравится:
Не нравится:
|
|||
05.07.2021, 17:04 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
Vadim Lejnin, alert.log во вложении. ... |
|||
:
Нравится:
Не нравится:
|
|||
05.07.2021, 17:06 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
609 - вторичны 1) Скачок системного времени, после которого сессии массово падают alert.log Код: plsql 1. 2. 3. 4. 5. 6. 7. 8.
2) Ресурсов хватает на системе? pre-requestment на системе выполнен? покажи: Код: plsql 1. 2. 3. 4.
установлен sysstat? если да то пришли стистику за 5 число /var/log/sa/sa05 ( или /var/log/sysstat/sa05) ... |
|||
:
Нравится:
Не нравится:
|
|||
05.07.2021, 17:41 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
И да trace pmon и vktm тоже нужны ... |
|||
:
Нравится:
Не нравится:
|
|||
05.07.2021, 17:43 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
Vadim Lejnin, 2) Ресурсов хватает на системе? - CPu Core 16, Memory 252. HugePage не настроено. SGA 172G, PGA 74G. pre-requestment на системе выполнен? - использован oracle-rdbms-server-11gR2-preinstall установлен sysstat? Не установлен. Файлы во вложении. ... |
|||
:
Нравится:
Не нравится:
|
|||
05.07.2021, 18:14 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
SoRa Memory 252... SGA 172G, PGA 74G А это в самом деле необходимо, я имею ввиду SGA? Что вернут следующие запросы: Код: plsql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
Код: plsql 1.
Код: plsql 1. 2. 3.
... |
|||
:
Нравится:
Не нравится:
|
|||
05.07.2021, 19:46 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
SoRa, это уже поздновато в этом systemstate dump видно лишь то, что PMON отправил ksuabt (ABORT) Код: plsql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20.
Вообще, по идее надо трейс самого pmon - посмотрите *14865.trc Но, в целом, судя по алерту: Код: plsql 1. 2. 3. 4. 5. 6.
+ из systemstate dump: Код: plsql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
Скорее всего, PMON не смог выделить память и пошел отключаться. ... |
|||
:
Нравится:
Не нравится:
|
|||
05.07.2021, 20:22 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
Sayan Malakshinov SoRa, это уже поздновато в этом systemstate dump видно лишь то, что PMON отправил ksuabt (ABORT) Код: plsql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20.
Вообще, по идее надо трейс самого pmon - посмотрите *14865.trc Но, в целом, судя по алерту: Код: plsql 1. 2. 3. 4. 5. 6.
+ из systemstate dump: Код: plsql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
Скорее всего, PMON не смог выделить память и пошел отключаться. Добавлю свои 5 копеек, 1) Покажите /proc/meminfo Вам советуют установить Large Pages, при таких размерах SGA это не лишнее Да и гарантирует, что SGA в swap не провалится Код: plsql 1. 2. 3. 4. 5. 6. 7. 8.
Единственно, "урежте осетра" У Вас на "все остальное", включая систему остается 6Гиг Код: plsql 1. 2.
Там ничего кроме oracle не крутится? банальный X gnome например/ Тот из-за утечек памяти 6 гигов за неделю вполне сожрать может И да, советую установить sysstat В следующий раз при падении, можно будет смотреть динамику потребления ресурсов системы, например Код: plsql 1. 2. 3. 4. 5. 6. 7.
где DD - день месяца Если нужно определить кто пожрал память Я использую следующий скрипт, с ограничение размера журнала процессов (здесь отбираются 100 процессов по pcpu, но можно переделать сортировку например на rss Код: plsql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21.
При падении, можно найти pid самой толстой редиски, и посмотреть уже ее trace, что она делала Если интересует только память, то удобнее использовать smem вместо ps (выделенная строка) ну и drift времени все же стоить посмотреть, Вы прислали trace уже после oracle restart А интересует тот который упал ... |
|||
:
Нравится:
Не нравится:
|
|||
05.07.2021, 23:59 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
еще посмотрите dmesg - подозреваю вы там увидите oomkiller, который прибил самый жирный процесс - видимо от oracle ... |
|||
:
Нравится:
Не нравится:
|
|||
06.07.2021, 07:46 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
flexgen, Код: plsql 1. 2. 3.
Код: plsql 1. 2. 3. 4. 5. 6. 7. 8.
Код: plsql 1. 2. 3. 4. 5. 6. 7.
... |
|||
:
Нравится:
Не нравится:
|
|||
06.07.2021, 09:49 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
Vadim Lejnin, 1) Покажите /proc/meminfo /proc/meminfo Код: plsql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49.
Там ничего кроме oracle не крутится? - На сервере крутится только одна инстанция оракла. Инфо по sysstat в файле во вложении. ... |
|||
:
Нравится:
Не нравится:
|
|||
06.07.2021, 13:34 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
Настройте hugepages + включите direct IO (filesystemio_options=setall) ... |
|||
:
Нравится:
Не нравится:
|
|||
06.07.2021, 14:20 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
посмотрите Код: plsql 1.
поля si/so - если у вас ввод-вывод по свопу - памяти не хватает конфигурите oracle, SGA уменьшить, huge pages законфигурить и т д В системном логе что для этого времени видно(dmesg)? ... |
|||
:
Нравится:
Не нравится:
|
|||
06.07.2021, 14:36 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
SoRa, У Вас явно какая-то проблема со временем разные установки timezone для root и oracle? Судя по статистики, лютая жесть у Вас случилась Код: plsql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. 71. 72. 73. 74. 75.
Как и предполагали, кончилась память и swap, система в панике прибила oracle 1) Уменьшайте/балансируйте SGA/PGA 2) Ищите кто выжирает память ... |
|||
:
Нравится:
Не нравится:
|
|||
06.07.2021, 14:38 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
SoRa, У Вас даже после oracle restart занято 7% swap Скорее всего, это утечка ( ну либо Вы пережали с выделением памяти oracle) Я бы посмотрел кто там такой прожорливый. Я обычно пользуюсь smem, но можно и по колхозному: Linux Linux Find Out What Process Are Using Swap SpaceFind Out What Process Are Using Swap Space ... |
|||
:
Нравится:
Не нравится:
|
|||
06.07.2021, 15:43 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
landy, В системном логе что для этого времени видно(dmesg)? ... |
|||
:
Нравится:
Не нравится:
|
|||
06.07.2021, 15:44 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
SoRa landy, В системном логе что для этого времени видно(dmesg)? Что тебе и говорили, память кончилась Код: plsql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17.
... |
|||
:
Нравится:
Не нравится:
|
|||
06.07.2021, 16:27 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
Посмотрите trace для PID 18739 ... |
|||
:
Нравится:
Не нравится:
|
|||
06.07.2021, 16:30 |
|
Падает БД - Abnormal instance termination
|
|||
---|---|---|---|
#18+
SoRa, Вы сами не можете свои логи посмотреть ? [[Mon Jul 5 08:40:31 2021] Out of memory: Kill process 14900 (oracle) score 241 or sacrifice child [Mon Jul 5 08:40:31 2021] Killed process 14900 (oracle) total-vm:189007096kB, anon-rss:16200kB, file-rss:1780kB, shmem-rss:67411568kB [Mon Jul 5 08:40:31 2021] oom_reaper: reaped process 14900 (oracle), now anon-rss:0kB, file-rss:0kB, shmem-rss:67411568kB ... |
|||
:
Нравится:
Не нравится:
|
|||
07.07.2021, 07:15 |
|
|
start [/forum/topic.php?fid=52&fpage=16&tid=1880057]: |
0ms |
get settings: |
11ms |
get forum list: |
11ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
51ms |
get topic data: |
13ms |
get forum data: |
2ms |
get page messages: |
57ms |
get tp. blocked users: |
2ms |
others: | 12ms |
total: | 167ms |
0 / 0 |