|
|
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Добрый день! Неожиданно налетел на новую для себя проблему. Обычно информация о проблемах с базой данных проявляется в различных мониторингах или внешних признаках. В данном случае идет речь про сервер, на котором производится активная разработка и тестирование нескольких информационных систем. В рассматриваемом случае, мониторинги справились плохо, хотя определенные признаки - рост количества активных сесиий и "зависания" базы данных проявлялись. Все это в той или иной мере время от времени происходило. В анализах отмечалась конкуренция за блоки и конфигурация. В топе появлялись явно не являющиеся причиной запросы типа анализа аудита или записи аудита. Но к счастью произошел модельный случай - один программист запустил объемное удаление из одной таблицы части записей, отобранных по некой колонке типа дата, одним оператором. Табличка размером 1.3 ГБ. В процессе удаления сессия изменила больше 250 млн. блоков. Удаление шло 9 часов. Причины такого странного поведения базы данных рассмотрим отдельно, а сейчас выявившаяся проблема. В результате объемного изменения генерилось очень много redo и все группы оказывались активными, так как транзакция шла 9 часов и ее изменения попадали во все группы. В результате все сессий становились активными и останавливалось переключение redo. Добавление новой группы позволяло продолжить работу. В результате было создано больше 40 групп по 500МБ каждая и операцию удалось довести до конца. Вопрос следующий - неужели так просто затопорить работу базы данных забив одной длинной транзакцией все группы redo? Обычно на продуктиве используются три группы redo, получается, что дастаточно двух длинных транзакций, занявщих по группе Redo, чтобы блокировать работу? Как мониторить такую проблему? Пока видится проверка процента активных сессий и процента свободных блоков. Enterprise manager на этом же инстансе с мониторингом не справился (возможно я его не умею готовить) - он все записывал, а в критический момент зависал или падал. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.07.2017, 11:47 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Таджикистану привет! Ты извини, но столь текста читать сложно, когда пишут на языке соседних стран. Давай коротко - есть такая-то проблема... Реально, язык форума русский, а тут столько написано на таджикском. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.07.2017, 12:39 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Q.Tarantino, Привет из солнечного таджикистана - ты, видимо, писатель, а не читатель! Имеешь полное право не читать! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.07.2017, 12:47 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
BfinkДобрый день! Неожиданно налетел на новую для себя проблему. Обычно информация о проблемах с базой данных проявляется в различных мониторингах или внешних признаках. В данном случае идет речь про сервер, на котором производится активная разработка и тестирование нескольких информационных систем. В рассматриваемом случае, мониторинги справились плохо, хотя определенные признаки - рост количества активных сесиий и "зависания" базы данных проявлялись. Все это в той или иной мере время от времени происходило. В анализах отмечалась конкуренция за блоки и конфигурация. В топе появлялись явно не являющиеся причиной запросы типа анализа аудита или записи аудита. Но к счастью произошел модельный случай - один программист запустил объемное удаление из одной таблицы части записей, отобранных по некой колонке типа дата, одним оператором. Табличка размером 1.3 ГБ. В процессе удаления сессия изменила больше 250 млн. блоков. Удаление шло 9 часов. Причины такого странного поведения базы данных рассмотрим отдельно, а сейчас выявившаяся проблема. В результате объемного изменения генерилось очень много redo и все группы оказывались активными, так как транзакция шла 9 часов и ее изменения попадали во все группы. В результате все сессий становились активными и останавливалось переключение redo. Добавление новой группы позволяло продолжить работу. В результате было создано больше 40 групп по 500МБ каждая и операцию удалось довести до конца. Вопрос следующий - неужели так просто затопорить работу базы данных забив одной длинной транзакцией все группы redo? Обычно на продуктиве используются три группы redo, получается, что дастаточно двух длинных транзакций, занявщих по группе Redo, чтобы блокировать работу? Как мониторить такую проблему? Пока видится проверка процента активных сессий и процента свободных блоков. Enterprise manager на этом же инстансе с мониторингом не справился (возможно я его не умею готовить) - он все записывал, а в критический момент зависал или падал. Написано много, но чтобы уловить в чем проблема, надо приложить немало усилий. У меня такие вопросы образовались: 1. База в archive log mode? 2. Архивирование red log groups производится? 3. Как выполнялось удаление, построчно или был удален набор строк по условию? 4. Когда выполнился commit? 4. 250 млн блоков по 8 Kbytes каждый - это 1.9 Гб, ты указал размер таблицы как 1.3 Гб. Каков размер блока? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.07.2017, 15:39 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
flexgen1. База в archive log mode? Да flexgen2. Архивирование red log groups производится? Да, и все кроме current были архивированы flexgen3. Как выполнялось удаление, построчно или был удален набор строк по условию? Один delete, условие по двум колонкам - по одной is null, по другой, типа date - >sysdate+100 flexgen4. Когда выполнился commit? После оператора. Само действие было оформлено как безымяный блок Pl/sql, в котором было присвоено значение переменной (sysdate+100), далее шел delete, в котором условие ссылалось на эту переменную и commit. Этот блок выполнялся 9 часов и в конце сделал единственный commit; flexgen4. 250 млн блоков по 8 Kbytes каждый - это 1.9 Гб, ты указал размер таблицы как 1.3 Гб. Каков размер блока? 8 Kbytes. Размер таблицы из статистики. Я не согласен, что "250 млн блоков по 8 Kbytes каждый - это 1.9 Гб" ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.07.2017, 18:36 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Bfink, Не могло оказаться так, что вы просто не дождались чекпоинта при исчерпании реду групп? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.07.2017, 12:53 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
проходил мимо..., Поясните, пожалуйста, как чекпоинт должен пройти, если все группы редо заняты? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.07.2017, 15:33 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
BfinkДа, и все кроме current были архивированы BfinkПоясните, пожалуйста, как чекпоинт должен пройти, если все группы редо заняты? сперва ты поясни, а то сам себе противоречишь ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.07.2017, 16:22 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Q.Tarantino, Чтобы на группу редо можно было бы переключиться необходимо выполнение двух условий - она должна быть архивирована и не находиться в статусе active. В моем случае все группы, кроме current, находились в статусе active, что не позволяло провести переключение групп redo. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.07.2017, 17:04 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Bfinkпроходил мимо..., Поясните, пожалуйста, как чекпоинт должен пройти, если все группы редо заняты? Эээ... А как тёплое связанно с кислым? Чекпоинт ДОЛЖЕН пройти, чтобы группа перестала быть Актив, ибо Актив всего лишь означает надобность группы для крэш-рекавери. В момент переключения логов всегда создаётся контрольная точка, но не всегда полная. Но исчерпание групп - именно тот случай, когда без этого никак... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.07.2017, 17:56 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
проходил мимо..., Кстати, если это именно чекпоинт вас держал, в логе об этом должно было быть написано. Несколько раз... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.07.2017, 17:58 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
проходил мимо..., Вы правы сообщение Checkpoint not complete выскакивало периодически вместе с сообщением типа Thread 1 cannot allocate new log, sequence 448301 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.07.2017, 18:30 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Bfink, Осталось понять, что так сильно держало чекпоинт, что вы воспринимали это как останов работы. Виртуальный сервер? Датафайлы на файловой системе? Или на RAID5? Или просто сторадж занят чем-то ещё? Вариантов масса... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.07.2017, 18:36 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
проходил мимо..., нет, реальная машина, HDD, датафайлы на файловой системе. А можно где-то посмотреть когда и какие были checkpoint-ы? подобные напряги были периодически последние 2 недели, но здесь известна причина, время и все остальное. Почему-то количество измененных сессией блоков многократно превышает размеры таблицы, откуда удалялись строки вместе с ее индексами. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.07.2017, 18:45 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Когда все "устаканилось" на 35 группах, то есть появлялись 1-2 неактивные группы, сообщение стало выскакивать другое - Private strand flush not complete и delete еще шел 3 часа. В этом случае беспокоит скорость, с которой все переходит в неуправляемое состояние. Не держать же в продуктивной системе столько групп. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.07.2017, 18:57 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
BfinkПочему-то количество измененных сессией блоков многократно превышает размеры таблицы, откуда удалялись строки вместе с ее индексами.Вы забыли анду, так что это нормально. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.07.2017, 19:07 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
проходил мимо...BfinkПочему-то количество измененных сессией блоков многократно превышает размеры таблицы, откуда удалялись строки вместе с ее индексами.Вы забыли анду, так что это нормально. На мой взгляд все таки слишком - в 1000 раз больше. То есть во время удаления один блок правился 1000раз? Да и весь undo значительно меньше ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.07.2017, 19:29 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Bfink, У вас есть понимание того, как из индекса удаляется запись и что при этом попадает в анду? Хотя, в 1000 раз, наверное, всё равно перебор. Хотя, если индексов много и удаление шло поиском по одному из индексов - можно и в 1000.. Но это, барин, помощник (в данном случае - индекс) нужен (с) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.07.2017, 19:39 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
проходил мимо...Bfink, У вас есть понимание того, как из индекса удаляется запись и что при этом попадает в анду? Нет, никак до этого не доходило - все-таки массовое удаление - редкая операция в информационных системах. А предположение об удалении по индексу проверю - вполне может быть правдой, тогда это может объяснить и множественное изменение одного и того же блока данных. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.07.2017, 19:49 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
BfinkЧтобы на группу редо можно было бы переключиться необходимо выполнение двух условий - она должна быть архивирована и не находиться в статусе active. В моем случае все группы, кроме current, находились в статусе active, что не позволяло провести переключение групп redo. BfinkДа, и все кроме current были архивированы значит ты сам себе противоречишь. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.07.2017, 19:53 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Q.TarantinoBfinkЧтобы на группу редо можно было бы переключиться необходимо выполнение двух условий - она должна быть архивирована и не находиться в статусе active. В моем случае все группы, кроме current, находились в статусе active, что не позволяло провести переключение групп redo. BfinkДа, и все кроме current были архивированы значит ты сам себе противоречишь. Нет, не противоречу - условия то два, и оба должны быть выполнены. А одного архивирования недостаточно для переключения ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.07.2017, 20:14 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
[quot Bfink]Q.Tarantinoпропущено... Нет, не противоречу - условия то два, и оба должны быть выполнены. А одного архивирования недостаточно для переключения Вам надо срочно начать писать свои книги по Oracle, просто новое слово в администрировании, я то наивный думал что или или или, а тут и! Писать и срочно в редакцию, Кэйта посрамите! А программисту оторвите руки, лучше сами, нежели пльзователи сначала Вам голову. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.07.2017, 05:23 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Alexey DBA, Программисты как гидры - вместо одной оторванной головы вырастает десять. И от пользователей их головами не убережешься. Книги писать не получается - слишком заумный текст выходит… А чем Вам мое утверждение не нравится? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.07.2017, 07:43 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Bfinkпроходил мимо..., Поясните, пожалуйста, как чекпоинт должен пройти, если все группы редо заняты? А что мешает добавить redo или увеличить их размер? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.07.2017, 14:26 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Aliona, 40 групп по 500мб как-то многовато. У Вас сколько групп на продуктиве? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.07.2017, 16:34 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
BfinkВопрос следующий - неужели так просто затопорить работу базы данных забив одной длинной транзакцией все группы redo? Обычно на продуктиве используются три группы redo, получается, что дастаточно двух длинных транзакций, занявщих по группе Redo, чтобы блокировать работу? Как мониторить такую проблему? Пока видится проверка процента активных сессий и процента свободных блоков. Enterprise manager на этом же инстансе с мониторингом не справился (возможно я его не умею готовить) - он все записывал, а в критический момент зависал или падал. А помните нашумевший сбой в Сбербанке пару лет назад? вот это оно и было )) ps а чего делал DBWR спрашивается? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.07.2017, 16:40 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Q.TarantinoТаджикистану привет! Ты извини, но столь текста читать сложно, когда пишут на языке соседних стран. Давай коротко - есть такая-то проблема... Реально, язык форума русский, а тут столько написано на таджикском. чья б мычала... типа ты русcкий понимаешь ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.07.2017, 16:43 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Bfinkпроходил мимо...пропущено... Вы забыли анду, так что это нормально. На мой взгляд все таки слишком - в 1000 раз больше. То есть во время удаления один блок правился 1000раз? Да и весь undo значительно меньше FK c DELETE CASCADE ? тригеры? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.07.2017, 16:48 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Bfink40 групп по 500мб как-то многовато. У Вас сколько групп на продуктиве? А это зависит : Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.07.2017, 16:52 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Никто не спросил, а какие параметра checkpoint-а выставлены? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.07.2017, 18:22 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
DВА, Нет, триггеры только на insert и update, операция delete. FK нету, есть несколько индексов ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.07.2017, 18:25 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Takurava, Просто у всех, кого я опрашивал 3 или 5 групп. А у Вас сколько? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.07.2017, 18:26 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
chpkНикто не спросил, а какие параметра checkpoint-а выставлены? Что Вы имеете в виду? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.07.2017, 18:27 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
DВАps а чего делал DBWR спрашивается? Не знаю, писал, наверное - 250 млн блоков не шутка. А где-то есть вьюшка с историей что он делал? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.07.2017, 18:33 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
BfinkchpkНикто не спросил, а какие параметра checkpoint-а выставлены? Что Вы имеете в виду? show parameter checkpoint show parameter mttr ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.07.2017, 18:53 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
chpkshow parameter checkpoint show parameter mttr Код: plsql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.07.2017, 18:59 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Bfink, Что говорится о размере логов в V$INSTANCE_RECOVERY ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.07.2017, 19:52 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
BfinkDВАps а чего делал DBWR спрашивается? Не знаю, писал, наверное - 250 млн блоков не шутка. А где-то есть вьюшка с историей что он делал? ну для начала - что в самой системе то происходит? iostat... диски то справляются с записью или 100% busy и дикие задержки? твоя ситуация похоже на то что dbwr не справляется с записью, поэтому и висят активные журналы... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.07.2017, 20:41 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
BfinkПросто у всех, кого я опрашивал 3 или 5 групп. А у Вас сколько? 5-9, бывало и по 30. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.07.2017, 21:22 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
TakuravaBfinkПросто у всех, кого я опрашивал 3 или 5 групп. А у Вас сколько? 5-9, бывало и по 30. И какой признак показывает, что нужно 30? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.07.2017, 22:14 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Еще вопрос - что было в wait events? Что насчет блокировок? Есть ли partitions? Есть ли подходящий индекс? Было бы интересно и на план выполнения взглянуть. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.07.2017, 23:05 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
chkpЧто говорится о размере логов в V$INSTANCE_RECOVERY ? RECOVERY_ESTIMATED_IOSACTUAL_REDO_BLKSTARGET_REDO_BLKSLOG_FILE_SIZE_REDO_BLKS LOG_CHKPT_TIMEOUT_REDO_BLKS10443865328248728200960282487TARGET_MTTRESTIMATED_MTTRCKPT_BLOCK_WRITESWRITES_MTTRWRITES_LOGFILE_SIZE03210528590122427WRITES_LOGFILE_SIZEWRITES_LOG_CHECKPOINT_SETTINGSWRITES_OTHER_SETTINGSWRITES_AUTOTUNE WRITES_FULL_THREAD_CKPT122427145957802099829576336 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.07.2017, 01:17 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
flexgenЕще вопрос - что было в wait events? EventWaitsTime(s)Avg wait (ms)% DB timeWait Classfree buffer waits1728279971620241.41Configurationenq: TM - contention1221592215941732.78Applicationenq: TX - row lock contention13211.6968860817.30Applicationdb file scattered read1695606332524.92User I/Obuffer busy waits802259232323.83Concurrency flexgenЧто насчет блокировок? Есть ли partitions? Блокировок особенных не заметил, partitions нет. flexgenЕсть ли подходящий индекс? Выполнялся этот блок Код: plsql 1. 2. 3. Есть индекс по EXEC_STATUS и EXEC_DT flexgenБыло бы интересно и на план выполнения взглянуть. Код: xml 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.07.2017, 01:53 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Q.Tarantinoну для начала - что в самой системе то происходит? iostat... диски то справляются с записью или 100% busy и дикие задержки? IOStat by Function summary Function NameReads: DataReqs per secData per secWrites: DataReqs per secData per secWaits: CountAvg Tm(ms)Buffer Cache Reads89.9G454.1625.53900M0.000M16371K1.75Others10.2G177.482.887363.4G1.950.952097646.8K0.49DBWR0M0.000M1.5G45.590.4139076455667.42LGWR165M2.930.045773420M1.460.11651519K8.50RMAN75M0.080.02080657M0.040.01581242414.48Direct Reads4M0.080.0011090M0.000M28812.64Direct Writes0M0.000M3M0.030.0008321120.00Streams AQ0M0.000M0M0.000M322.33TOTAL:100.3G634.7328.49415.3G49.071.499162303.8K3.01 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.07.2017, 02:04 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
проходил мимо...Bfink, Осталось понять, что так сильно держало чекпоинт, что вы воспринимали это как останов работы. Виртуальный сервер? Датафайлы на файловой системе? Или на RAID5? Или просто сторадж занят чем-то ещё? Вариантов масса... У меня чекпоинт держится тяжёлым джобом пару часов. Виртуальный сервер Датафайлы на файловой системе Сторадж занят почти на 100 %. Что в таком случае надо сделать? Купить новый сторадж? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.07.2017, 12:14 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
BfinkIOStat by Function summary я хотел увидеть iostat из операционки :) но и тут у dbwr Avg Tm зашкаливает. посмотри на оси все же iostat. мне кажется диски не вывозят. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.07.2017, 12:27 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
show parameter checkpoint поговорили и забыли Я бы поставил log_checkpoint_interval=100000 log_checkpoint_timeout=600 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.07.2017, 13:07 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Т к в вашем случае чекпоинт проходил каждые 30 минут и большое число измененных блоков - у вас было много redo в состоянии active Checkpoint not complete This message indicates that Oracle wants to reuse a redo log file, but the corresponding checkpoint associated is not terminated. In this case, Oracle must wait until the checkpoint is completely realized Установив 100000 - у вас чекпоинт проходил бы каждые 50 мб измененных данных(10 чекпоинтов на 1 redo 500 Мб) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.07.2017, 13:28 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
landy, я бы поставил mttr target, и обнулил log_checkpoint*, чтоб oracle сам думал, когда и что надо. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.07.2017, 13:34 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
chkplandy, я бы поставил mttr target, и обнулил log_checkpoint*, чтоб oracle сам думал, когда и что надо. FAST_START_MTTR_TARGET ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.07.2017, 13:37 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
Alionaпроходил мимо...Bfink, Осталось понять, что так сильно держало чекпоинт, что вы воспринимали это как останов работы. Виртуальный сервер? Датафайлы на файловой системе? Или на RAID5? Или просто сторадж занят чем-то ещё? Вариантов масса... У меня чекпоинт держится тяжёлым джобом пару часов. Виртуальный сервер Датафайлы на файловой системе Сторадж занят почти на 100 %. Что в таком случае надо сделать? Купить новый сторадж? В вашем случае - забить. Вам же и так эта базейка не нужна... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.07.2017, 09:35 |
|
||
|
Контроль групп Redo
|
|||
|---|---|---|---|
|
#18+
проходил мимо...Alionaпропущено... У меня чекпоинт держится тяжёлым джобом пару часов. Виртуальный сервер Датафайлы на файловой системе Сторадж занят почти на 100 %. Что в таком случае надо сделать? Купить новый сторадж? В вашем случае - забить. Вам же и так эта базейка не нужна... Не поняла, поясните, плииз. В моём случае: программер исправил джоб, теперь он не задерживает чекпоит. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.07.2017, 13:08 |
|
||
|
|

start [/forum/topic.php?all=1&fid=52&tid=1885578]: |
0ms |
get settings: |
12ms |
get forum list: |
19ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
162ms |
get topic data: |
9ms |
get forum data: |
2ms |
get page messages: |
84ms |
get tp. blocked users: |
2ms |
| others: | 229ms |
| total: | 525ms |

| 0 / 0 |
