|
|
|
Среднее время чтения диска очень просело
|
|||
|---|---|---|---|
|
#18+
Все джобы работают медленно с какого-то момента. Анализ показывает, что планы запросов не изменилось, степень их параллельности то же. В запросах выросла доля ожиданий IO ( а доля CPU соответсвенно уменьшилась). AWR репорт показывает то же самое на уровне всей базы. Например сравнение двух снапшотов - нормального и не очень: 1st2ndEventWait ClassWaitsTime(s)Avg Time(ms)%DB timeEventWait ClassWaitsTime(s)Avg Time(ms)%DB timeCPU time67 921.3455.93CPU time49 482.9040.59db file sequential readUser I/O6 196 66118 031.612.9114.85db file sequential readUser I/O3 909 75623 413.415.9919.2db file scattered readUser I/O5 591 37510 984.861.969.05direct path read tempUser I/O2 196 56622 016.7710.0218.06direct path read tempUser I/O3 216 7949 723.773.028.01direct path readUser I/O477 69212 445.2926.0510.21direct path readUser I/O1 115 1578 786.627.887.23db file scattered readUser I/O2 300 32510 065.564.388.26enq: TM - contentionApplication7245 430.267 500.354.47enq: TM - contentionApplication7109 482.2713 355.317.78read by other sessionUser I/O1 159 9353 199.692.762.63PX Deq: Slave Session StatsOther3 116 8141 721.350.551.41PX Deq: Slave Session StatsOther3 110 5411 581.440.511.3SQL*Net more data from clientNetwork595 976876.591.470.72cursor: pin S wait on XConcurrency2 2431 432.55638.681.18read by other sessionUser I/O130 773694.065.310.57SQL*Net more data from clientNetwork727 548814.991.120.67Log archive I/OSystem I/O229 640338.671.470.28-Log archive I/OSystem I/O219 112268.371.220.22-cursor: pin S wait on XConcurrency879282.58321.480.23 Как видим среднее время случайного чтения выросоло с 2ms до 4, последовательного - с 3 до 6. На самом деле если построить график по dba_hist_event_histogram видно как оно даже потихоньку увеличивается. Инфраструктурщики не видят проблемы и только отпинываются что все нормально. Когда среднее время одноблочных и многоблочных чтений достигло 10ms, мы перезагрузили хост и инстанс - и, внезапно это помогло. снова вернулось в норму....но буквально на пару дней. Сейчас я вижу что оно снова начинает расти. Кто-нибудь сталкивался с таким случаем, куда копать, и как доказать инфраструктурщикам что проблема не в базе, не в ее нагрузке или планах? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.01.2018, 20:25 |
|
||
|
Среднее время чтения диска очень просело
|
|||
|---|---|---|---|
|
#18+
ValergradКогда среднее время одноблочных и многоблочных чтений достигло 10ms, мы перезагрузили хост и инстанс - и, внезапно это помогло. снова вернулось в норму....но буквально на пару дней. AWR когда плохо помог бы. Какая ОС? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.01.2018, 20:41 |
|
||
|
Среднее время чтения диска очень просело
|
|||
|---|---|---|---|
|
#18+
смотреть надо не среднее, а гистограммы. Там в AWR отчете они дальше есть и по датафайлам и по ожиданиям ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.01.2018, 20:44 |
|
||
|
Среднее время чтения диска очень просело
|
|||
|---|---|---|---|
|
#18+
"Cмотреть надо не среднее, а гистограммы. Там в AWR отчете они дальше есть и по датафайлам и по ожиданиям" Так я ж говорю - я смотрел гистограммы. Там на них видно что дело не в том, что есть небольшое количество длительных вэйтов, а что в среднем вейты просели. Т.е. в нормальный день - 80-90% укладывается в 1ms, а в "плохой" - 30-40%, еще 30-40% - в 2 ms, ну и далее потихоньку падает. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.01.2018, 21:15 |
|
||
|
Среднее время чтения диска очень просело
|
|||
|---|---|---|---|
|
#18+
Наличие свопа смотрел в dba_hist_osstat - его там нет. SGA, PGA в норме - не растут. OS там UNIX. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.01.2018, 21:18 |
|
||
|
Среднее время чтения диска очень просело
|
|||
|---|---|---|---|
|
#18+
ValergradТ.е. в нормальный день - 80-90% укладывается в 1ms, OS там UNIX. ну я чего и пишу. 90% за 1ms это нормально только с хорошей дисковой на флешках, во всех остальных случаях на Unix как бы говорит, что directio забыли включить ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.01.2018, 22:01 |
|
||
|
Среднее время чтения диска очень просело
|
|||
|---|---|---|---|
|
#18+
директ IO и своппинг, можно поподробней, боюсь я не понял? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.01.2018, 22:49 |
|
||
|
Среднее время чтения диска очень просело
|
|||
|---|---|---|---|
|
#18+
filesystemio_options = none disk_asynch_io = TRUE Что важно, они не менялись, т.е. были такие же и когда база работала прилично. На OS уровне не могу проверить, нет доступа туда ( можно ли как-то проверить из базы? ) Тем не менее можно написать такой запрос: Код: plsql 1. 2. 3. 4. 5. 6. 7. 8. 9. Он показывает что 3-5% чтений в каждом снапшоте direct. Если я вообще правильно понял, о чем мы разговариваем. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.01.2018, 23:21 |
|
||
|
Среднее время чтения диска очень просело
|
|||
|---|---|---|---|
|
#18+
Valergrad, я бы наложила друг на друга графики общего количества логических чтений, вдруг вы не заметили какое-то увеличение пользовательской активности, график физических чтений включая direct, на случай если кэш стал хуже кэшировать, график только direct чтений и только direct записи, поскольку они могут существенно влиять на отклик дисковой подсистемы, график физических записей, может что-то контрольную точку стало стимулировать, ну и ваш график времени отклика одноблочного чтения Что-то да наверняка вылезет ) ну или какой кэш на дисковом массиве сдох ))) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.01.2018, 01:45 |
|
||
|
Среднее время чтения диска очень просело
|
|||
|---|---|---|---|
|
#18+
Valergradи только отпинываются что все нормально.отпинываются словами, не приводя своих статистик? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.01.2018, 02:04 |
|
||
|
Среднее время чтения диска очень просело
|
|||
|---|---|---|---|
|
#18+
DВАну или какой кэш на дисковом массиве сдох ))) а перезагрузка хоста оживила его на пару дней ) У меня ощущение что файлы БД кэшируются на уровне ОС. А в один прекрасный момент этот кэш засирается и все становится плохо. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.01.2018, 02:06 |
|
||
|
Среднее время чтения диска очень просело
|
|||
|---|---|---|---|
|
#18+
xtender, пока да. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.01.2018, 10:08 |
|
||
|
Среднее время чтения диска очень просело
|
|||
|---|---|---|---|
|
#18+
Проблемы уровня ОС, скорее всего. Не забывайте, что disk I/O - это не только чтение с диска, но и в память. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.01.2018, 10:31 |
|
||
|
Среднее время чтения диска очень просело
|
|||
|---|---|---|---|
|
#18+
Нужно примерно понять какое железо стоит, какой массив (если он есть). На уровне ОС Unix посмотреть iostat в динамике. Проверить кол. свободного места. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.01.2018, 10:32 |
|
||
|
Среднее время чтения диска очень просело
|
|||
|---|---|---|---|
|
#18+
х.з.DВАну или какой кэш на дисковом массиве сдох ))) а перезагрузка хоста оживила его на пару дней ) У меня ощущение что файлы БД кэшируются на уровне ОС. А в один прекрасный момент этот кэш засирается и все становится плохо. Ммм... Update: у нас ASM. Так что filesystemio_options игнорируется по идее и читается напрямую, без OS кэша. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.01.2018, 10:36 |
|
||
|
|

start [/forum/topic.php?fid=52&msg=39584719&tid=1884587]: |
0ms |
get settings: |
5ms |
get forum list: |
15ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
38ms |
get topic data: |
12ms |
get forum data: |
2ms |
get page messages: |
69ms |
get tp. blocked users: |
1ms |
| others: | 234ms |
| total: | 382ms |

| 0 / 0 |
