|
Подает HDR. Не могу понять причину.
|
|||
---|---|---|---|
#18+
vasilis, vasilisсами читаете, разбираетесь, пробуете, задаете внятные вопросы и также сами отвечаете. А как иначе? Проблема ведь у меня возникла )) И на паблик форуме никто никому ничего не должен. Так что это с вами работать приятно) vasilisПроверьте, на самом ли деле работает write-back. Совсем не давно тут рассматривалась проблема падения производительности из-за автоматического отключения кэширования на запись. Проверил, работает. Сделал простой тест на запись с работающим, а затем отключенным кэшем. В 1 поток. Объем данных сопоставим с объемом грязных страниц в буферах в момент КТ. Размер блока 2к и 4М для сравнения (просто не знаю, блоком какого размера IDS пишет на диск. Возможно, pagesize?). Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33.
Для bs=2k без кэша совсем грустно). А для 4М разницы между вкл/выкл кэша просто нет. vasilisPHYSFILE 16500000 Зачем такой огромный? Ведь обслуживать такой файл и искать там нужную точку тоже нужно время. В моей жизни 1-2Гб хватало даже в самых нагруженных системах, но на истину не претендую Да, это я дал маху. Ориентировался на суммарный объем буферов. Совсем не учел, что в моем случае изменению подлежит лишь малая их часть. Уменьшил до 2 Гб. Посмотрим, каков будет результат. vasilis AUTO_AIOVPS 1 Тоже отключил бы и, помониторив, установил бы ручками. Я не знаю логики работы этого автомата, но обычно они все заточены под некие очень стандартные и условные параметры. Знающий человек почти всегда сделает лучше. Следующим шагом отключу и буду «руками» изменять. vasilis RESIDENT 0 рекомендую 1 или 2. Изменил на 1. vasilisCKPTINTVL 150 А зачем уменьшали диапазон ? Это меньше 3-х минут. Установите стандартные 300, а я бы даже и увеличил до 600.[quote] Когда не работали LRU, сократил время, чтобы суммарный объем грязных страниц был меньше. Сейчас вернул в 300. [quote vasilis]AUTO_CKPTS 1 тоже самое, что я уже писал по поводу "автоматов" Выключил vasilisTAPEDEV /dev/null LTAPEDEV /dev/null А это как понять ? У вас разве не промсистема ? Надеюсь, что это тестовая. Куда пишутся архивы - на диск или ленту? если на диски, то блок можно увеличивать - в нашем ФАК-е помнится были исследования на эту тему... Пишу на диски. Использую STDIO. Очень удобно. Вот, может пригодится кому: Бекап ontape -s -L 0 -t STDIO | gzip -1 > /back/full_backup.gz gzip сжимает где-то в 10 раз. Процессора почти не ест (т.к. ключ -1). Восстановление zcat /back/full_backup.gz | ontape -r -t STDIO И самое приятное, чтобы не прыгать с ленточкой по серверной, поднятие репликации по сети без файлов и лент: На primary делаем скрипт /back/stdio_back.sh # set IDS ENV ontape -s -L 0 -t STDIO На secondary запускаем ssh primary “/back/stdio_back.sh" | gunzip | ontape -p -t STDIO Ну и все, дальше onmode’ом переключаемся в primary/secondary. По сети перегоняется сжатый бекап. Одновременно работает как бекап так и восстановление, что положительно сказывается на времени работы. (Когда в этом топике я пишу, что делаю ontape, значит я делаю ontape –s –L 0 –t STDIO | cat > /dev/null. Это чтобы исключить влияние gzip’а и записи файла с бекапом на диск) По-моему только в 11ом появилось STDIO. vasilisDS_NONPDQ_QUERY_MEM 128 Однозначно увеличить, хотя бы до 5М - это позволит увеличить память для сортировок Увеличил до 10 М. Заодно пришлось увеличить и DS_TOTAL_MEMORY до 60М. Было по дефолту меньше 1М. vasilisBUFFERPOOL size=2K,buffers=4000000,lrus=256,lru_min_dirty=0.100000,lru_max_dirty=0.300000 BUFFERPOOL size=8K,buffers=1500000,lrus=256,lru_min_dirty=0.500000,lru_max_dirty=1.000000 Такие огромные пулы требуюти больших расходов на свое обслуживание. Надо тщательно помониторить процент кэширования и поиграться с размерами - вполне возможно, что ваша активная часть БД поместится и в значительно меньшем объеме. Тогда будет однозначный плюс для КТ. + Я бы установил еще большее количество очередей (мне кажется в 11.5 можно больше 256?) для таких огромных пулов, а также попробовал бы не так сильно уменьшать "окно" сброса, т.е. установил бы для начала на уровне 5 и 2% или даже 10 и 5. Уменьшил в 2 раза кол-во буферов и увеличил LRU до 500. В моей версии максимум 512. Теперь буфера выглядят так: BUFFERPOOL default,buffers=10000,lrus=8,lru_min_dirty=50.000000,lru_max_dirty=60.500000 BUFFERPOOL size=2K,buffers=2000000,lrus=500,lru_min_dirty=0.400000,lru_max_dirty=1.200000 BUFFERPOOL size=8K,buffers=750000,lrus=500,lru_min_dirty=2.000000,lru_max_dirty=4.000000 vasilisБуфер сбрасывается в журнал целиком, а в среднем там меньше двух страниц, при размере буфера в 16 2К-страниц. Т.е. буфера переключаются слишком быстро и не успевают сбрасываться на диск (это если рассматривать ситуацию, описанную В.К.). Если будет буферизация, то буфер будет сбрасываться только после заполнения, (т.е. преключения будут более редки) т.о. давая время на сброс двум другим буферам. Спасибо, буду пробовать изменять размер буфера. Статистику (profile_ из DBA_Tools) выложу, как только соберу ... |
|||
:
Нравится:
Не нравится:
|
|||
08.01.2010, 14:55 |
|
Подает HDR. Не могу понять причину.
|
|||
---|---|---|---|
#18+
АнатоЛойTo IDS Admin: посмотри результаты (и нам покажи для общего развития) Код: plaintext 1. 2. 3.
Вот только в syscheckpoint последние 20 чекпоинтов от текущего момента, поэтому попробуй выполнить запрос несколько раз с таким перерывом, чтобы попали все чекпоинты за интервал съёма статистики. Спасибо, очень удобно. Вот, для моего последнего конфига данные для нескольких "плохих" КТ: Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
Нагрузка на БД равномерная, включил ontape сразу после КТ 7872. Время выросло с 4х до 12-16 сек (( (При одинаковом кол-ве грязных страниц ) ... |
|||
:
Нравится:
Не нравится:
|
|||
08.01.2010, 15:05 |
|
Подает HDR. Не могу понять причину.
|
|||
---|---|---|---|
#18+
DaugavaЯ не удивлюсь, если окажется, что к длинному чекпоинту приводит как раз ontape и опять проявился старый баг "OLD PAGES BACKUP", ибо я не верю в то, что он до конца побежден. 2006-й год Спасибо, буду копать в этом направлении ... |
|||
:
Нравится:
Не нравится:
|
|||
08.01.2010, 15:05 |
|
Подает HDR. Не могу понять причину.
|
|||
---|---|---|---|
#18+
А можно поинтересоваться, почему Вы так привязались к контрольной точке. Ведь, начиная с версии 11 реализован неблокирующий механизм контрольных точек. И, судя по сообщениям топик-стартера, проблем с производительностью у него не было до тех пор, пока он не стал тюнинговать сервер:) ... |
|||
:
Нравится:
Не нравится:
|
|||
08.01.2010, 22:23 |
|
Подает HDR. Не могу понять причину.
|
|||
---|---|---|---|
#18+
IDS Admin Пишу на диски. Использую STDIO. Очень удобно. Вот, может пригодится кому: Бекап ontape -s -L 0 -t STDIO | gzip -1 > /back/full_backup.gz gzip сжимает где-то в 10 раз. Процессора почти не ест (т.к. ключ -1). Восстановление zcat /back/full_backup.gz | ontape -r -t STDIO И самое приятное, чтобы не прыгать с ленточкой по серверной, поднятие репликации по сети без файлов и лент: На primary делаем скрипт /back/stdio_back.sh # set IDS ENV ontape -s -L 0 -t STDIO На secondary запускаем ssh primary “/back/stdio_back.sh" | gunzip | ontape -p -t STDIO Ну и все, дальше onmode’ом переключаемся в primary/secondary. По сети перегоняется сжатый бекап. Одновременно работает как бекап так и восстановление, что положительно сказывается на времени работы. Спасибо за конкретные примеры - дополню FAQ, а то он уже давненько не обновлялся на эту тему IDS Admin По-моему только в 11ом появилось STDIO. начиная с версии IDS 10.00.xC3 утилита ontape может использовать Standard I/O ... |
|||
:
Нравится:
Не нравится:
|
|||
10.01.2010, 13:20 |
|
Подает HDR. Не могу понять причину.
|
|||
---|---|---|---|
#18+
victor16А можно поинтересоваться, почему Вы так привязались к контрольной точке. Ведь, начиная с версии 11 реализован неблокирующий механизм контрольных точек. И, судя по сообщениям топик-стартера, проблем с производительностью у него не было до тех пор, пока он не стал тюнинговать сервер:) Если начать читать с первого сообщения ТС то можно увидеть, что начали обсуждать падения HDR , которые возникли при длинных КТ на первичке. Т.е. КТ все таки не совсем безобидные. А так проблем с производительностью, действительно не было, по крайней мере, их не озвучивали. ... |
|||
:
Нравится:
Не нравится:
|
|||
10.01.2010, 14:24 |
|
Подает HDR. Не могу понять причину.
|
|||
---|---|---|---|
#18+
Производительность упала потому ИМХО, что грязные буфера сбрасываются на диск все время, а не только во время КТ. Посмотреть можно: onstat -F ... |
|||
:
Нравится:
Не нравится:
|
|||
11.01.2010, 10:58 |
|
Подает HDR. Не могу понять причину.
|
|||
---|---|---|---|
#18+
klepaПроизводительность упала потому ИМХО, что грязные буфера сбрасываются на диск все время, а не только во время КТ. Посмотреть можно: onstat -Fа как сброс влияет на производительность? Сессии не ждут записи на диск грязных буферов. ... |
|||
:
Нравится:
Не нравится:
|
|||
11.01.2010, 11:27 |
|
Подает HDR. Не могу понять причину.
|
|||
---|---|---|---|
#18+
Журавлев ДенисklepaПроизводительность упала потому ИМХО, что грязные буфера сбрасываются на диск все время, а не только во время КТ. Посмотреть можно: onstat -Fа как сброс влияет на производительность? Сессии не ждут записи на диск грязных буферов. Что влияет - однозначно: появляются дополнительная нагрузка на диск. Вопрос только в том, насколько большая нагрузка и как долго это длится. ... |
|||
:
Нравится:
Не нравится:
|
|||
11.01.2010, 11:52 |
|
Подает HDR. Не могу понять причину.
|
|||
---|---|---|---|
#18+
АнатоЛойЖуравлев ДенисklepaПроизводительность упала потому ИМХО, что грязные буфера сбрасываются на диск все время, а не только во время КТ. Посмотреть можно: onstat -Fа как сброс влияет на производительность? Сессии не ждут записи на диск грязных буферов. Что влияет - однозначно: появляются дополнительная нагрузка на диск. Вопрос только в том, насколько большая нагрузка и как долго это длится.косвенно, копейки, получается просто запись размазанная во времени, и добавляются перезаписи которые исчезли бы объединением (но мало). ... |
|||
:
Нравится:
Не нравится:
|
|||
11.01.2010, 11:56 |
|
Подает HDR. Не могу понять причину.
|
|||
---|---|---|---|
#18+
Журавлев ДенисАнатоЛойЖуравлев ДенисklepaПроизводительность упала потому ИМХО, что грязные буфера сбрасываются на диск все время, а не только во время КТ. Посмотреть можно: onstat -Fа как сброс влияет на производительность? Сессии не ждут записи на диск грязных буферов. Что влияет - однозначно: появляются дополнительная нагрузка на диск. Вопрос только в том, насколько большая нагрузка и как долго это длится.косвенно, копейки, получается просто запись размазанная во времени, и добавляются перезаписи которые исчезли бы объединением (но мало). Сколько копеек покажет onstat -F Whether buffer flushing occurs as part of an LRU write or a Chunk Write should be based on the nature of the system. LRU writes do not block the system, but are random in nature. Chunk Writes block the system, but are sequential in nature and tend to be more efficient for large writes. It is therefore preferable to have LRU writes occuring in a production system for normal operations and Chunk Writes for loads. ... |
|||
:
Нравится:
Не нравится:
|
|||
11.01.2010, 12:33 |
|
Подает HDR. Не могу понять причину.
|
|||
---|---|---|---|
#18+
klepaСколько копеек покажет onstat -F Whether buffer flushing occurs as part of an LRU write or a Chunk Write should be based on the nature of the system. LRU writes do not block the system, but are random in nature. Chunk Writes block the system, but are sequential in nature and tend to be more efficient for large writes. It is therefore preferable to have LRU writes occuring in a production system for normal operations and Chunk Writes for loads.Где тут про производительность? Пользователям по барабану насколько эффективно используется диск. ... |
|||
:
Нравится:
Не нравится:
|
|||
11.01.2010, 12:37 |
|
Подает HDR. Не могу понять причину.
|
|||
---|---|---|---|
#18+
Всем спасибо. Немного подытожу. 1) Причины падения репликации в самом начале топика выяснены: длительная (хоть и неблокирующая ) КТ, превышающая по длительности DRTIMEOUT. 2) Баг "OLD PAGES BACKUP" не проявился. 3) Настройка LRU CLEANERS на более "агрессивную" работу положительно сказалась на OLTP. Общая нагрузка на диск возросла незначительно (судя по sar -d за одинаковые периоды с равномерной нагрузкой), зато стала более "ровной". 4) В момент работы неблокирующей КТ никаких блокировок не происходит. Зато блокировка случается сразу после КТ :) Блокируются все транзакции с момента окончания КТ на Primary до момента окончания КТ на Secondary при включенном async HDR. Лучше я создам отдельный топик, т.к. сильно отошел от начальной темы. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.01.2010, 14:38 |
|
|
start [/forum/topic.php?fid=44&msg=36400589&tid=1607639]: |
0ms |
get settings: |
9ms |
get forum list: |
14ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
48ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
54ms |
get tp. blocked users: |
1ms |
others: | 14ms |
total: | 160ms |
0 / 0 |