|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
Добрый день! Столкнулся с проблемой - блокируется исполнение транзакций в БД. Проявляется только при включенной репликации. Система OLTP. 100-200 запросов в секунду. (insert + Update/delete/select по ключу) Их генерируют ~10 одновременных пользовательских процессов. Поднята асинхронная репликация типа HDR (Системы одинаковые). В один прекрасный момент: 1) На Primary сервере начинается КТ. 2) КТ на Primary заканчивается (судя по online.log). Начинается блокировка пользовательских транзакций. Все "встает". 3) Запись о КТ передается на Secondary. На это уходит ~10 секунд (!!!). Все это время висит блокировка. 4) На Secondary сервере начинается КТ. 5) На Secondary сервере заканчивается КТ. Все "отмерзает". Транзакции продолжают обрабатываться. Только пользовательскому софту уже все равно, т.к. превышено максимальное время обработки ((. Только я обрадoвался механизму неблокирующих КТ - столкнулся с этой проблемой. В моем примере блокировка длилась 14 секунд. Хотя на flush ушло только 2.7 секунды. Не могу понять, на что уходят эти 14 секунд. Буду рад любым комментариям. Пока даже не представляю, в каком направлении смотреть. Ниже некоторая информация. Спасибо online.log на Primary Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31.
online.log на Secondary Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31.
конфигурация HDR Код: plaintext 1. 2. 3. 4. 5. 6. 7.
onstat -g dri Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
syscheckpoint на Primary (спасибо за совет в соседнем треде) Код: plaintext 1. 2. 3. 4. 5.
Блокировка началась в 11:07:37:17 , закончилась в 11:07:51:52 . ... |
|||
:
Нравится:
Не нравится:
|
|||
01.02.2010, 13:07 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
Можно посмотреть onstat -g ckp ... |
|||
:
Нравится:
Не нравится:
|
|||
01.02.2010, 14:14 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
У вас точно используются неблокирующие КТ? узнать это можно посмотрев вывод onstat -g ckp И по вашему логу primary видно например вот это (выделено жирным) что косвенно говорит что возможно транзакции блокируются: 10:57:02 Checkpoint Completed: duration was 3 seconds. 10:57:02 Wed Jan 27 - loguniq 268, logpos 0x1c86e018, timestamp: 0x2fc62006 Interval: 562 10:57:02 Maximum server connections 46 10:57:02 Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 6 , Plog used 200332, Llog used 96451 11:02:20 Checkpoint Completed: duration was 2 seconds. 11:02:20 Wed Jan 27 - loguniq 268, logpos 0x3932a018, timestamp: 0x2fd4fcfd Interval: 563 11:02:20 Maximum server connections 46 11:02:20 Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 2 , Plog used 239170, Llog used 118297 11:03:10 Logical Log 268 Complete, timestamp: 0x2fd71827. 11:07:37 Checkpoint Completed: duration was 2 seconds. 11:07:37 Wed Jan 27 - loguniq 269, logpos 0x1b6fd018, timestamp: 0x2fe4b8ea Interval: 564 11:07:37 Maximum server connections 47 11:07:37 Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 1 , Plog used 239816, Llog used 128964 ... И как вариант, посмотрите что с сетью между primary и secondary. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.02.2010, 10:42 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
по поводу 14 сек это токо я не увидел по логу? если тормозит HDR при к.т. то вполне возможно что у вас проблема на HDR сжелезом нет, не в том плане что там что-то поломалось, а в том, что оно медленнее Чтоб там не говорили, а на HDR должны быть: 1. дискавая система аналогичная основному обратите внимание на работу с физ. журналом 2. быстрый проц (не количество, а именно быстрый/мощный) ... |
|||
:
Нравится:
Не нравится:
|
|||
03.02.2010, 21:19 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
IDS Admin Блокировка началась в 11:07:37:17 , закончилась в 11:07:51:52 . И точно - откуда "цифры"? ... |
|||
:
Нравится:
Не нравится:
|
|||
04.02.2010, 22:13 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
АнатоЛой, zaiets, И точно - откуда "цифры"? Цифра из лога приложения. 14 секунд - это фактическое время блокировки. Приложение работает в несколько потоков. Все они "замерзают" на операции insert, либо update. В логи приложения попадает время начала insert/update и время окончания. Судя по этим логам, блокировка длилась ровно 14 секунд. В обычном режиме на каждую такую транзакцию уходит менее 10 мс. С сетью все в порядке. Там всего 3 машины (приложения, IDS Primary, IDS Secondary). Гигабитная циска. С дисками тоже все хорошо. Одинаковые массивы, контроллеры, диски. Вот на скорую руку тест на запись для обоих серверов, когда нет нагрузки: Primary Код: plaintext 1. 2. 3.
Secondary Код: plaintext 1. 2. 3.
Еще один пример такой блокировки: Primary onstat -g ckp Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30.
online.log Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16.
Secondary onstat -g ckp Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31.
online.log Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18.
начало пользовательской транзакции 09:27:38:98 оконячание пользовательской транзакции 09:27:47:82. Почему КТ на Secondary начинается спустя 8 секунд после начала КТ на Primary? Чем вообще сервер занят в это время? У меня пока только одно предположение: Secondary при большой нагрузке всегда "отстает" от Primary (еще не обработал последние записи в логическом журнале). А во время КТ Secondary должен "догнать" Primary, чем он и занимается, блокируя мои транзакции. Попробую уменьшить DRINTERVAL чтоли... ... |
|||
:
Нравится:
Не нравится:
|
|||
05.02.2010, 10:49 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
а чего нити ожидают в проблемный момент? Как рассказывал саппорт, при асинхронной репликации не все так просто, обещали включить описание в документацию. IC65029 IDS 11.50 DOCUMENTATION CONTAINS LIMITED INFORMATION ON THE TRANSFER OF HDR LOGICAL LOG BUFFERS но, вы все оцениваете с позиции прикладного ПО то что время к.т. на серверах разное, может также говорить и о расхождении времени на серверах. при отстуствии нагрузки или при минимальной нагрузке - толже 8 сек. расхождения? чтобы со 100% вероятностью утверждать, что виновата к.т. - нужно состояние нитей на момент проблемы. хотя, судя по статистике, не так и много здесь людей с вашей транзакционной активностью Бывают ли у вас в процессе работы нити в состоянии G как много и как часто? описанные вами 14 сек могут быть вызваны, снова же - вполне возможно, не самой к.т., а очередью, которая создалась после к.т. по блокировкам. Если, допустим, выполнять к.т. вручную раз в 1 минуту - теже задержки или нет? В каком логгируемом состоянии у вас БД? какие: PHYSBUFF LOGBUFF BUFFERPOOL AUTO_LRU_TUNING ON_RECVRY_THREADS OFF_RECVRY_THREADS в DBSPACETEMP - перечислены только временные? Если у вас проблема всетаки в Информиксе- ваш случай интересный. Можно в принципе и более тесно пообщаться в аське (zaiets 5..) ... |
|||
:
Нравится:
Не нравится:
|
|||
05.02.2010, 19:41 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
Я бы предложил: - поскольку гигабитная сетка сделать таки репликацию синхронной (DRINTERVAL -1) - проверить системное время на обоих серваках, мы для этой цели используем ntpd - хоть в предыдущей ветке и не советовали (там советы больше касаются 9-ой версии), установить AUTO_CKPTS=1 и RTO_SERVER_RESTART=60. Это заставит LRU быть более агрессивным. Правда, возможно, потребуются дополнительные настройки параметров журналов. - проверить таки целесообразность большого буферного пула командой onstat -P. Если величина поля other большая, то однозначно лучше уменьшить буферный пул, а освободившуюся память отдать под словарный кэш (DD_HASHSIZE и DD_HASHMAX) и кэш распределения данных (DS_HASHSIZE и DS_HASHMAX). У Вас установлены значения по умолчанию, они очень маленькие (см. Perfomance Guide). - что касается bufwaits, можно воспользоваться небольшой утилиткой: Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26.
- не совсем в тему, но крайне не рекомендую переходить на FC6, даже W1, Вам лучше проапгрейдится до FC5W4, на мой взгляд самая стабильная версия из читы. С уважением, Виктор ... |
|||
:
Нравится:
Не нравится:
|
|||
06.02.2010, 10:16 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
чем-то закончилась история? ... |
|||
:
Нравится:
Не нравится:
|
|||
15.02.2010, 16:55 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
victor16 - хоть в предыдущей ветке и не советовали (там советы больше касаются 9-ой версии), установить AUTO_CKPTS=1 и RTO_SERVER_RESTART=60. Это заставит LRU быть более агрессивным. Так ведь до этого и было "на автомате" и никакой "агрессивности" не проявлялось victor16 Если коэффициент bufwaits находится в пределах 2-7, то с большой долей вероятности можно сказать, что буферный пул настроен правильно. Меньше двух - уменьшать, больше 10 - увеличивать (с оговорками). Помнится, кто-то из зубров UCDI писал. что "Anything over 7% is slow and over 10% is death". Я правильно понял, что это рекомендации "в общем", а не для конкретной системы ? Тогда зачем уменьшать пул если bufwaits < 2 , особенно если нет проблем с КТ ? На мелких и средних системах bufwaits обычно и равен 0 без больших размеров пула и уменьшать там его вовсе незачем. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.02.2010, 18:06 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
zaietsчем-то закончилась история? Пока пауза, т.к. нет доступа к серверам... Позже продолжу и обязательно отпишу. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.02.2010, 18:40 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
vasilisvictor16 - хоть в предыдущей ветке и не советовали (там советы больше касаются 9-ой версии), установить AUTO_CKPTS=1 и RTO_SERVER_RESTART=60. Это заставит LRU быть более агрессивным. Так ведь до этого и было "на автомате" и никакой "агрессивности" не проявлялось [/quot] В предыдущих версиях IDS инициировать контрольную точку могут следующие четыре условия: Административные события, например: архивирование, добавление пространства базы данных(dbspace), начальная загрузка или выключение сервера и т.д. 75-процентное заполнение физического журнала. Наличие всего одной контрольной точки в пространстве логического журнала (сервер IDS не может перезаписать логический журнал, содержащий текущую контрольную точку, поэтому IDS сначала инициирует контрольную точку и лишь затем перемещает данные в этот логический журнал). Активированный конфигурационный параметр CKPTINTVL в файле ONCONFIG В версии IDS Version 11.10 появилась новая функция, которая позволяет серверу IDS автоматически переключать контрольные точки. При активированном конфигурационном параметре RTO_SERVER_RESTART сервер IDS сопоставляет показатели прошлого быстрого восстановления с текущей транзакционной активностью и на этом основании автоматически инициирует контрольные точки с целью соблюдения обеих политик – политики RTO_SERVER_RESTART и политики прогнозируемого времени отклика транзакций. Поэтому параметр AUTO_CKPTS, хоть и был включен, но не работал, поскольку RTO_SERVER_RESTART не был активирован. vasilisvictor16Если коэффициент bufwaits находится в пределах 2-7, то с большой долей вероятности можно сказать, что буферный пул настроен правильно. Меньше двух - уменьшать, больше 10 - увеличивать (с оговорками). Помнится, кто-то из зубров UCDI писал. что "Anything over 7% is slow and over 10% is death". Я правильно понял, что это рекомендации "в общем", а не для конкретной системы ? Тогда зачем уменьшать пул если bufwaits < 2 , особенно если нет проблем с КТ ? На мелких и средних системах bufwaits обычно и равен 0 без больших размеров пула и уменьшать там его вовсе незачем. В реальных системах показатель bufwaits никогда не равен нулю, тем не менее надо стремится к его минимизации. На самом деле, внимание надо обращать не на сам показатель bufwaits, а его отношение (bufwaits ratio) к сумме pagreads+bufwrits (см. выше пример на awk), поскольку эти операции блокируют LRU-очереди и чаще всего приводят к увеличению bufwaits. Для более точного анализа нужен вывод команды onstat -P. Показатель other показывает количество неиспользуемых страниц буферного пула. И если этот показатель больше 5% вкупе с bufwaits ratio<2%, однозначно надо уменьшать буферный пул. Хоть механизм контрольной точки в 11 версии и является неблокирующим, тем не менее при большом буферном пуле производительность в этот момент резко падает. В этом случае, более эффективным решением будет отдать память под словарный кэш, кэш распределения данных, кэш хранимых процедур и кэш sql-запросов. С уважением, Виктор ... |
|||
:
Нравится:
Не нравится:
|
|||
15.02.2010, 22:53 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
vasilis Помнится, кто-то из зубров UCDI писал. что "Anything over 7% is slow and over 10% is death". Справедливости ради, англоязычные зубры водились и до сих пор бродят по CDI . В UCDI похоже даже спамеры забыли дорогу и подобной дискуссии я там не помню. ... |
|||
:
Нравится:
Не нравится:
|
|||
16.02.2010, 09:31 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
zaietsа чего нити ожидают в проблемный момент? ... чтобы со 100% вероятностью утверждать, что виновата к.т. - нужно состояние нитей на момент проблемы. Чуть позже скину результат onstat-u в проблемный момент. Только что запустил "мониторинг". zaiets но, вы все оцениваете с позиции прикладного ПО то что время к.т. на серверах разное, может также говорить и о расхождении времени на серверах. при отстуствии нагрузки или при минимальной нагрузке - толже 8 сек. расхождения? Время синхронизируется с одних и тех же NTP серверов. Проверял несколько раз - время одинаковое на Primary и Seсondary. Повторюсь: железо одинаковое абсолютно. Драйвера, прошивки в том числе. zaiets В каком логгируемом состоянии у вас БД? какие: PHYSBUFF LOGBUFF BUFFERPOOL AUTO_LRU_TUNING ON_RECVRY_THREADS OFF_RECVRY_THREADS в DBSPACETEMP - перечислены только временные? - Unbuffered logging Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
Да, в DBSPACETEMP только временные DBS (flags 'N TB') vasilis ранее уже любезно советовал изменить размер физ. журнала. Уменьшали до 2ГБ, жили пару дней, изменений не заметили и вернули назад, т.к. вроде бы "хлеба не просит". Хотя, очень даже вероятно, не там смотрели результат изменения размера физ. журнала. В любом случае, его можно менять при включенной БД, чего не скажешь о BUFFERPOOL. ... |
|||
:
Нравится:
Не нравится:
|
|||
16.02.2010, 11:19 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
victor16Я бы предложил: - поскольку гигабитная сетка сделать таки репликацию синхронной (DRINTERVAL -1) Пробовал, сильно (примерно на 50-80%) увеличилось время работы одного из ежедневных процессов (удаление старых данных). Насколько я понимаю, это еще и следствие unbuff_logging victor16 - проверить таки целесообразность большого буферного пула командой onstat -P. Если величина поля other большая, то однозначно лучше уменьшить буферный пул В конце этого поста выложил onstat -p и onstat -P. victor16 , а освободившуюся память отдать под словарный кэш (DD_HASHSIZE и DD_HASHMAX) и кэш распределения данных (DS_HASHSIZE и DS_HASHMAX). У Вас установлены значения по умолчанию, они очень маленькие (см. Perfomance Guide). Спасибо, увеличил, как только прочел пост. victor16 - что касается bufwaits, можно воспользоваться небольшой утилиткой Вот результат ее работы, сервер неделю не обнулял статистику и работал в обычном режиме. Код: plaintext 1.
victor16 - не совсем в тему, но крайне не рекомендую переходить на FC6, даже W1, Вам лучше проапгрейдится до FC5W4, на мой взгляд самая стабильная версия из читы. Ок, будем ждать Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22.
Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56.
... |
|||
:
Нравится:
Не нравится:
|
|||
16.02.2010, 11:37 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
Если следовать рекомендациям, то буферный пул настроен верно, правда, с некоторым перекосом в сторону 2K страниц, поскольку основные операции по изменению данных ведутся в 8K страницах (total dirty=1611), 2K страницы используются только для чтения (total dirty=81). Тогда риторический вопрос: второй сервер с какой целью используется? Возможно ли распределить нагрузку между двумя серверами? ... |
|||
:
Нравится:
Не нравится:
|
|||
16.02.2010, 13:04 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
victor16Если следовать рекомендациям, то буферный пул настроен верно, правда, с некоторым перекосом в сторону 2K страниц, поскольку основные операции по изменению данных ведутся в 8K страницах (total dirty=1611), 2K страницы используются только для чтения (total dirty=81). Тогда риторический вопрос: второй сервер с какой целью используется? Возможно ли распределить нагрузку между двумя серверами? Ну, возможно, это был не самый удачный момент) Грязных страниц по 2к примерно в 7-8 раз меньше (по кол-ву), чем грязных страниц по 8к. Самые "тяжелые" вещи как раз в 8к лежат. Запросы INSERT / DELETE, порождаемые OLTP как раз по табличкам из 8ми килобайтных ДБС проходят. UPDATE по табличкам из 2х килобайтных ДБСов. Селекты и там и там в разнобой. Есть и по ПК запросы, и фулл-сканы. Второй сервер используется как горячий бекап. На самый черный день ) ... |
|||
:
Нравится:
Не нравится:
|
|||
16.02.2010, 14:01 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
В таком случае могу предложить два совершенно противоположных решения: 1) Дать права на запись второму серверу (UPDATABLE_SECONDARY>0) и распределить нагрузку между двумя серверами через Connection Manager. В этом случае предстоят дополнительные усилия по настройке и синхронизации, правда, овчинка выделки стоит, можно получить "dramatically improved perfomance", как обещает Perfomance Guide. 2) Сделать из второго сервера RSS и забыть про проблемы синхронизации контрольной точки. ... |
|||
:
Нравится:
Не нравится:
|
|||
16.02.2010, 14:46 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
Daugavavasilis Помнится, кто-то из зубров UCDI писал. что "Anything over 7% is slow and over 10% is death". Справедливости ради, англоязычные зубры водились и до сих пор бродят по CDI . В UCDI похоже даже спамеры забыли дорогу и подобной дискуссии я там не помню. Да, ты прав, буковка U была лишней :) ... |
|||
:
Нравится:
Не нравится:
|
|||
16.02.2010, 19:17 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
victor16 vasilis victor16Если коэффициент bufwaits находится в пределах 2-7, то с большой долей вероятности можно сказать, что буферный пул настроен правильно. Меньше двух - уменьшать, больше 10 - увеличивать (с оговорками). Помнится, кто-то из зубров UCDI писал. что "Anything over 7% is slow and over 10% is death". Я правильно понял, что это рекомендации "в общем", а не для конкретной системы ? Тогда зачем уменьшать пул если bufwaits < 2 , особенно если нет проблем с КТ ? На мелких и средних системах bufwaits обычно и равен 0 без больших размеров пула и уменьшать там его вовсе незачем. В реальных системах показатель bufwaits никогда не равен нулю... По вашему "реальные системы" это большие и всегда тяжело нагруженные? А мне кажется, что "реальные", это те промсистемы, которые реально встречаются в жизни, работают по много лет и на разных железках и поверьте, я их видел не одну сотню, от самых маленьких и слабо нагруженных (но тем не менеее, таких же реальных и нужных) до больших. Я ведь не зря спрашивал - ваши советы "в общем", для любой системы, или же для ТС и его системы ? Специфика все же остается и ее нужно упоминать. victor16 На самом деле, внимание надо обращать не на сам показатель bufwaits, а его отношение (bufwaits ratio) к сумме pagreads+bufwrits (см. выше пример на awk), Именно о коеффициенте речь выше и шла, надеюсь, что никто не воспринимал значения 2, 7 или 10 как абсолютные величины. victor16 И если этот показатель больше 5% вкупе с bufwaits ratio<2%, однозначно надо уменьшать буферный пул. Еще раз спрошу - зачем? (опять таки в контексте общих рекомендаций, а не конкретной системы ТС и в контексте того, что читают топик и другие админы совершенно разных систем). Если буферный пул и так маленький (всего 400-600М), bufwaits ratio =1%, проблем с КТ нет вообще - зачем уменьшать буферный пул в данном случае и доводить bufwaits ratio до 2 или 5% и создавать будущие проблемы производительности при регламентых задачах (ночных, месячных, квартальных...) для которых как раз и потребуется больший буферный пул ? Просто я уже представляю, как начитавшись таких рекомендаций и не имея большого и комплексного понимания, многие "админы" (а я таких знаю очень много :) начнут "настраивать" IDS по рекомендациям. которые годятся для больших, транзакционно тяжелых систем, требующих тонкого тьюнига именно для конкретной специфической задачи (прикладной системы). ... |
|||
:
Нравится:
Не нравится:
|
|||
16.02.2010, 19:45 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
victor16...поскольку основные операции по изменению данных ведутся в 8K страницах (total dirty=1611), 2K страницы используются только для чтения (total dirty=81). вывод достаточно спорный, т.к. кол-во грязных страниц в выводе onstat -P зависит от момента выполнения команды, а этот момент может быть очень разным, тем более, что и нагрузка в прикладной системе обычно неравномерная по многим параметрам. ... |
|||
:
Нравится:
Не нравится:
|
|||
16.02.2010, 19:51 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
vasilisуменьшать буферный пул в данном случае и доводить bufwaits ratio до 2 или 5% и создавать будущие проблемы производительности Василий, совершенно с Вами согласен, так я вроде и говорил, что надо стремиться к минимизации bufwaits. vasilisкол-во грязных страниц в выводе onstat -P зависит от момента выполнения команды И опять я соглашаюсь с Вами, нужно мониторить onstat -P, чтобы сделать вывод о целесообразности большого буферного пула. С уважением, Виктор ... |
|||
:
Нравится:
Не нравится:
|
|||
16.02.2010, 22:11 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
Если уж речь зашла о команде onstat -P, то есть три вещи, на которые надо обратить внимание в выводе этой команды. 1) Первая строка (partnum 0), число в поле 'other' показывает количество неиспользуемых страниц в буферном пуле, оно должно быть значительно меньше, чем значения других полей. Сохраняющееся в течении длительного периода высокое значение в этом поле указывает на то, что можно уменьшить количество буферов без особого ущерба для производительности. Однако, чтобы быть полностью уверенным в своих выводах, это надо проверить в моменты пиковой нагрузки (я солидарен с Василием) 2) Totals в конце страницы. В "правильной" OLTP/DSS системе нормальным считается соотношение 60-80% data pages, 15-35% index (BTree) pages и малое значение "other". Естественно, что в DW-системах с небольшим количеством индексов это соотношение будет другим. Нужно иметь в виду, что для старых систем (7.3 и 9.2), если Btree выше 60%, это может свидетельствовать о наличии старого "buffer aging bug". 3) Каждая строка с указанием partnum. Эта информация может использоваться для вычисления часто используемых таблиц с целью их последующего фрагментирования для распределения нагрузки от параллельного сканирования. Также в этой строке можно вычислить таблицы небольшого размера, но очень часто используемые в течении рабочего дня, с целью сделать их резидентными, правда, для новых версий это уже неактуально, поскольку сервер сам решает вопрос о резидентности таблиц и индексов. ... |
|||
:
Нравится:
Не нравится:
|
|||
16.02.2010, 23:11 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
IDS Admin vasilis ранее уже любезно советовал изменить размер физ. журнала. Уменьшали до 2ГБ, жили пару дней, изменений не заметили и вернули назад, т.к. вроде бы "хлеба не просит". Хотя, очень даже вероятно, не там смотрели результат изменения размера физ. журнала. А результат , если и был, то чисто умозрительный и померить его тяжело (если вообще возможно). Я ведь исходил из общей теории что "обслуживать такой (большой) файл и искать там нужную точку тоже нужно время", а также из старого опыта "В моей жизни 1-2Гб хватало даже в самых нагруженных системах, но на истину не претендую". По тому же принципу можно создавать все пространства "с запасом" (что часто и делают, если есть возможность, дабы в будущем иметь меньше хлопот), а можно "по необходимости", особенно при ограниченных ресурсах или желании всем управлять. IDS Admin В любом случае, его можно менять при включенной БД А с какой версии это можно ? ... |
|||
:
Нравится:
Не нравится:
|
|||
17.02.2010, 13:16 |
|
Блокировка IDS 11.5 при выполнении КТ с асинхронной HDR.
|
|||
---|---|---|---|
#18+
victor16vasilisуменьшать буферный пул в данном случае и доводить bufwaits ratio до 2 или 5% и создавать будущие проблемы производительности Василий, совершенно с Вами согласен, так я вроде и говорил, что надо стремиться к минимизации bufwaits. Ну, Вы еще несколько раз говорили, что при "bufwaits ratio<2%, однозначно надо уменьшать буферный пул", а уменьшение буферного пула уж никак не будет способствовать минимизации bufwaits. Именно против этого Вашего вывода я и возражал, намекая, что системы разные и далеко не всегда это нужно. И я рад, что мы вместе (и надеюсь, наши читатели :) пришли к пониманию. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.02.2010, 13:31 |
|
|
start [/forum/topic.php?fid=44&fpage=24&tid=1607621]: |
0ms |
get settings: |
9ms |
get forum list: |
12ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
38ms |
get topic data: |
12ms |
get forum data: |
2ms |
get page messages: |
315ms |
get tp. blocked users: |
2ms |
others: | 361ms |
total: | 759ms |
0 / 0 |