Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
Длительность чекпойнтов резко увеличивается. В чем причина?
|
|||
|---|---|---|---|
|
#18+
Подскажите, плз, вследствие чего может иметь место следующая ситуация, и что здесь можно предпринять? Выполняю копирование данных из одной таблицы в другую ( Код: plaintext Структура таблиц идентична, в таблице назначения нет никаких индексов. Объем данных ~10000000 записей. БД - no log. Периодически (в 90% случаев) на некотором этапе процесс подвисает. online.log при этом имеет следующий вид: 02:04:14 Checkpoint Completed: duration was 2 seconds. 02:04:14 Checkpoint loguniq 898, logpos 0x1ce018 02:04:24 Checkpoint Completed: duration was 2 seconds. 02:04:24 Checkpoint loguniq 898, logpos 0x1cf018 02:04:34 Checkpoint Completed: duration was 2 seconds. 02:04:34 Checkpoint loguniq 898, logpos 0x1d0018 02:04:44 Checkpoint Completed: duration was 3 seconds. 02:04:44 Checkpoint loguniq 898, logpos 0x1d1018 02:04:54 Checkpoint Completed: duration was 3 seconds. 02:04:54 Checkpoint loguniq 898, logpos 0x1d2018 02:08:27 Checkpoint Completed: duration was 206 seconds. 02:08:27 Checkpoint loguniq 898, logpos 0x1d3018 02:14:00 Checkpoint Completed: duration was 320 seconds. 02:14:00 Checkpoint loguniq 898, logpos 0x1d4018 02:22:36 Checkpoint Completed: duration was 503 seconds. 02:22:36 Checkpoint loguniq 898, logpos 0x1d5018 02:29:08 Checkpoint Completed: duration was 370 seconds. 02:29:08 Checkpoint loguniq 898, logpos 0x1d6018 02:34:58 Checkpoint Completed: duration was 339 seconds. 02:34:58 Checkpoint loguniq 898, logpos 0x1d7018 02:38:40 Checkpoint Completed: duration was 204 seconds. 02:38:40 Checkpoint loguniq 898, logpos 0x1d8018 ...и далее в том же духе до завершения операции. Копирование идет около 5 часов (при нормальной работе - 10 мин). :( IDS9.21, Unix, RAID5, 2.5 Гб памяти. Все в одном dbspace (кроме root, конечно). Раньше (почти год) все работало без проблем... Как бороться с этим катаклизмом? :( ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.08.2004, 11:39 |
|
||
|
Длительность чекпойнтов резко увеличивается. В чем причина?
|
|||
|---|---|---|---|
|
#18+
А если сильно уменьшить LRU_MAX (MIN) ? Какие там значения у тебя кстати ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.08.2004, 12:05 |
|
||
|
Длительность чекпойнтов резко увеличивается. В чем причина?
|
|||
|---|---|---|---|
|
#18+
Как и было при установке: LRUS 8 LRU_MAX_DIRTY 60 LRU_MIN_DIRTY 50 Вначале-то все идет неплохо, вот что неясно... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.08.2004, 12:11 |
|
||
|
Длительность чекпойнтов резко увеличивается. В чем причина?
|
|||
|---|---|---|---|
|
#18+
А что делает операционка во время длинных чекпоинтов? sar -u sar -d и на всякий случай sar -b select по индексу или полное сканирование? Что показывает onstat -F onstat -R onstat -P Данные лежат raw devices? Что еще работает на сервере кроме базы? с уважением, onstat- з.ы. мне кажется что база ту не причем, это ОС или Железо. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.08.2004, 13:15 |
|
||
|
Длительность чекпойнтов резко увеличивается. В чем причина?
|
|||
|---|---|---|---|
|
#18+
что говорит onstat -g stk <tread которая делает копирование> ? Если висит на условии - то что за условие ? Есть ли асинхронный ввод/вывод - если есть, что делают нити (опять - таки, результат onstat -g stk ) ? Скорей всего, дело в железе, и сервер сидит в IO call дожидаясь окончания, пока контроллер борется с битыми секторами. Какая операционка ? Попробуйте проверить диск. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.08.2004, 15:54 |
|
||
|
Длительность чекпойнтов резко увеличивается. В чем причина?
|
|||
|---|---|---|---|
|
#18+
Только что повторил эксперимент... online.log: 14:27:50 Checkpoint Completed: duration was 2 seconds. 14:27:50 Checkpoint loguniq 899, logpos 0x1fe018 14:28:01 Checkpoint Completed: duration was 3 seconds. 14:28:01 Checkpoint loguniq 899, logpos 0x1ff018 14:28:13 Checkpoint Completed: duration was 5 seconds. 14:28:13 Checkpoint loguniq 899, logpos 0x200018 14:30:12 Checkpoint Completed: duration was 115 seconds. 14:30:12 Checkpoint loguniq 899, logpos 0x201018 14:36:33 Checkpoint Completed: duration was 372 seconds. 14:36:33 Checkpoint loguniq 899, logpos 0x202018 14:41:08 Checkpoint Completed: duration was 265 seconds. 14:41:08 Checkpoint loguniq 899, logpos 0x203018 Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. Такие вот дела... На серваке кроме этой базы ничего нет. Используем raw devices. Исходная таблица выбирается полностью (никаких условий), так что тут тормозов быть не должно. Попробую отследить, что делает нить, которая копирует... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.08.2004, 16:38 |
|
||
|
Длительность чекпойнтов резко увеличивается. В чем причина?
|
|||
|---|---|---|---|
|
#18+
onstat -g stk выдает следующее: Stack for thread: 75 sqlexec base: 0x0c105000 len: 36864 pc: 0x08585830 tos: 0x0c10dd38 state: cond wait vp: 1 Как бы узнать что за условие? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.08.2004, 18:54 |
|
||
|
Длительность чекпойнтов резко увеличивается. В чем причина?
|
|||
|---|---|---|---|
|
#18+
onstat -g con дает conditions onstat -u еще интересует. А что, самого стека не было ? Но очень похоже на проблемы с железом, судя по waiting I/O из sar. Что за платформа ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.08.2004, 21:03 |
|
||
|
Длительность чекпойнтов резко увеличивается. В чем причина?
|
|||
|---|---|---|---|
|
#18+
Попробуй все таки уменьшить в 10 раз LRU_MAX (MIN) и посмотри длительность чекпоинтов, теоретически должны стать меньше. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.08.2004, 11:03 |
|
||
|
Длительность чекпойнтов резко увеличивается. В чем причина?
|
|||
|---|---|---|---|
|
#18+
Платформа SCO UnixWare 7.13. onstat -u: Informix Dynamic Server 2000 Version 9.21.UC4 -- On-Line (CKPT REQ) -- Up 10:11:32 -- 46476 Kbytes Blocked:CKPT Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. onstat -g cond ничего нового не говорит. Провел серию экспериментов... Выполнил несколько аналогичных запросов на другом ядре этого же сервака - все ОК. Поробовал на другой базе в том же ядре (базу создал в другом dbspace) - первый раз OK, второй раз повис. Пока подозреваю кривизну какого-нить чанка... Но ясности никакой. Попробовать с LRU в плане оптимизации можно, но проблему это скорее всего не решит... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.08.2004, 13:28 |
|
||
|
Длительность чекпойнтов резко увеличивается. В чем причина?
|
|||
|---|---|---|---|
|
#18+
Давай onstat -g ath onstat -k onstat -g con (не cond !) Можешь вообще сохранить результаты onstat -g all и onstat -a и постить куски по мере надобности. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.08.2004, 05:00 |
|
||
|
Длительность чекпойнтов резко увеличивается. В чем причина?
|
|||
|---|---|---|---|
|
#18+
1. При чекпоинте 2-3секунды они у вас шли каждые 10 сек. 2. Как только интервал чекпоинта увеличился до 6 мин время выросло до 206 сек., а когда интервал стал 8,5 мин. соответственно и чекпоинт стал 503 сек. Тут я думаю логика ясна. 3. Почему так плавает чекпоинт ? Какие значения имеют параметры onconfig-а PHYSFILE и CKPTINTVL ??? 4. Сколько буферов в системе ? (параметр BUFFERS) 5. Какова длина строки в таблице ? (можно увидеть в dbschema -ss) 6. LRUS=4*NUMCPUVP 7. CLEANERS=LRUS 8. LRU_MAX_DIRTY 60 и LRU_MIN_DIRTY 50 большие ОДНОЗНАЧНО, уменьшайте (10/15, 5/8 и т.д., подбирайте) !!! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.10.2004, 12:47 |
|
||
|
Длительность чекпойнтов резко увеличивается. В чем причина?
|
|||
|---|---|---|---|
|
#18+
1. При чекпоинте 2-3секунды они у вас шли каждые 10 сек. 2. Как только интервал чекпоинта увеличился до 6 мин время выросло до 206 сек., а когда интервал стал 8,5 мин. соответственно и чекпоинт стал 503 сек. Тут я думаю логика ясна. 3. Почему так плавает чекпоинт ? Какие значения имеют параметры onconfig-а PHYSFILE и CKPTINTVL ??? 4. Сколько буферов в системе ? (параметр BUFFERS) 5. Какова длина строки в таблице ? (можно увидеть в dbschema -ss) 6. LRUS=4*NUMCPUVP 7. CLEANERS=LRUS 8. LRU_MAX_DIRTY 60 и LRU_MIN_DIRTY 50 большие ОДНОЗНАЧНО, уменьшайте (10/15, 5/8 и т.д., подбирайте) !!! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.10.2004, 12:48 |
|
||
|
Длительность чекпойнтов резко увеличивается. В чем причина?
|
|||
|---|---|---|---|
|
#18+
onconfig: CKPTINTVL 300 # Check point interval (in sec) PHYSFILE 2000 # Physical log file size (Kbytes) BUFFERS 10000 # Maximum number of shared buffers Некоторое время работал с PHYSFILE 10000 - ощутимой разницы не заметил. Для таблицы, в которую загружаются данные: row size = 69 number of columns = 13 Попробую поработать некоторое время с LRUS 8 # Number of LRU queues LRU_MAX_DIRTY 10 # LRU percent dirty begin cleaning limit LRU_MIN_DIRTY 15 # LRU percent dirty end cleaning limit ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.10.2004, 15:01 |
|
||
|
|

start [/forum/topic.php?fid=44&msg=32738137&tid=1609191]: |
0ms |
get settings: |
8ms |
get forum list: |
15ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
38ms |
get topic data: |
8ms |
get forum data: |
2ms |
get page messages: |
46ms |
get tp. blocked users: |
1ms |
| others: | 11ms |
| total: | 137ms |

| 0 / 0 |
