|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
Используется 11.50FC9 x64 на Srv2008R2 x64. Давно все настроено, работает и есть не просит. Нагрузка не большая - меньше 100 одновременных сессий. Сегодня вдруг сервер перестал принимать коннекты. Телнетом локально пробовали к нему подключиться - нет коннекта. Сервер перезагрузили, не помогло. Вызвонили меня, пока я добрался до сервера - все уже работает. Посмотрел сервер лог - все чисто, единственное, что бросилось в глаза, когда сервер не отвечал, в логе между чекпойнтами увеличено время. Начиная с 16:35 время между чекпойнтами растянуто. В 16:55 - то же самое. Начиная с 17:21 все, вроде, ок. Вопрос, что делать? Как проверить чем сервер занимался в это время, и что надо сделать, чтобы подобное не повторялось? Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. 71. 72. 73. 74. 75. 76. 77. 78. 79. 80. 81. 82. 83. 84. 85. 86. 87. 88. 89. 90.
... |
|||
:
Нравится:
Не нравится:
|
|||
09.12.2013, 18:16 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
falcon111Сервер перезагрузили, не помогло. В логе не видно, что сервер перезагружали ... |
|||
:
Нравится:
Не нравится:
|
|||
10.12.2013, 11:06 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
Ситуация один-в-один! Используем IDS 11.70FC4 (Проверяли и на 11.70FC7). Настроены 2 подключения по olsoctcp и drsoctcp. В какой-то момент по drda остаются доступны только select`ы. olsoc лежит мертво - ни dbacces, ни esqleditor, ни ilogin не подключаются. Внешне все выглядит так: 1. onstat - дает online 2. onparams без параметров пишет после таймаута - шаред мемори не инициализирована 3. telnet на оба порта подключается! 4. в log журнале как и у автора - только список чекпоинтов, причем последний 20-30-40 минут назад. хотя до этого каждые 5 минут был отчет. 5. onstat с различными ключами - ничего криминального. все в пределах нормы. 6. В мониторе windows - нет никакой дисковой активности на datadbs. была замечена непродолжительное время и незначительная на tempdbs. Память и CPU на oninit тоже без активности. 7. Во время одного из разбирательств сервер ожил(!) сам. В логе ничего не появилось. 8. Заметили, что все же активнее уходит в себя в моменты пиковой активности в течение рабочего дня. Вечером вроде не проявляется. Хотя в логе за ночь тоже присутствуют окна в 15-25 минут между чекпоинтами. То есть он уходит сам в себя на достаточно продолжительное время. Внешне никак это не обозначает и выяснить что же там происходит пока не можем. Проблема резко всплыла после новогодних праздников, но и в декабре похоже были звоночки. До этого как и у автора - работало год-два. А тут две ужасных недели --- каждые час-полтора приходится перестартовывать службу - заказчик уже нервничает. Мы не можем понять причин. Кстати остановка службы при перезапуске происходит минут 5-7. falcon111, чем все закончилось у вас? Встречаются еще упоминания о данной ситуации http://www.dbtalk.net/comp-databases-informix/problems-long-checkpoints-664021.html но никакой конкретики. ... |
|||
:
Нравится:
Не нравится:
|
|||
24.01.2014, 23:27 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
Возможно не в тему, но как-то вызвали у 11.50FC8W2 задумчивые тормоза и уходы в астрал вот точно с такими же отходняками как включили во встроеном шедулере автоапдейт статистики. Неделя ахтунга, но как сообразили и отключили - жопа закончилась разом. Были там пропуски чекпоинтов или не не помню. Но коннектиться давал. ... |
|||
:
Нравится:
Не нравится:
|
|||
25.01.2014, 22:43 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
Яковлев Павел, тоже сталкивались с этим, поэтому его останавливаем 20:49:56 On-Line Mode 20:49:57 SCHAPI: "INFORMIXDIR/etc/sysadmin/stop" file is present. Bypassing dbScheduler and dbWorker threads startup. ... |
|||
:
Нравится:
Не нравится:
|
|||
27.01.2014, 09:45 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
Что было сделано: 1) в CONFIG включен RTO: RTO_SERVER_RESTART 300 2) у всех клиентов (3 клиента - 2 по olsoctcp, 1 по drda) выставлено время жизни сессии в пуле соединений клиента 30 сек. Было где-то 60 (умолчание), где-то 1800. Что получили: 1) ухода в себя нет. сервер работает и обслуживает всех клиентов. вроде радость, но: 2) в логе и по onstat -g ckp нет чекпоинтов. Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
То есть первая половина рабочего дня понедельника не чекпоинтилась. Решили сделать принудительный сброс onmode -c. Запустили в 10:45. Сейчас уже 11:10. Команда выполняется. Мы стали волноваться. onstat -g iof Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17.
Данные у нас в этом инстансе лежат в root (также как и физ.лог и лог.лог). Значение writes (предпоследняя цифра) у rootdbs растет все это время. В планах есть разделить rootdbs на root, data, plog и llog. А сейчас конечно непонятно по кому идет активность. Пока писал onmode -c продолжает работать (время 11:30) Собственно этим постом хотел спросить: 1) Что происходит? 2) Как посмотреть что происходит? 3) Что будет если перезапустить информикс? Архив ночной есть. ... |
|||
:
Нравится:
Не нравится:
|
|||
27.01.2014, 11:21 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
Итак прошел час (11:45) после запуска команды Код: sql 1.
и все --- сервер ушел в себя со всеми описанными выше симптомами: 1) телнеты на оба порта (olsoctcp и drsoctcp) подключаются 2) дисковой активности через монитор Windows - 0 3) С начала запуска сервера (вчера вечером) заполнилось 7 логических журналов по 100мб из 51. 4) коннект на порт olsoctcp не идет ни откуда. 5) коннект по drda с клиента идет! Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32.
Есть снятый лог Код: sql 1.
на момент ухода сервера в себя. Еще примечательный момент - сессии зависли и не освобождаются. Хотя в пуле клиента они уже явно просрочены: Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46.
... |
|||
:
Нравится:
Не нравится:
|
|||
27.01.2014, 12:07 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
_torero... Нагрузка не большая - меньше 100 одновременных сессий... Собственно этим постом хотел спросить: 1) Что происходит? 2) Как посмотреть что происходит? 3) Что будет если перезапустить информикс? Архив ночной есть. Рискну предположить, что нагрузка таки есть. В процессе синхронизации буферов с чанками данные от клиентов продолжают поступать. Другими словами, скорость поступления данных выше скорости сброса буферов на диск. В какой-то момент данных скапливается так много, и поскольку Informix отдает приоритет процессу обработки контрольной точки, обработка поступающих данных прекращается, становятся возможны только селекты, модификация данных невозможна, что и происходит у вас периодически. Посмотреть, что происходит, можно командами onstat -d, onstat -F, onstat -g seg, onstat -u, onstat -g ses. Рекомендую найти сессию, которая активно вставляет или модифицирует данные на сервере. Инстанс лучше не перезапускать, есть риск потери данных со времени последнего архива. После завершения чекпоинта надо будет посмотреть onstat -g ckp и вывод из журнала сообщений. Там должны быть полезные рекомендации. Следовать им необязательно, но определенные выводы сделать можно. ... |
|||
:
Нравится:
Не нравится:
|
|||
27.01.2014, 12:12 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
дополнительная информация на 12:10 1) в логах клиента который одновременно работает по olsoctcp и drda ошибки на модификацию (транзакцию) пошли сразу после команды onmode -c. 2) подключение по drda все еще идет! ... |
|||
:
Нравится:
Не нравится:
|
|||
27.01.2014, 12:19 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
victor16, 1) нагрузки нет. клиенты судя по логам и нашим попыткам зайти в клиентское приложение просто не могут проконнектиться по olsoctcp. По drda при этом коннект проходит. Но по drda идет только выборка без модификаций. 2) Сессии я приводил выше - они заморозились на момент недоступности сервера. Сейчас (12:23) проверил - они все на месте. 3) Запросы неоднократно профилировали и трейсили - система картотечная - нет длинных вставок, удалений или модификаций, свойственных аналитическим задачам. (мы на запросы сразу начали думать, как столкнулись с таким поведением. сейчас тоже допускаем конечно же их вину, но уже гипотетически. ) 4) С другой стороны- что может "натворить" запрос? Длинный insert переполнит логи и будет long transaction aborted - но это явное и прогнозируемое поведение. и проблемы будут у конкретной сессии. мы искусственно вызывали такое поведение - сервер стоял как ни в чем ни бывало. Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38.
Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18.
Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12.
Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. 71. 72. 73. 74. 75. 76. 77. 78. 79. 80. 81. 82. 83. 84. 85. 86. 87. 88. 89. 90. 91. 92. 93. 94. 95. 96. 97. 98. 99. 100. 101. 102. 103. 104. 105. 106. 107.
Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49.
Запросы в висящих сессиях замерли на создании индексов - пытались поиск в системе сделать. Ничего криминального. Поиск сделан через временную таблицу. ... |
|||
:
Нравится:
Не нравится:
|
|||
27.01.2014, 12:34 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
_torerob8794cb8 Y--P--- 164 portal SZAPP-SO ba569870 0 2 146113 185714 Аномально высокое по сравнение с другими сессиями значение nwrites. Покажите onstat -g ses 164 _toreroЗапросы в висящих сессиях замерли на создании индексов - пытались поиск в системе сделать. Ничего криминального. Поиск сделан через временную таблицу. Вы индексы создаете на временную таблицу или постоянную? ... |
|||
:
Нравится:
Не нравится:
|
|||
27.01.2014, 12:48 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
victor16, индексы на временную таблицу. Мы отключали создание этих индексов - изменений не было (то есть все-равно сервер был недоступен). Под "Поиск" в предыдущем сообщении - имел ввиду некую прикладную функцию поиска сущностей в базе - набор select и update через временную таблицу. Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55.
... |
|||
:
Нравится:
Не нравится:
|
|||
27.01.2014, 13:04 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
_torero, насколько быстро заполняются физический и логический журналы? покажите onstat -l с интервалом, скажем в 10-15 секунд ... |
|||
:
Нравится:
Не нравится:
|
|||
27.01.2014, 13:10 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
victor16, самое главное забыл сказать по 164 сессии: пользователь portal - это пользователь, под которым подключается пул приложений IIS веб-сервера. То есть за ним стоит работа десятков реальных людей. Тогда пара слов об архитектуре: 1) Клиентами базы являются 2 клиентских приложения, расположенные на двух разных хостах 2) Первый клиент подключается и работает полностью через olsoctcp - это Winforms клиент, использующий провайдер IBM.Data.Informix.dll. Пользователи этого клиента подключаются к БД каждый своим логином. 3) Второй клиент - это сайт. Использует для подключения и работы два протокола: - olsoctcp напрямую через провайдер IBM.Data.Informix.dll (в приложении на этом построена прямая работа через SQL: вся модификация данных и часть select-ов) - drsoctcp для работы EntityFramework через DataServerData package (v9.7fp4_ntx64_dsdriver_ALL_LANG.exe) (в приложении на этом построена только часть выборки данных. модификация данных не производится). Пользователи второго клиента подключаются к базе от имени пользователя portal. авторизация выполняется не средствами СУБД, а самим приложением. По лог журналам: вот вырезка из лога за сегодня 27.01.2014: Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9.
Других строчек нет. По логам сейчас движения нет - клиенты все еще не могут работать по olsoctcp Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66.
По состоянию на 13:20 сервер к нам не вернулся. Решаем вопрос принудительного перезапуска windows службы. Подключение по drda все также работает. ... |
|||
:
Нравится:
Не нравится:
|
|||
27.01.2014, 13:23 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
_torero, а что показывает onstat -g act, onstat -g rea лучше не один срез во времени, а несколько с интервалом 2-3 сек ... |
|||
:
Нравится:
Не нравится:
|
|||
27.01.2014, 13:28 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
victor16, Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47.
Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. 71. 72. 73. 74. 75. 76. 77. 78. 79.
... |
|||
:
Нравится:
Не нравится:
|
|||
27.01.2014, 13:46 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
_torero, стоп, да у вас ничего не выполняется, нет ни одной нити в состоянии running, кроме листенеров. сколько у вас физических процессоров на сервере? какое количество процессоров Informix выделено под них (onstat -g cpu)? привязаны ли они к физическим процессорам (affinity)? ну и так, на всякий случай: какое значение параметра LOG_INDEX_BUILDS выполняется ли периодически команда onmode -F для освобождения неиспользуемой памяти? ... |
|||
:
Нравится:
Не нравится:
|
|||
27.01.2014, 13:56 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
victor16, Да, с 10:45 сервер после onmode -c вот в таком состоянии. На сервере 2 CPU, 16 ядер. Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. 71. 72. 73. 74. 75. 76. 77. 78. 79. 80. 81. 82. 83. 84. 85. 86. 87. 88. 89. 90. 91. 92. 93. 94. 95. 96. 97. 98. 99. 100. 101. 102. 103. 104. 105. 106. 107. 108. 109. 110. 111. 112. 113. 114. 115. 116. 117. 118. 119. 120. 121. 122.
из CONFIG: Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12.
команда onmode -F не выполняется. ... |
|||
:
Нравится:
Не нравится:
|
|||
27.01.2014, 14:07 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
_torero, покажите еще onstat -k, почему-то слишком много wait-еров в выводе onstat -u ... |
|||
:
Нравится:
Не нравится:
|
|||
27.01.2014, 14:22 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
В 14:17 перезапустили win службу с инстансом. В 14:26 служба остановлена. В логе не появилось ни строчки. Запустили заново. Вот лог информикса после запуска (захватил предыдущий запуск): Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. 71. 72. 73. 74. 75. 76. 77. 78. 79. 80. 81. 82. 83. 84. 85. 86. 87. 88. 89. 90. 91. 92. 93. 94. 95. 96. 97. 98. 99. 100. 101. 102.
Сервер накатил 97932 транзакции. Откатил 4 - видимо те, кому не повезло в момент, когда мы дали onmode -c Еще дополнительный факт: Утром был запущен eSQLeditor. Код: sql 1. 2. 3.
То есть начиная с 10:45 подключения по olsoctcp не проходили, но уже подключенный eSQLeditor выполняло запросы select. Вот ошибки клиентов: Код: sql 1.
Код: sql 1. 2. 3. 4. 5. 6.
... |
|||
:
Нравится:
Не нравится:
|
|||
27.01.2014, 14:32 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
_torero, вам повезло, что сервер поднялся. Какой командой глушится сервер? ... |
|||
:
Нравится:
Не нравится:
|
|||
27.01.2014, 14:45 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
_torero, у Вас, похоже, проблемы связаны с ограничениями для бесплатной версии. Там есть ограничения и по количеству используемой памяти, и по количеству одновременно открытых сессий и по размеру пространств. Точнее могут сказать в техсаппорте или те, кто устанавливал Вам эту систему. Единственное, что могу посоветовать в Вашей ситуации: 1. Сделать апгрейд на 11.70FC8IE 2. Разнести журналы, данные и индексы по разным дискам. 3. Создать временное пространство. 4. Вернуть на место параметр RTO (т.е. отключить) 5. Уменьшить количество используемой памяти 6. Уменьшить значения lru_min_dirty, lru_max_dirty 7. Изменить логику приложений, исключив дорогостоящие операции типа CREATE INDEX. 8. Если п.7 невозможен, рассмотрите возможность создания временных таблиц без журналирования ... |
|||
:
Нравится:
Не нравится:
|
|||
27.01.2014, 14:57 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
victor16, системы ставили мы. Про ограничения бесплатной версии знаем. И до этого сервер открыто нам говорил об этом. Вот эксперименты от 20.01.2014: Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13.
1. Пытались перейти на 11.70FC7, но остановились после сообщения о баге: http://www.sql.ru/forum/1072455/ostorozhno-bag 2. Журналы создадим. 3. Что за временное пространство? tempdbs? 4. Отключим 5. Уменьшить количество используемой памяти - то есть уменьшить буферы? 6. Уменьшить значения lru_min_dirty, lru_max_dirty. До каких для примера? 7. Временные таблицы мы всегда создаем с with no log 15:05 Однако сервер опять ушел в себя! Пошли смотреть, что там ... |
|||
:
Нравится:
Не нравится:
|
|||
27.01.2014, 15:14 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
_torerovictor16, Пытались перейти на 11.70FC7, но остановились после сообщения о баге: http://www.sql.ru/forum/1072455/ostorozhno-bag Workaround здесь очевиден: 1. как можно быстрее закрыть транзакцию в 1-й сессии 2. Не делать insert без открытия транзакции во 2-й сессии _toreroЧто за временное пространство? tempdbs? Да, создавать через onspaces с опцией -t _toreroУменьшить количество используемой памяти - то есть уменьшить буферы? Уменьшить значения lru_min_dirty, lru_max_dirty. До каких для примера? Все будет зависеть от длительности контрольной точки. Уменьшать параметры до приемлемой ее длительности. На сильно нагруженных системах иногда доходило до значений 1-2 а то и меньше. _torero15:05 Однако сервер опять ушел в себя! Пошли смотреть, что там Давайте посмотрим. Для начала нужен снова вывод onstat -d, onstat -g ses, onstat -u, onstat -k, onstat -l, onstat -F, onstat -g act, onstat -g rea ... |
|||
:
Нравится:
Не нравится:
|
|||
27.01.2014, 15:47 |
|
Сервер не дает коннектиться и пропускает чекпойнты
|
|||
---|---|---|---|
#18+
Сразу после перезапуска он еще раз ушел в себя достаточно быстро. Перед запуском внесли изменения в CONFIG: Код: sql 1. 2. 3. 4. 5. 6. 7. 8.
На данный момент инстанс работает. В 15:55 дал команду onmode -c. Чекпоинт прошел только в 16:15. Тут же дал еще раз onmode -c --- чекпоинт прошел быстро. Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20.
... |
|||
:
Нравится:
Не нравится:
|
|||
27.01.2014, 16:25 |
|
|
start [/forum/topic.php?fid=44&msg=38538790&tid=1606990]: |
0ms |
get settings: |
18ms |
get forum list: |
5ms |
check forum access: |
1ms |
check topic access: |
1ms |
track hit: |
72ms |
get topic data: |
2ms |
get forum data: |
0ms |
get page messages: |
493ms |
get tp. blocked users: |
1ms |
others: | 294ms |
total: | 887ms |
0 / 0 |