|
|
|
Нагрузка на сервер
|
|||
|---|---|---|---|
|
#18+
В администрировании я слаб, открыл HTOP, и увидел что нагрузка на сервер или процессоры высока (load average). Характеристики: -Количество ядер: 8 -Озу: 24ГБ -Centos 6 -Apache -PHP -MySQL Для поиска стоит Apache SOLR. Вопрос тем кто разбирается, посмотрите пожалуйста мои логи, из-за чего такой высокий Load Average? Иногда подымается до 10 секунд, иногда падает до 6. За расширеный ответ мегареспект! Спасибо. Uptime (uptime) Код: powershell 1. Free mem (free -m) Код: powershell 1. 2. 3. 4. Top (top -b -n1) Код: powershell 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. 71. 72. 73. 74. 75. 76. 77. 78. 79. 80. 81. 82. 83. 84. 85. 86. 87. 88. 89. 90. 91. 92. 93. 94. 95. 96. 97. 98. 99. 100. 101. 102. 103. 104. 105. 106. 107. 108. 109. 110. 111. 112. 113. 114. 115. 116. 117. 118. 119. 120. 121. 122. 123. 124. 125. 126. 127. 128. 129. 130. 131. 132. 133. 134. 135. 136. 137. 138. 139. 140. 141. 142. 143. 144. 145. 146. 147. 148. 149. 150. 151. 152. 153. 154. 155. 156. 157. 158. 159. 160. 161. 162. 163. 164. 165. 166. 167. 168. 169. 170. 171. 172. 173. 174. 175. 176. 177. 178. 179. 180. 181. 182. 183. 184. 185. 186. 187. 188. 189. 190. 191. 192. 193. 194. 195. 196. 197. 198. 199. 200. 201. 202. 203. 204. 205. 206. 207. 208. 209. 210. 211. 212. 213. 214. 215. 216. 217. 218. 219. 220. 221. 222. 223. 224. 225. 226. 227. 228. 229. 230. 231. 232. 233. 234. 235. 236. 237. 238. 239. 240. 241. 242. 243. 244. 245. 246. 247. 248. 249. 250. 251. 252. 253. 254. 255. 256. 257. 258. 259. 260. 261. 262. 263. 264. 265. 266. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.03.2014, 12:45 |
|
||
|
Нагрузка на сервер
|
|||
|---|---|---|---|
|
#18+
Для 8-ядерной односокетной машины (а ещё, небось, HT включен?) load average вполне себе в рамках допустимого (в случае HT - даже есть приличный запас). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.03.2014, 12:55 |
|
||
|
Нагрузка на сервер
|
|||
|---|---|---|---|
|
#18+
Scott Tiger, а что такое HT? Просто я заметил что когда около 10секунд, то сервер не так быстро отдает странички. Мне просто интересно, по логам я не вижу чотбы были висели процессы, там 2-3 запроса по 2%. Почему тогда у 8-ядерной машины ~8сек load av time? может я не понимаю чего то? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.03.2014, 12:58 |
|
||
|
Нагрузка на сервер
|
|||
|---|---|---|---|
|
#18+
автора что такое HT? Hyper Threading ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.03.2014, 13:25 |
|
||
|
Нагрузка на сервер
|
|||
|---|---|---|---|
|
#18+
HT = Inter HyperThreading или аналогичные технологии от других вендоров, при включенном HT количество виртуальных процессоров, доступных для ОС, будет равно S*C*T, где S - количество сокетов, C - количество ядер в сокете, T - количество тредов в ядре (это всё для случая одинаковых по характеристикам процессоров во всех сокетах). Load average - измеряется не в секундах, а в попугаях, физический смысл - среднее количество задач в очереди диспетчера за последние 1, 5 и 15 минут, для N-процессорных (с точки зрения ОС) систем load average, равный N, приблизительно говорит о 100% загруженности процессоров. man getloadavg до просветления. Проблему со временем отклика ("не так быстро отдает странички") следует решать с использованием инструментов анализа времени отклика, впрочем, если диспетчер не успевает распределять runnable таски по процессорам в силу их (процессоров) излишней загруженности, увеличение времени отклика наблюдаться, конечно, может. Изучать эту проблему технически проще. Т.о., начните копать с двух простых сторон: 1. Фиксируйте время отклика сервера (время, в течение которого отдаётся страничка) подходящим инструментом. Я для таких задач использовал Apache JMeter. Гонять под небольшой нагрузкой (такой, которая не будет заметна на фоне обычной нагрузки, создаваемой пользователями) нужно хотя бы несколько часов, чтобы захватить периоды роста и снижения времени отклика. 2. Фиксируйте общесистемные показатели длины очереди диспетчера, загруженности ядра ОС, в случае CGI-приложений - моментального количества процессов, частоты их создания, убиения и времени жизни. Соответственно, vmstat/mpstat и DTrace/SystemTap при наличии. Собрав результаты и сопоставив их по времени, попробуйте сделать вывод о наличии факта перегруженности процессоров задачами и взаимосвязи этого факта с увеличением времени отклика веб-сервера. Если гипотеза подтвердится - исправляйте пробему, иначе копайте в сторону трассировки/профилирования для ответа на вопрос о причинах роста времени отклика. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.03.2014, 13:32 |
|
||
|
Нагрузка на сервер
|
|||
|---|---|---|---|
|
#18+
судя по приведенному, iowait в районе 20%, это много. Начать стоит с поиска тонкого места в системе ввода-вывода. В первую очередь производительность дисковой подсистемы ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.03.2014, 13:47 |
|
||
|
Нагрузка на сервер
|
|||
|---|---|---|---|
|
#18+
bga83судя по приведенному, iowait в районе 20%, это много. Начать стоит с поиска тонкого места в системе ввода-вывода. В первую очередь производительность дисковой подсистемы Ололо, на линапсе, оказывается , load average включает в себя IO wait! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.03.2014, 13:56 |
|
||
|
Нагрузка на сервер
|
|||
|---|---|---|---|
|
#18+
bga83, а как его найти (тонкое место)? Как промониторить? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.03.2014, 13:58 |
|
||
|
Нагрузка на сервер
|
|||
|---|---|---|---|
|
#18+
javac, если предположение о вводе-выводе верное, то попробуйте запускать iotop и там попытаться понять какой из процессов преимущественно создает этот ввод-вывод. Если там будут "ядерные" процессы - ищите другие. Этот ввод-вывод обусловлен другими процессами, а ядерные служебную функцию несут, например по поддержке журнализации файловой системы. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.03.2014, 14:54 |
|
||
|
Нагрузка на сервер
|
|||
|---|---|---|---|
|
#18+
автор 5153 root 25 5 0 0 0 S 0.0 0.0 0:00.00 md1_resync 5218 root 25 5 0 0 0 D 0.0 0.0 14:04.98 md2_resync это, кстати, что? там resync raid массива запущен ? или был запущен недавно ? В этом случае неудивительно. С тех пор как в Centos зачем-то решили запускать проверку массивов на каждую неделю на него все жалуются. Терпите. Это Энтерпрайз. Или поставьте debian. Там раз в месяц. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.03.2014, 14:58 |
|
||
|
Нагрузка на сервер
|
|||
|---|---|---|---|
|
#18+
Буду пробовать, всем спасибо! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.03.2014, 06:54 |
|
||
|
Нагрузка на сервер
|
|||
|---|---|---|---|
|
#18+
Посмотрел IOTOP, вот что вывело. Statistics_collector висит постоянно, и я не знаю что это такое, и md_raid, тоже регулярно запускается. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.03.2014, 08:08 |
|
||
|
Нагрузка на сервер
|
|||
|---|---|---|---|
|
#18+
javac, ну так не запускайте проверку raid. По какой-то причине программисты redhat считают этот процесс легким и приятным и поэтому поставили его запускаться раз в неделю. Однако на производительность дисковой подсистемы он влияет и если запаса производительности нет, то очень сильно. Скорее всего у вас диски на 3ТБ и процесс будет долгим. Еще возможна ситуация когда массив синхронизируется, после какой-то поломки, а iotop она выглядит точно так же. Так что сначала надо выяснить что именно происходит с raid, а потом уже действовать. Я бы снизил скорость проверки и поставил бы ее на раз в месяц. Все это в гугле написано как делать. statistics_collector - это уже какое-то пользовательское приложение. наверное, части postgresql. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.03.2014, 11:46 |
|
||
|
|

start [/forum/topic.php?fid=25&msg=38578947&tid=1482595]: |
0ms |
get settings: |
11ms |
get forum list: |
12ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
170ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
46ms |
get tp. blocked users: |
2ms |
| others: | 11ms |
| total: | 274ms |

| 0 / 0 |

Извините, этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
... ля, ля, ля ...