|
|
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
Недавно стал замечать такую картину. Все чаще при заходе через ssh виснет подсистема отображения, т.е. все напечатанное выводится через какое то время, не говоря уже об отрисовке всяких top... В munin часть графиков также не прорисовывается будто система отключена. При этом какой то сильной нагрузки на систему вроде бы не производится. 4 8 15 16 23 42 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.01.2011, 01:37 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
ОС ubuntu 10.04 server в top ничего особенного: на машине крутится виртуальная машина vmware server с одной запущенной качалкой на базе ubuntu 9.10 Проц Pdc 2.5, 4гб памяти, при этом раньше чуть ли не вся память уходила под кеширование дисковых операций, то сейчас порядка 100-250мб свободно... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.01.2011, 01:39 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
В munin часть графиков также не прорисовывается будто система отключена. При этом какой то сильной нагрузки на систему вроде бы не производится. по-моему, стандартное поведение для munin. Что-то вроде защиты от размножения конкурирующих копий запускающихся по крону и поэтому часть данных не записывается. Успевает только одна копия. Т.е. это не диагностический симптом, а следствие тормозов. Раз у тебя есть munin (на хосте или в госте? ), то данных должно быть достаточно. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2011, 01:18 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
netwindВ munin часть графиков также не прорисовывается будто система отключена. При этом какой то сильной нагрузки на систему вроде бы не производится. по-моему, стандартное поведение для munin. Что-то вроде защиты от размножения конкурирующих копий запускающихся по крону и поэтому часть данных не записывается. Успевает только одна копия. Т.е. это не диагностический симптом, а следствие тормозов. Раз у тебя есть munin (на хосте или в госте? ), то данных должно быть достаточно. мунин на хосте и хост и гест тормозят в консоли: наберу команду потом жду 2-10 если не более секунд пока она на экране не напечатается... топ воолбще такое ощущение что не обновляет ну ваще... ребут не помогает... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2011, 02:36 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
Aklin, ты IT-профессионал или где? сними и покажи хоть какие-нибудь метрики производительности. на остальных графиках munin что-нибудь нетипичное есть? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2011, 11:34 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
то, что происходило пару дней назад показывают всего пару графиков. но тормоза есть и сейчас... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2011, 13:25 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
Aklin, гигантский iowait вкупе с 100% disk utilization. ты можешь отделить физический диск для системы и свопа от физических дисков для торентов? сразу получишь гарантированные ресурсы ввода-вывода для программ. еще можно попробовать с ionice поиграть ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2011, 13:57 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
netwindAklin, гигантский iowait вкупе с 100% disk utilization. ты можешь отделить физический диск для системы и свопа от физических дисков для торентов? сразу получишь гарантированные ресурсы ввода-вывода для программ. еще можно попробовать с ionice поиграть есть системный диск, 1тб 7200. на нем ОС, на нем ОС, свап и виртуалка. воткнут в мамку. торренты качаются на отдельный рейд5 на 5 (7) дисках гринах (5400), часть дисков воткнута в мамку, часть - в два pci-e x1 sata контроллера. сейчас думаю как бы использовать 4*1тб дисков, хочу на них поставить рейд 10 и на них ОС и все остальное... но некуда их втыкать - на мамке pci-e закончились, а в pci - очень медленно получается... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2011, 14:05 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
AklinnetwindAklin, гигантский iowait вкупе с 100% disk utilization. ты можешь отделить физический диск для системы и свопа от физических дисков для торентов? сразу получишь гарантированные ресурсы ввода-вывода для программ. еще можно попробовать с ionice поиграть есть системный диск, 1тб 7200. на нем ОС, на нем ОС, свап и виртуалка. воткнут в мамку. торренты качаются на отдельный рейд5 на 5 (7) дисках гринах (5400), часть дисков воткнута в мамку, часть - в два pci-e x1 sata контроллера. может с таким объемом ты уже перегрузил шину и операции на тех дисках отражаются на операциях с системным диском. но сомнительно. сейчас думаю как бы использовать 4*1тб дисков, хочу на них поставить рейд 10 и на них ОС и все остальное... но некуда их втыкать - на мамке pci-e закончились, а в pci - очень медленно получается... тогда отзывчивость обычных программ наоборот понизится, ведь торенты будут бесконтрольно забивать очередь диска. возможно неплохая идея использовать железный дешевый контроллер raid10, который работает без драйверов, только для торрентов чтобы разгрузить шину. тогда один блок данных посланный по шине на устройство должен внутри контроллера "размножаться" на диски. до сих пор мне не ясна причина. я и интернета такого домашнего не видал, чтобы торентокачалка могла упереться в шину. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2011, 15:01 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
и действительно ли тебе нужна vmware тут? может попробовать без нее? тем более качалка консольная. мало ли какие там патчи и что они ломают. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2011, 15:09 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
vmware server крайне плохо работает в настоящий момент. если так хочется повиртуалить, то лучше использовать что-нибудь другое (vmware player, virtualbox, kvm, xen [если железка поддерживает]). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2011, 15:15 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
sledopit, "крайне плохо" на форуме ИТ-профессионалов не катит. что именно ухудшается? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2011, 15:23 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
netwindможет с таким объемом ты уже перегрузил шину и операции на тех дисках отражаются на операциях с системным диском. но сомнительно. не исключаю. система не шустрая (p5cl-vm, e5200 2.8, 4гб 800мгц) сейчас думаю об ее обновлении на что нибудь на базе i3 1155 netwindтогда отзывчивость обычных программ наоборот понизится, ведь торенты будут бесконтрольно забивать очередь диска. возможно неплохая идея использовать железный дешевый контроллер raid10, который работает без драйверов, только для торрентов чтобы разгрузить шину. тогда один блок данных посланный по шине на устройство должен внутри контроллера "размножаться" на диски. до сих пор мне не ясна причина. я и интернета такого домашнего не видал, чтобы торентокачалка могла упереться в шину. торренты висят на файлопомойке за базе mdadm, дисков в дем уже сейчас 5 штук на рейде5, и еще два в резерве (на время переезда я их как буферы для копирования использовал). насчет железного контроллера: такой контроллер, что подойдет по моим требованиям, стоит порядка 10-15к, а меня жаба душит на дешевую систему вешать эдакого исполина. да и производительность ненамного увеличится... =/ ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2011, 15:57 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
netwindи действительно ли тебе нужна vmware тут? может попробовать без нее? тем более качалка консольная. мало ли какие там патчи и что они ломают. вируалка используется для имитации отдельного компа. это позволяет использовать шейпер, который хоть позволяет компам пробиваться в интернет при забитом канале... еще: сам проц не имеет поддержки виртуализации, так что скорость геста меня не особо волнует, но вот тормоза хоста мне не понятны... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2011, 15:59 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
netwindsledopit, "крайне плохо" на форуме ИТ-профессионалов не катит. что именно ухудшается? уже не первый человек говорит что сервер плох. думаю попробовать workstation, если он на мой сервер встанет (сервер без иксов -- консольный). в будущем (примерно через 4мес) планирую докупать htpc, а именно обновить серверную систему на i3 и хотя бы 3 pci-e x1, тогда я диски могу повесить нормально без тормозов простого pci, а на сам htpc повесить текущий pdc e5200 плюс хорошая видеокарта... (6850 или 470). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2011, 16:02 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
есть еще мысль -- отключить нафиг pci сата контроллер, потому что из-за него и пошли серьезные лаги... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2011, 16:05 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
On Thu, 27 Jan 2011 19:05:14 +0600, Aklin <nospam@sql.ru> wrote: > Автор: Aklin > есть еще мысль -- отключить нафиг pci сата контроллер, потому что из-за > него и пошли серьезные лаги... Вот похоже что в этом дело. Потому что простите, НЕ ВЕРИТСЯ, что один рэйд может уложить не такой уж и слабый комп. -- Остаюсь искренне Ваш, Станислав Сухолёт Posted via ActualForum NNTP Server 1.4 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.01.2011, 11:22 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
отключил pci контроллер. Возможно помогло, но частично. Консоль перестала подвисать - хотя бы хостовая. Систему я удачно уронил, пытаясь отделить бут и вынести его в отдельный раздел что бы затем все это повесить на два raid1 (для / и для /boot). В итоге я тупо переустановил систему на рейды, скопировал настройки, все вроде работает (пока почему то не запускается веб-сервер на виртуалке, хотя сама сеть на виртуалке работает...). Итого: (все рейды - mdadm) (пишу отчасти что бы потом не забыть) diskraidmdmountcommentsd[fe]1 raid1 md4 /boot md4 - другой не тот что в первых тестахsd[fe]2 raid1 md5 / md5 - другой не тот что в первых тестахsd[fegh]3 4*swap (есть идея запихать все свапы в рейд 10 но пока думаю)sd[fegh]4 raid10 md3 /virt тут будут хранится виртуалки и некоторые архивыsd[abcdi]1 raid5 md2 /raid основная файлопомойка. есть идея в будущем увеличить до 7-8 дисков. возможно перейти на raid6sdj1 /mnt/old_disk старый системный раздел перетасовка дисков позволила отключить три диска, что были подключены на pci контроллер, теперь все диски только на мамке и двух pci-e x1 основной рейд также виден по самбе. файловые системы: везде ext4 линейное чтение/запись основного рейда - ~220/146 мбайт/с (гонял 80гб пустышку) ( подробнее о тестах ) но самба дает 20+-2мбайт сейчас тестирую raid10, еще надо будет их одновременно запустить, что бы загрузить шину как следует... пока идеи - попробовать простейший ftp открыть (для локалки, для внешки есть sftp) и посмотреть скорость на нем... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.01.2011, 14:17 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
пррбовал ли кто переносить свап на софт-рейд ? рейд1 или рейд10 ? я планирую на рейд 10, благо есть 4 диска, на двух из которых установлена ОС (в рейд1) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.01.2011, 17:29 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
касательно самбы: перелопатил кучу вариантов настройки самбы, нашел какой то вариант при котором 50мбайт выдает... так что теперь думаю можно спать спокойна... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.02.2011, 22:21 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
опять поднимаю вопрос: ночью сервер завис, отклику не было, ребутнул. начал ребилдить 10 рейд. один диск из него показывает высокий disk latensy - порядка секунды в среднем - что это означает? диск не гарантийный увы... на остальных дисках в пределах 100мс, максимум 300-400мс... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.03.2011, 15:24 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
Aklin, ну так smart смотри. даже в munin есть такие графики ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.03.2011, 15:27 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
smart sdh (этот сбоит) Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. 71. 72. 73. 74. 75. 76. 77. 78. 79. 80. 81. 82. 83. 84. 85. 86. 87. 88. 89. 90. 91. 92. 93. 94. 95. 96. 97. 98. 99. 100. 101. 102. 103. 104. 105. 106. 107. 108. 109. 110. 111. 112. 113. 114. 115. 116. 117. 118. 119. 120. 121. 122. 123. 124. 125. 126. 127. 128. 129. 130. 131. 132. 133. 134. 135. 136. 137. 138. 139. 140. 141. 142. 143. 144. 145. 146. 147. 148. 149. 150. 151. 152. 153. 154. 155. 156. 157. 158. 159. 160. 161. 162. 163. 164. 165. 166. 167. 168. 169. 170. 171. 172. 173. 174. 175. 176. 177. 178. 179. 180. 181. 182. 183. 184. 185. 186. 187. 188. 189. smart | grep fail Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.03.2011, 15:47 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
на sdh как я вижу есть какие то ошибки в логе смарта, в других дисках такого нету =/ ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.03.2011, 15:50 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
рейд так и не успел перестроится - серв снова завис. в течение следующих 2-3 часов он вис раза 3. После чего я решил вынуть проблемный диск. После этого, запустившись с <S> - т.е. проигнорировав разрушенный рейд (разрйшенный рейд 10 - не системный), я загрузился. после загрузки я вообще припух - такое ощущение, что я загрузился в какую то другую ОС - чистый линух, а все мои настройки спрашивается - куда дели ? в итоге - имею чистый линух без каких либо настроек, програм. дирректория /etc имеет дефолтные настройки, программ, которые ставил ранее нет. Сети соотвественно тоже нет потому что interfaces чистый (в нем тупо описан один eth0 причем через dchp, хотя на машине две сетевых, и оба ip заданы вручную были. Сейчас попробую поднять его с монитора/клавы, посмотреть куда все делось . Предыдущая система стояла на рейде 1 mdadm, эта - судя по mount стоит на ней же... еще вопрос - бывает ли сетевая версия KVM ? т.е. задача- подключить клаву и монитор с другого компа через сеть непосредственно в разъемы сера? сеть гигабитная. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.03.2011, 19:25 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
еще пока помню: в одной из предпоследних (уже после первого зависания, но до краша) при попытке что либо записать на диск выдавало "read only filesystem". я пенял это не ребилд рейда 10, но похожу что то тут не так чисто как кажеца ( ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.03.2011, 19:59 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
Aklin, ну, cудя по Reallocated_Sector_Count sdh и sdg - уже были потенциальными мертвецами еще в 15:47. дальше у тебя ниче не понятно. kvm бывает всякий, но для домашнего использования дороговато. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.03.2011, 20:10 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
netwindAklin, ну, cудя по Reallocated_Sector_Count sdh и sdg - уже были потенциальными мертвецами еще в 15:47. дальше у тебя ниче не понятно. kvm бывает всякий, но для домашнего использования дороговато. Reallocated_Sector_Count - в каждом диске pre-failed. так что получается - что все диски разом упали? вообще ВСЕ? как это вообще возможно? и откуда взялась чистая система? после одного из ребутов вместо ОС образовалась система чистая - будто ее только что установили =/ ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.03.2011, 20:42 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
AklinnetwindAklin, ну, cудя по Reallocated_Sector_Count sdh и sdg - уже были потенциальными мертвецами еще в 15:47. дальше у тебя ниче не понятно. kvm бывает всякий, но для домашнего использования дороговато. Reallocated_Sector_Count - в каждом диске pre-failed. так что получается - что все диски разом упали? вообще ВСЕ? это тип счетчика,а не диагноз. pre-failed означает что изменение этого счетчика ниже критической отметки прогнозирует ошибку наверняка. old age - просто меняются со временем. диагноз ставят когда счетчик типа pre-failed уменьшается ниже своей границы THRESH. Но на самом деле, админы-перестраховщики меняют диски при наличии хотя бы одного relocated sector count подсмотренного в raw value. Датацентр можно убедить поменять диск, по моему опыту, где то от 20 секторов. как это вообще возможно? и откуда взялась чистая система? после одного из ребутов вместо ОС образовалась система чистая - будто ее только что установили =/ Откуда-нибудь. Подозреваю такой сценарий, но все может быть по-разному : 1. ты изначально поставил чистую систему 2. построил raid10. прилепил /var или /etc или что там у тебя "пропало" на эти диски. 3. raid разрушился/винты отвалились и старые каталоги, которые были скрыты монтированием поверх вдруг всплыли. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.03.2011, 21:28 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
netwindОткуда-нибудь. Подозреваю такой сценарий, но все может быть по-разному : 1. ты изначально поставил чистую систему 2. построил raid10. прилепил /var или /etc или что там у тебя "пропало" на эти диски. 3. raid разрушился/винты отвалились и старые каталоги, которые были скрыты монтированием поверх вдруг всплыли. система стояла на двух дисках в raid1. В отдельный раздел был вынесен только /boot - остальное было на одном разделе. /home чиста (папки юзеров есть и все!), /etc - настройки как после инсталятора. корневая фс на том же рейде - вот что тупо. как такое возможно - понять не могу. единственный вариант - очень тупой до безобразия. когда после инсталла рейд-1 системный перестал работать, ОС сидела на одном диске массива, а другой был чист. и в какой то момент что то сбойнуло прошел ресинк и поверх новой ОС наложилась старая. но после найтроки и установки всех прог был как минимум один ресинк рейда =/ ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.03.2011, 21:48 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
еще наблюдение - /mnt не изменилось =/ я теперь вообще ничего не понимаю ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.03.2011, 00:03 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
похоже я нашел куда все убежали ) мего крутая на первый взгляд штука "а довайте по юидам монтировать" на практике рано или поздно но всегда упирается в "пилять почему у меня юиды одинаковые!". В итоге оказалось, что вот этот проблемный диск - при каком то из тестов перенял юид рейда корневого, в итоге монировалось (еще с бута) на него, но все монтировщики писали, что смонтировано на рейд. стоило мне его отключить - тут же вылез корневой рейд с чистой ОС. осталось понять 1) почему ФС на умирающем харде ридонли 2) как ее перенести на рейд 3) как на рейде сделать ее врайтэбл... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.03.2011, 01:11 |
|
||
|
Подвисает система ?
|
|||
|---|---|---|---|
|
#18+
восстановил систему - все встало нормально (тупо копирнул ФС через tar) что интересно - до падения munin показывал желтым два диска - один тот который выпал, второй - 2т сиагейт. всего два сиагейта, один на гарантии другой нет. и скорее всего желтым - тот который на гарантии =/ впрынципе он в рейде 5 и есть запасной диск, так что если не ступлю, то восстановится все пучком ) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.03.2011, 00:55 |
|
||
|
|

start [/forum/topic.php?all=1&fid=25&tid=1484376]: |
0ms |
get settings: |
10ms |
get forum list: |
16ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
165ms |
get topic data: |
12ms |
get forum data: |
3ms |
get page messages: |
89ms |
get tp. blocked users: |
1ms |
| others: | 238ms |
| total: | 542ms |

| 0 / 0 |
