|
Проблемы с RAID
|
|||
---|---|---|---|
#18+
Доброе время суток. Проблемы с диском в RAID-массиве. (Intel Embedded Raid 2). Некоторое время назад(в основном 2 недели) возникли проблемы с диском (SATA WD2001FASS, слот 2). Конкретно, в системном журнале Windows стали появляться сообщения PD Predictive Failure 0:2. В Intel WEB RAID Console 2 стал расти счетчик Pred Fail Count. По совету техподдержки была произведен горячая замена диска. (Вчера, в 11часов местного времени). Диск был переведен в Offline, заменен с передней панели и поставлен в Rebuild. Сервер не останавливали, работал через WEB Console 2. С тех пор диск до сих пор находится в Ребилде (на 12 часов сегодняшнего дня 25%), Pred Fail Count продолжает расти, появилось новое сообщение Predictive Failure 0:2. Кто, сталкивался с чем-либо подобным, помогите. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.11.2010, 11:36 |
|
Проблемы с RAID
|
|||
---|---|---|---|
#18+
Ждать до завершения P.S. Бекапов, конечно, нет. Действительно, зачем они ? ... |
|||
:
Нравится:
Не нравится:
|
|||
07.11.2010, 14:35 |
|
Проблемы с RAID
|
|||
---|---|---|---|
#18+
Обижаете. Бэкап сделан и проверен. Что ребилд прерывать нельзя - в курсе. Да и система работает на фоне ребилда почти нормально, только тормозит. Вопрос в другом: Один из физических дисков зеркала (2 зеркала по 2 физ. диска) дает рост предиктивных ошибок и еле шевелится на ребилде. Остальные работают как часы. Раньше думал, что плохой диск. Сменил диск на горячую - то же самое. Где копать? ... |
|||
:
Нравится:
Не нравится:
|
|||
08.11.2010, 07:07 |
|
Проблемы с RAID
|
|||
---|---|---|---|
#18+
goon Один из физических дисков зеркала (2 зеркала по 2 физ. диска) дает рост предиктивных ошибок и еле шевелится на ребилде. Остальные работают как часы. Раньше думал, что плохой диск. Сменил диск на горячую - то же самое. Где копать? Шнурок поменяй ... |
|||
:
Нравится:
Не нравится:
|
|||
08.11.2010, 10:07 |
|
Проблемы с RAID
|
|||
---|---|---|---|
#18+
Именно тот диск смненили, которыйц необходимо? ... |
|||
:
Нравится:
Не нравится:
|
|||
08.11.2010, 11:50 |
|
Проблемы с RAID
|
|||
---|---|---|---|
#18+
Вроде этот. Предварительно поморгал им на передней панели корзины. (Операция Start - stop Location drive). ... |
|||
:
Нравится:
Не нравится:
|
|||
08.11.2010, 12:18 |
|
Проблемы с RAID
|
|||
---|---|---|---|
#18+
Последний пост (насчет неверного диска) нашел неожиданное продолжение. Решил поморгать индикаторами хотсвап-дисков на корзине. Запускал LOCATE DRIVE в RAID WEB CONSOLE II последовательно для номерв физических дисков с первого по четвертый. Обнаружилось неверное отображение номера физического диска с консоли на слот передней панели. Так диск физ. 4 на консоли моргал пустым (без диска) слотом. Следовательно, я сменил не тот диск. Вопрос: Каким средством управлять RAID, поскольку RWC II работает неверно. Как точно найти дефектный диск? ... |
|||
:
Нравится:
Не нравится:
|
|||
11.11.2010, 09:12 |
|
Проблемы с RAID
|
|||
---|---|---|---|
#18+
goonПоследний пост (насчет неверного диска) нашел неожиданное продолжение. Решил поморгать индикаторами хотсвап-дисков на корзине. Запускал LOCATE DRIVE в RAID WEB CONSOLE II последовательно для номерв физических дисков с первого по четвертый. Обнаружилось неверное отображение номера физического диска с консоли на слот передней панели. Так диск физ. 4 на консоли моргал пустым (без диска) слотом. Следовательно, я сменил не тот диск. Вопрос: Каким средством управлять RAID, поскольку RWC II работает неверно. Как точно найти дефектный диск? остановить сервер и воспользоваться родной тулзой контроллера, вшитой в него ... |
|||
:
Нравится:
Не нравится:
|
|||
11.11.2010, 10:47 |
|
Проблемы с RAID
|
|||
---|---|---|---|
#18+
А она (тулза) работает корректно в смысле нумерации слотов? (обжегшись на молоке, дую на воду...) ... |
|||
:
Нравится:
Не нравится:
|
|||
11.11.2010, 11:05 |
|
Проблемы с RAID
|
|||
---|---|---|---|
#18+
goonА она (тулза) работает корректно в смысле нумерации слотов? (обжегшись на молоке, дую на воду...) Конечно ! Она же сидит в самом контроллере, прямо на железе. ... |
|||
:
Нравится:
Не нравится:
|
|||
11.11.2010, 11:08 |
|
Проблемы с RAID
|
|||
---|---|---|---|
#18+
Плюс, до отключения сервера, я бы нашел в инете и тщательно почитал мануал на контроллер. А уже потом отключал. ... |
|||
:
Нравится:
Не нравится:
|
|||
11.11.2010, 11:09 |
|
Проблемы с RAID
|
|||
---|---|---|---|
#18+
Про то, что Web RAID Console имеет подобный глюк я краем глаза где-то в Сети видел, но считал, что на последних версиях его убрали. Выходит нет. Аналогичного средства без бага и без остановки сервера никто не знает? Неохота гадать на остановленном сервере. Ошибешься диском - и, в лучшем случае, система уйдет в ребилд на несколько суток, и на это время сервер будет недоступен. ... |
|||
:
Нравится:
Не нравится:
|
|||
11.11.2010, 13:53 |
|
Проблемы с RAID
|
|||
---|---|---|---|
#18+
goonПро то, что Web RAID Console имеет подобный глюк я краем глаза где-то в Сети видел, но считал, что на последних версиях его убрали. Выходит нет. Аналогичного средства без бага и без остановки сервера никто не знает? Неохота гадать на остановленном сервере. Ошибешься диском - и, в лучшем случае, система уйдет в ребилд на несколько суток, и на это время сервер будет недоступен. Будет доступен, только работать будет медленно. Насколько медленно - зависит от крутизны контроллера ... |
|||
:
Нравится:
Не нравится:
|
|||
11.11.2010, 14:19 |
|
Проблемы с RAID
|
|||
---|---|---|---|
#18+
goonПро то, что Web RAID Console имеет подобный глюк я краем глаза где-то в Сети видел, но считал, что на последних версиях его убрали. Выходит нет. Аналогичного средства без бага и без остановки сервера никто не знает? Неохота гадать на остановленном сервере. Ошибешься диском - и, в лучшем случае, система уйдет в ребилд на несколько суток, и на это время сервер будет недоступен. А кто мешает сделать копию? ... |
|||
:
Нравится:
Не нравится:
|
|||
11.11.2010, 15:58 |
|
Проблемы с RAID
|
|||
---|---|---|---|
#18+
Копию делаю всегда и проверяю на другом сервере. Однако проблема в том, что сбойный диск не обязательно засветится при перезагрузке. Ведь сейчас ребилд закончитлся и РАЙД вроде бы в норме. Только вот счетчик предиктивных ошибок все растет. Если его (сбойный диск) не распознать при остановке сервера, или заменить не тот диск - начнется авторебилд, причем данные будут писаться со сбойного диска на замененный здоровый. В результате райд просто развалится. Может быть, остановить сервер, вытаскивать диск за диском и просматривать какой-либо смотрелкой СМАРТ-таблиц? И менять тот, на котором есть явное повышение одного или нескольких значений СМАРТ-параметров? ... |
|||
:
Нравится:
Не нравится:
|
|||
11.11.2010, 16:48 |
|
Проблемы с RAID
|
|||
---|---|---|---|
#18+
goonКопию делаю всегда и проверяю на другом сервере. Однако проблема в том, что сбойный диск не обязательно засветится при перезагрузке. Ведь сейчас ребилд закончитлся и РАЙД вроде бы в норме. Только вот счетчик предиктивных ошибок все растет. Если его (сбойный диск) не распознать при остановке сервера, или заменить не тот диск - начнется авторебилд, причем данные будут писаться со сбойного диска на замененный здоровый. В результате райд просто развалится. Может быть, остановить сервер, вытаскивать диск за диском и просматривать какой-либо смотрелкой СМАРТ-таблиц? И менять тот, на котором есть явное повышение одного или нескольких значений СМАРТ-параметров? А может быть, это WEB Console глючит, и с дисками все в порядке ? ))) Слишком много "может". Мне кажется, что пора приступать к делу, а не гадать на кофейной гуще ))) ... |
|||
:
Нравится:
Не нравится:
|
|||
11.11.2010, 17:01 |
|
Проблемы с RAID
|
|||
---|---|---|---|
#18+
В любом случае под лежачий камень вода не течёт. ... |
|||
:
Нравится:
Не нравится:
|
|||
12.11.2010, 09:16 |
|
Проблемы с RAID
|
|||
---|---|---|---|
#18+
Ну вот проблема и решилась. Как и ожидалось, дело было в сбойном диске (WD2001FASS). Проблема была в том, что RAID WEB CONSOLE 2 (Удивительно глючная утилита) давала неверное отображение номера слота на консоли. Эта особенность осталась даже в последней версии 8.05.0400. То есть, при ребилде диска номер 2 на консоли, горел индикатор номер 3 на слоте корзины. Или, при операции SCAN DISK моргал не тот индикатор. Поэтому смена дисков производилась неверно. Была надежда на то, что в версии 2.19-00 отображались серийные номера дисков, то есть можно было просмотреть все диски при остановленном серваке и заменить по серийному номеру. Но в более поздних версиях эта возможность отсутствует, а этой версии у меня не было. Поэтому пришлось останавливать сервак, вытаскивать диск за диском и смотреть их SMART-просмотрщиком (SMARTUDM). Он и выявил некондицинный диск. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.11.2010, 09:44 |
|
|
start [/forum/topic.php?fid=30&msg=36949812&tid=1530903]: |
0ms |
get settings: |
12ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
42ms |
get topic data: |
10ms |
get forum data: |
3ms |
get page messages: |
54ms |
get tp. blocked users: |
1ms |
others: | 278ms |
total: | 422ms |
0 / 0 |