Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Unix-системы [игнор отключен] [закрыт для гостей] / Error Block on SCSI disk / 10 сообщений из 10, страница 1 из 1
19.09.2007, 08:51:17
    #34809967
Isaev
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Error Block on SCSI disk
Всем привет!
Возникла следующая проблема:
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
102.
103.
104.
105.
106.
bash- 2 . 03 # uname -a
SunOS sfv240  5 . 8  Generic_117000- 03  sun4u sparc SUNW,Sun-Fire-V240
bash- 2 . 03 #
bash- 2 . 03 # dmesg

Wed Sep  19   09 : 59 : 40  YEKST  2007 
Sep  14   07 : 38 : 57  sfv240 scsi: [ID  107833  kern.notice]    Requested Block:  68800                      Error Block:  68800 
Sep  14   07 : 38 : 57  sfv240 scsi: [ID  107833  kern.notice]    Vendor: FUJITSU                            Serial Number: 0349Q06JTR 
Sep  14   07 : 38 : 57  sfv240 scsi: [ID  107833  kern.notice]    Sense Key: Media Error
Sep  14   07 : 38 : 57  sfv240 scsi: [ID  107833  kern.notice]    ASC: 0x15 (<vendor unique code 0x15>), ASCQ: 0x1, FRU: 0x0
Sep  14   07 : 41 : 13  sfv240 scsi: [ID  107833  kern.warning] WARNING: /pci@1d, 700000 /pci@ 1 /scsi@ 4 /sd@ 1 , 0  (sd32):
Sep  14   07 : 41 : 13  sfv240  Error for Command: read                    Error Level: Retryable
Sep  14   07 : 41 : 13  sfv240 scsi: [ID  107833  kern.notice]    Requested Block:  68960                      Error Block:  68960 
Sep  14   07 : 41 : 13  sfv240 scsi: [ID  107833  kern.notice]    Vendor: FUJITSU                            Serial Number: 0349Q06JTR 
Sep  14   07 : 41 : 13  sfv240 scsi: [ID  107833  kern.notice]    Sense Key: Media Error
Sep  14   07 : 41 : 13  sfv240 scsi: [ID  107833  kern.notice]    ASC: 0x15 (<vendor unique code 0x15>), ASCQ: 0x1, FRU: 0x0
...
bash- 2 . 03 # ls -l /dev/* | grep /pci@1d, 700000 /pci@ 1 /scsi@ 4 /sd@ 1 , 0 
lrwxrwxrwx    1  root     root           49  Apr  12    2004  c3t1d0s0 -> ../../devices/pci@1d, 700000 /pci@ 1 /scsi@ 4 /sd@ 1 , 0 :a
...
bash- 2 . 03 # metastat
...
d60: Mirror
    Submirror  0 : d61
      State: Okay
    Submirror  1 : d62
      State: Needs maintenance
    Pass:  1 
    Read option: roundrobin (default)
    Write option: parallel (default)
    Size:  143349312  blocks

d61: Submirror of d60
    State: Okay
    Size:  143349312  blocks
    Stripe  0 :
        Device              Start Block  Dbase State        Hot Spare
        c1t1d0s0                    0      No    Okay


d62: Submirror of d60
    State: Needs maintenance
    Invoke: metareplace d60 c3t1d0s0 <new device>
    Size:  143349312  blocks
    Stripe  0 :
        Device              Start Block  Dbase State        Hot Spare
        c3t1d0s0                    0      No    Maintenance


bash- 2 . 03 #
bash- 2 . 03 # format
Searching for disks...done


AVAILABLE DISK SELECTIONS:
        0 . c1t0d0 <SUN36G cyl  24620  alt  2  hd  27  sec  107 >
          /pci@1c, 600000 /scsi@ 2 /sd@ 0 , 0 
        1 . c1t1d0 <SUN72G cyl  14087  alt  2  hd  24  sec  424 >
          /pci@1c, 600000 /scsi@ 2 /sd@ 1 , 0 
        2 . c3t0d0 <SUN36G cyl  24620  alt  2  hd  27  sec  107 >
          /pci@1d, 700000 /pci@ 1 /scsi@ 4 /sd@ 0 , 0 
        3 . c3t1d0 <SUN72G cyl  14087  alt  2  hd  24  sec  424 >
          /pci@1d, 700000 /pci@ 1 /scsi@ 4 /sd@ 1 , 0 
Specify disk (enter its number):  3 
selecting c3t1d0
[disk formatted]


FORMAT MENU:
        disk       - select a disk
        type       - select (define) a disk type
        partition  - select (define) a partition table
        current    - describe the current disk
        format     - format and analyze the disk
        repair     - repair a defective sector
        label      - write label to the disk
        analyze    - surface analysis
        defect     - defect list management
        backup     - search for backup labels
        verify     - read and display labels
        save       - save new disk/partition definitions
        inquiry    - show vendor, product and revision
        volname    - set  8 -character volume name
        !<cmd>     - execute <cmd>, then return
        quit
format> defect


DEFECT MENU:
        primary  - extract manufacturer's defect list
        grown    - extract the grown defects list
        both     - extract both primary and grown defects lists
        print    - display defect list
        dump     - dump defect list to file
        !<cmd>   - execute <cmd>, then return
        quit
defect> grown
Extracting grown defects list...Extraction complete.
Defect List has a total of  0  defects.

defect> both
Extracting both primary and grown defects lists...Extraction complete.
Defect List has a total of  1275  defects.

defect>


Я так понимаю винт отжил своё?

Пробовал разбить\собрать зеркало, после удачной синхранизации подзеркал метастат говорил что всё Ок, но dmesg валит ошибки...
Можно ли как-то пометить сбойные сектора и реанимировать диск для использования в качесте подзеркала на тестовом стенде? Имеет ли смысл вообще замарачиваться с этим диском?
...
Рейтинг: 0 / 0
19.09.2007, 09:34:22
    #34810045
Isaev
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Error Block on SCSI disk
IsaevМожно ли как-то пометить сбойные сектора и реанимировать диск для использования в качесте подзеркала на тестовом стенде? Имеет ли смысл вообще замарачиваться с этим диском?
конечно же отдельного раздела, хотя была идея с тестового стенда снять такой же винт разбив зеркало и заюзать его на продуктиве, а этот реанимировать, после подсунуть на тестовый стенд и собрать зеркало без потери данных. Но так, к сожалению, не получится...
Но остальные вопросы в силе...
...
Рейтинг: 0 / 0
19.09.2007, 10:09:23
    #34810156
landy
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Error Block on SCSI disk
А диск насколько старый? Лет 5 ему или как? Если достаточно старый, то обычно я пробовал его инитить(в контроллере команда была такая) - т е заново перепрописывались метки секторов.
Т е метки создаются при инициализации, а потом только читаются, ну и соответственно от времени размагничиваются.
Т е попробовать его проинитить на низком уровне - обычно помогало ...
...
Рейтинг: 0 / 0
19.09.2007, 14:49:06
    #34811497
Isaev
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Error Block on SCSI disk
landyА диск насколько старый? Лет 5 ему или как?
Да, диск юзался около 5 лет.
landy
Если достаточно старый, то обычно я пробовал его инитить(в контроллере команда была такая) - т е заново перепрописывались метки секторов.
Т е метки создаются при инициализации, а потом только читаются, ну и соответственно от времени размагничиваются.
Т е попробовать его проинитить на низком уровне - обычно помогало ...

А вот тут поподробней, если можно.
...
Рейтинг: 0 / 0
19.09.2007, 15:09:40
    #34811558
landy
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Error Block on SCSI disk
На alpha у нас стояли контроллеры Mylex. У них был свой биос, при загрузке можно было войти в меню контроллера и скажем собрать raid-1, 5 и т п, сбросить failed disk в operational режим
Кроме того было две команды format и initalize. Одна из них - низкоуровневое форматирование - т е фактически кроме прописывания области под данные в размеченном секторе, перепрописывались еще и служебные области сектора - метки и т п
После того как диск использовался в работе, эти служебные области обычно используются только для чтения. Со временем теряется намагниченность и как результат - ошибки чтения(сектор не может быть идентифицирован и т п)
Если мне не изменяет память подобная команда была на MA-8000, но на стойках MSA-1000 я уже не видел такого(может плохо искал)
Еще если мне не изменяет память такой режим был на контроллерах AHA1520/AHA2690.
Хотя за последнее не ручаюсь
...
Рейтинг: 0 / 0
19.09.2007, 15:46:11
    #34811716
landy
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Error Block on SCSI disk
Команда format в меню предыдущих постов - на вашем контроллере может она именно это и делает(в смысле инитит диск на низком уровне)?
...
Рейтинг: 0 / 0
19.09.2007, 20:42:06
    #34812684
Scott Tiger
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Error Block on SCSI disk
IsaevДа, диск юзался около 5 лет.

Пора уже :) Попробуй format -> analyze, если после этого продолжат сыпаться ошибки на других секторах, тогда точно пора.
...
Рейтинг: 0 / 0
25.09.2007, 08:07:13
    #34823066
Isaev
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Error Block on SCSI disk
landyНа alpha у нас стояли контроллеры Mylex. У них был свой биос, при загрузке можно было войти в меню контроллера и скажем собрать raid-1, 5 и т п, сбросить failed disk в operational режим
Кроме того было две команды format и initalize. Одна из них - низкоуровневое форматирование - т е фактически кроме прописывания области под данные в размеченном секторе, перепрописывались еще и служебные области сектора - метки и т п
После того как диск использовался в работе, эти служебные области обычно используются только для чтения. Со временем теряется намагниченность и как результат - ошибки чтения(сектор не может быть идентифицирован и т п)
Если мне не изменяет память подобная команда была на MA-8000, но на стойках MSA-1000 я уже не видел такого(может плохо искал)
Еще если мне не изменяет память такой режим был на контроллерах AHA1520/AHA2690.
Хотя за последнее не ручаюсь
Контроллер на этом сервачке глупенький, данный вариант к сожалению не подойдёт, в любом случае сенкс за ответ.
Scott Tiger IsaevДа, диск юзался около 5 лет.

Пора уже :)
Юзался, но как-то по-доброму что ли, не в полную силу... :-)
Scott Tiger
Попробуй format -> analyze, если после этого продолжат сыпаться ошибки на других секторах, тогда точно пора.

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
bash- 2 . 03 # format
Searching for disks...done


AVAILABLE DISK SELECTIONS:
        0 . c1t0d0 <SUN36G cyl  24620  alt  2  hd  27  sec  107 >
          /pci@1c, 600000 /scsi@ 2 /sd@ 0 , 0 
        1 . c1t1d0 <SUN72G cyl  14087  alt  2  hd  24  sec  424 >
          /pci@1c, 600000 /scsi@ 2 /sd@ 1 , 0 
        2 . c3t0d0 <SUN36G cyl  24620  alt  2  hd  27  sec  107 >
          /pci@1d, 700000 /pci@ 1 /scsi@ 4 /sd@ 0 , 0 
        3 . c3t1d0 <SUN72G cyl  14087  alt  2  hd  24  sec  424 >
          /pci@1d, 700000 /pci@ 1 /scsi@ 4 /sd@ 1 , 0 
Specify disk (enter its number):  3 
selecting c3t1d0
[disk formatted]


FORMAT MENU:
        disk       - select a disk
        type       - select (define) a disk type
        partition  - select (define) a partition table
        current    - describe the current disk
        format     - format and analyze the disk
        repair     - repair a defective sector
        label      - write label to the disk
        analyze    - surface analysis
        defect     - defect list management
        backup     - search for backup labels
        verify     - read and display labels
        save       - save new disk/partition definitions
        inquiry    - show vendor, product and revision
        volname    - set  8 -character volume name
        !<cmd>     - execute <cmd>, then return
        quit
format> analyze


ANALYZE MENU:
        read     - read only test   (doesn't harm SunOS)
        refresh  - read then write  (doesn't harm data)
        test     - pattern testing  (doesn't harm data)
        write    - write then read      (corrupts data)
        compare  - write, read, compare (corrupts data)
        purge    - write, read, write   (corrupts data)
        verify   - write entire disk, then verify (corrupts data)
        print    - display data buffer
        setup    - set analysis parameters
        config   - show analysis parameters
        !<cmd>   - execute <cmd> , then return
        quit
analyze> compare
Ready to analyze (will corrupt data). This takes a long time,
but is interruptable with CTRL-C. Continue? y

        pass  0  - pattern = 0xc6dec6de
    14086 / 23 / 304 

        pass  1  - pattern = 0x6db6db6d
    14086 / 23 / 304 

Total of  0  defective blocks repaired.
analyze> verify
Ready to verify (will corrupt data). This takes a long time,
but is interruptable with CTRL-C. Continue? y

        pass  0 
    14086 / 23 / 304 

        pass  1 
    14086 / 23 / 304 

Total of  0  defective blocks repaired.
analyze> q


FORMAT MENU:
        disk       - select a disk
        type       - select (define) a disk type
        partition  - select (define) a partition table
        current    - describe the current disk
        format     - format and analyze the disk
        repair     - repair a defective sector
        label      - write label to the disk
        analyze    - surface analysis
        defect     - defect list management
        backup     - search for backup labels
        verify     - read and display labels
        save       - save new disk/partition definitions
        inquiry    - show vendor, product and revision
        volname    - set  8 -character volume name
        !<cmd>     - execute <cmd>, then return
        quit
format> q
bash- 2 . 03 # iostat -E
...
sd32     Soft Errors:  51  Hard Errors:  127  Transport Errors:  8 
Vendor: FUJITSU  Product: MAP3735N SUN72G  Revision:  0401  Serial No: 00Q06JTR
Size:  73 .40GB < 73400057856  bytes>
Media Error:  125  Device Not Ready:  0  No Device:  2  Recoverable:  51 
Illegal Request:  0  Predictive Failure Analysis:  2 
bash- 2 . 03 #
Видимо придется распрощаться с этим винтом (от греха подальше...).
...
Рейтинг: 0 / 0
25.09.2007, 11:52:50
    #34823766
landy
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Error Block on SCSI disk
Да не analyze, а format в меню format
analyze - пишет/читает в тело размеченного сектора, т е метки только читаются
format - ихмо полностью перепрописывает и метки сектора и тело под данные в секторе
...
Рейтинг: 0 / 0
25.09.2007, 14:51:58
    #34824689
Isaev
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Error Block on SCSI disk
landyДа не analyze, а format в меню format
analyze - пишет/читает в тело размеченного сектора, т е метки только читаются
format - ихмо полностью перепрописывает и метки сектора и тело под данные в секторе
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
102.
103.
bash- 2 . 03 # metadetach -f d60 d62
d60: submirror d62 is detached
bash- 2 . 03 # metastat
...
d60: Mirror
    Submirror  0 : d61
      State: Okay
    Pass:  1 
    Read option: roundrobin (default)
    Write option: parallel (default)
    Size:  143349312  blocks

d61: Submirror of d60
    State: Okay
    Size:  143349312  blocks
    Stripe  0 :
        Device              Start Block  Dbase State        Hot Spare
        c1t1d0s0                    0      No    Okay


d62: Concat/Stripe
    Size:  143349312  blocks
    Stripe  0 :
        Device              Start Block  Dbase
        c3t1d0s0                    0      No

bash- 2 . 03 # 
bash- 2 . 03 # metaclear d62
d62: Concat/Stripe is cleared
bash- 2 . 03 # metastat
...
d60: Mirror
    Submirror  0 : d61
      State: Okay
    Pass:  1 
    Read option: roundrobin (default)
    Write option: parallel (default)
    Size:  143349312  blocks

d61: Submirror of d60
    State: Okay
    Size:  143349312  blocks
    Stripe  0 :
        Device              Start Block  Dbase State        Hot Spare
        c1t1d0s0                    0      No    Okay

bash- 2 . 03 # format
Searching for disks...done


AVAILABLE DISK SELECTIONS:
        0 . c1t0d0 <SUN36G cyl  24620  alt  2  hd  27  sec  107 >
          /pci@1c, 600000 /scsi@ 2 /sd@ 0 , 0 
        1 . c1t1d0 <SUN72G cyl  14087  alt  2  hd  24  sec  424 >
          /pci@1c, 600000 /scsi@ 2 /sd@ 1 , 0 
        2 . c3t0d0 <SUN36G cyl  24620  alt  2  hd  27  sec  107 >
          /pci@1d, 700000 /pci@ 1 /scsi@ 4 /sd@ 0 , 0 
        3 . c3t1d0 <SUN72G cyl  14087  alt  2  hd  24  sec  424 >
          /pci@1d, 700000 /pci@ 1 /scsi@ 4 /sd@ 1 , 0 
Specify disk (enter its number):  3 
selecting c3t1d0
[disk formatted]


FORMAT MENU:
        disk       - select a disk
        type       - select (define) a disk type
        partition  - select (define) a partition table
        current    - describe the current disk
        format     - format and analyze the disk
        repair     - repair a defective sector
        label      - write label to the disk
        analyze    - surface analysis
        defect     - defect list management
        backup     - search for backup labels
        verify     - read and display labels
        save       - save new disk/partition definitions
        inquiry    - show vendor, product and revision
        volname    - set  8 -character volume name
        !<cmd>     - execute <cmd>, then return
        quit
format> format
Ready to format.  Formatting cannot be interrupted
and takes  169  minutes (estimated). Continue? y
Beginning format. The current time is Tue Sep  25   16 : 37 : 29   2007 

Formatting...
Format failed

Retry of formatting operation without any of the standard
mode selects and ignoring disk's Grown Defects list.  The
disk may be able to be reformatted this way if an earlier
formatting operation was interrupted by a power failure or
SCSI bus reset.  The Grown Defects list will be recreated
by format verification and surface analysis.

Retry format without mode selects and Grown Defects list? y
Formatting...
Medium error during format
ASC: 0xc   ASCQ: 0x80
failed
format>

...
Рейтинг: 0 / 0
Форумы / Unix-системы [игнор отключен] [закрыт для гостей] / Error Block on SCSI disk / 10 сообщений из 10, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]