Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Unix-системы [игнор отключен] [закрыт для гостей] / solaris 9 on v480 "зависает" / 8 сообщений из 8, страница 1 из 1
21.08.2007, 12:45:40
    #34741303
х.з.
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
solaris 9 on v480 "зависает"
Обнаружилась интересная проблемка. Во время работы на сервере (ssh, mc) консолька как будто "засыпает". Через некоторое время все восстанавливается.

Причем довольно регулярно - за 5 мин. 2 раза точно было.

запустил на соседней консоли mpstat 5 (шпарил без зависаний):
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
CPU minf mjf xcal  intr ithr  csw icsw migr smtx  srw syscl  usr sys  wt idl
  0    0   0    9    59    2   69    0    2    2    0    48    0   1  99   0
  1    0   0    2    46   43   52    0    2    0    0    24    0   0 100   0
  2    0   0    2     7    4   70    0    3    2    0    28    0   0 100   0
  3    0   0    1   228  126   22    0    0    1    0    16    0   0 100   0
CPU minf mjf xcal  intr ithr  csw icsw migr smtx  srw syscl  usr sys  wt idl
  0    0   0    9    39    1   59    0    2    0    0    17    0   0 100   0
  1    0   0   10    11    9   55    0    2    1    0    23    0   0 100   0
  2    0   0    1     5    3   60    0    3    1    0     9    0   0 100   0
  3    0   0    2   229  126   16    0    0    1    0     7    0   0 100   0
CPU minf mjf xcal  intr ithr  csw icsw migr smtx  srw syscl  usr sys  wt idl
  0    0   0    9    40    1   48    0    1    1    0     7    0   0 100   0
  1    0   0    3    20   17   60    0    3    2    0    13    0   0 100   0
  2    0   0   30     5    3   57    0    2    2    0    48    0   0 100   0
  3    0   0    1   226  124   20    0    0    1    0     7    0   0 100   0
CPU minf mjf xcal  intr ithr  csw icsw migr smtx  srw syscl  usr sys  wt idl
  0    0   0   28    23    1   57    0    2    0    0    28    0   0 100   0
  1    0   0    1    37   34   59    0    2    1    0    19    0   0 100   0
  2    0   0    3     4    2   63    0    3    1    0    16    0   0 100   0
  3    0   0    1   229  126   16    0    0    1    0     8    0   0 100   0
CPU minf mjf xcal  intr ithr  csw icsw migr smtx  srw syscl  usr sys  wt idl
  0    0   0    9    40    1   48    0    2    0    0    23    0   0 100   0
  1    0   0    3    20   17   71    0    2    1    0    20    0   0 100   0
  2    0   0    1     5    3   48    0    2    2    0    10    0   0 100   0
  3    0   0    1   227  124   22    0    0    1    0     9    0   0 100   0
CPU minf mjf xcal  intr ithr  csw icsw migr smtx  srw syscl  usr sys  wt idl
  0   57   1  135  2186    1  265    3    9   26    0   177    3   1  51  45
  1    1   0  167   295  233  169    1   10   43    0   143    0   4  60  36
  2   31   1   33    85   80  217    3   11   25    0   383    1   1  56  41
  3  118   1  194   253  150  293    1    8   45    0   363    0   1  65  33
CPU minf mjf xcal  intr ithr  csw icsw migr smtx  srw syscl  usr sys  wt idl
  0    0   0    1    97    1   64    0    1    0    0    61    0   0   1  98
  1    0   0   10    54   47   87    0    1    1    0     6    0   0   0 100
  2    0   0   18    14   11   65    0    2    2    0    41    0   0   2  98
  3    0   0    1   227  125   24    0    0    2    0   242    1   0   1  98
Это уже конец, когда все развислось. А так видил как набирались 100 ожидания на каждом проце. То бишь четко видно 2 проца, затем 3 и 4. затем все развисается.

посмотрел логи:
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
Aug 18 00:02:00 hera md_stripe: [ID 641072 kern.warning] WARNING: md: d22: read
error on /dev/dsk/c1t1d0s6
Aug 18 00:02:00 hera md_mirror: [ID 842313 kern.info] NOTICE: md: d22: B_FAILFAS
T I/O retry
Aug 18 00:02:00 hera md_mirror: [ID 726726 kern.info] NOTICE: md: d21: spurious
error; B_FAILFAST I/O retry succeeded
Aug 18 00:02:00 hera md_mirror: [ID 726726 kern.info] NOTICE: md: d22: spurious
error; B_FAILFAST I/O retry succeeded
Aug 18 00:02:00 hera md: [ID 680156 kern.info] NOTICE: md: d22: B_FAILFAST I/O r
etry, 2 buf(s) dequeued
но это не свежее. metastat ошибок не выдал.

Работает sar, но боюсь с его 20 мин. интервалом ничего не выудить.

Подскажите направление,куда смотреть. Что-то сразу не соображу. Есть мысля мож по irq в системе чего конфликтует?

К серверу подключен 3310 jbod. Но есть еще один такой же сервер, там таких проблем не наблюдается.
...
Рейтинг: 0 / 0
21.08.2007, 13:53:44
    #34741640
Боб
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
solaris 9 on v480 "зависает"
Похоже, проблемы с диском c1t1d0s6, на котором возникают ошибки чтения (их не должно быть на нормально работающем диске).
Попробуйте протестировать диск format > analyze > read
Если read test выдаст ошибку, значит диск нужно менять.
Для надежности лучше прогнать read test несколько раз (если ошибки не появятся при первом же запуске).
...
Рейтинг: 0 / 0
21.08.2007, 14:58:06
    #34741938
х.з.
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
solaris 9 on v480 "зависает"
даже несмотря на то что проблемы были 18 числа, а тормозит сегодня?
...
Рейтинг: 0 / 0
21.08.2007, 15:10:27
    #34741983
Боб
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
solaris 9 on v480 "зависает"
Возможно, тормозит не из-за этого. Но диск я бы проверил в любом случае, т.к. проблемы с ним могут потом проявиться.
Есть ли какие-то сообщения об ошибках в /var/adm/messages?
...
Рейтинг: 0 / 0
22.08.2007, 07:05:02
    #34743470
х.з.
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
solaris 9 on v480 "зависает"
БобЕсть ли какие-то сообщения об ошибках в /var/adm/messages?
авторпосмотрел логи:
диск я посмотрю, но хотелось бы направление движении узнать (по поводу тормозов)
...
Рейтинг: 0 / 0
22.08.2007, 12:24:34
    #34744405
Scott Tiger
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
solaris 9 on v480 "зависает"
iostat -nxTd 1
truss -faelp то, что висит (а висит, видимо, то, что на IO завязано)
vmstat 3 100, захватывая висение и невисение

...'Cause there's nothin' strange about an axe with bloodstains in the barn,
There's always some killin' you got to do around the farm...
...
Рейтинг: 0 / 0
23.08.2007, 10:05:44
    #34746567
х.з.
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
solaris 9 on v480 "зависает"
проблему локализовал - жесткий диск.
Но как -то странно. пробемлема не с bad block. Смотрел в format, новых после заводского в дефект лист не добавилось. Вот что "вымучил":

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
format> cur
> > Current Disk = c1t1d0: fcal-mir
> > <SUN72G cyl 14087 alt 2 hd 24 sec 424> 
> > /pci@9,600000/SUNW,qlc@2/fp@0,0/ssd@w500000e01080a051,0
> >  
> > format> ana
> >  
> >
> > ANALYZE MENU:
> >         read     - read only test   (doesn't harm SunOS)
> >         refresh  - read then write  (doesn't harm data)
> >         test     - pattern testing  (doesn't harm data)
> >         write    - write then read      (corrupts data)
> >         compare  - write, read, compare (corrupts data)
> >         purge    - write, read, write   (corrupts data)
> >         verify   - write entire disk, then verify (corrupts data)
> >         print    - display data buffer
> >         setup    - set analysis parameters
> >         config   - show analysis parameters
> >         !<cmd>   - execute <cmd> , then return
> >         quit
> > analyze> rea
> > Ready to analyze (won't harm SunOS). This takes a long time, but is 
> > interruptable with CTRL-C. Continue? y
> >  
> >         pass 0
> >    34/22/8
> >  
> > Warning:Drive may be reserved or has been removed, aborting surface 
> > analysis.
> > analyze> ref
> > Ready to analyze (won't harm data). This takes a long time, but is 
> > interruptable with CTRL-C. Continue? y
> >  
> >         pass 0
> >    0/3/366
> >  
> > Warning:Drive may be reserved or has been removed, aborting surface 
> > analysis.
похоже что девайс как-то "отваливается" время от времени. Нужно конечно искать диск на замену, но есть подозрение что дело в контактах, шлейфе...

Что скажите?
...
Рейтинг: 0 / 0
24.08.2007, 07:57:00
    #34749590
Боб
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
solaris 9 on v480 "зависает"
Если есть гарантия или сервис - обращайтесь в техподдержку.
Если нет, то попробуйте достать диск и через некоторое время установить обратно.
Потом придется восстанавливать метаустройства. Если не сможете этого сделать, диск лучше не доставать.
Вообще, такие операции без сервисных инженеров лучше не проводить.
...
Рейтинг: 0 / 0
Форумы / Unix-системы [игнор отключен] [закрыт для гостей] / solaris 9 on v480 "зависает" / 8 сообщений из 8, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]