Гость
Форумы / Unix-системы [игнор отключен] [закрыт для гостей] / Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4 / 22 сообщений из 22, страница 1 из 1
13.12.2018, 11:27
    #39747221
westvovik
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4
Все работало отлично и вот в ноябре начались перезагрузки, сначала один раз в день, потом чаще.

Что я сделал:
1. Убрал все из /boot/loader.conf, остался только модуль gmirror
2. Убрал все из /etc/sysctl.conf
3. Тестировал память с помощью memtest86+ в разных режимах, ни одной ошибки не нашел.
4. Пробовал перезагрузиться в single режиме и проверял диски fsck, все ок.
5. По смарту диски проходят тесты SHORT И LONG, все ОК!
6. Стоит мониторинг munin, ничего странного на графиках нету, единственное что смущает раздел system statistic значение System Calls почемуто иногда по графику проседает в отрицательную сторону, вплоть до -1 000 000 per second , чтобы это могло значить? На других серверах у меня такого нету!
7. Посмотрел датчики ipmi все в норме, все напряжение в границах, датчики температуры показывают норму, хорошобы записать их статистику да нет на сервере модуля отдельного чтоб снять показания независимо от состояния ОС.

В логах сервера нет ничего, при подключении по KVM увидел мельком ошибку, что то там было про memory, но настолько быстро проскакивает что я не успеваю прочитать, просто не возможно.

Как можно получить ошибку, чтоб сервер не падал в перезагрузку, или куда мне копнуть еще, помогите SOS?

p.s. частота перезагрузок совершенно разная, никак не связана с нагрузкой на сервер, да ее и нет почти, вчера вот перезагружался почти каждые 2-5 минут, потом вроде отпустило и держался пол дня(((
...
Рейтинг: 0 / 0
13.12.2018, 11:43
    #39747243
Alex URS
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4
westvovik,

1. /var/log/ - что говорит система?
2. dmesg
...
Рейтинг: 0 / 0
13.12.2018, 12:10
    #39747276
westvovik
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4
Alex URS,

Там только лог загрузки сервера и все ничего странного

WARNING: /home was not properly dismounted
WARNING: /tmp was not properly dismounted
WARNING: /tmp: mount pending error: blocks 12640 files 0
WARNING: /usr was not properly dismounted
WARNING: /var was not properly dismounted

Ну это говорит что была резкая перезагрузка без размонтирования

Я уже 10 раз загружался в single и чистил разделы FSCK но при след перезагрузки опять тоже самое
...
Рейтинг: 0 / 0
13.12.2018, 12:18
    #39747288
westvovik
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4
Вот график перезагрузок за день и системная статистика, видно что совпадает проседания по system calls с перезагрузкой, чтобы это могло значить
...
Рейтинг: 0 / 0
13.12.2018, 12:31
    #39747296
Alex URS
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4
westvovik,

1. это VPS/VDS? если да, что в логах?
2. что говорит out-of-band контроллер (iLO, iDRAC, ThinkServer или подобное)? или это не сервер?
...
Рейтинг: 0 / 0
13.12.2018, 12:38
    #39747304
westvovik
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4
Alex URSwestvovik,

1. это VPS/VDS? если да, что в логах?
2. что говорит out-of-band контроллер (iLO, iDRAC, ThinkServer или подобное)? или это не сервер?


Это наш сервер, размещен в ДЦ INTEL S5520UR,
удаленное управление только через KVM есть,
отдельного интерфейса с сетевухой для управления на нем нет
...
Рейтинг: 0 / 0
13.12.2018, 13:25
    #39747338
Alex URS
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4
westvovik,

syscall отрицательный при write, но значением -1, и мне кажется, что -1000000 это не причина, а следствие
возможно отказ контроллера
какой RAID?
...
Рейтинг: 0 / 0
13.12.2018, 13:43
    #39747359
westvovik
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4
Alex URSwestvovik,

syscall отрицательный при write, но значением -1, и мне кажется, что -1000000 это не причина, а следствие
возможно отказ контроллера
какой RAID?

Там gmirror настроен на двух дисках SAS в зеркало
...
Рейтинг: 0 / 0
13.12.2018, 14:01
    #39747380
Alex URS
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4
westvovikAlex URSwestvovik,

syscall отрицательный при write, но значением -1, и мне кажется, что -1000000 это не причина, а следствие
возможно отказ контроллера
какой RAID?

Там gmirror настроен на двух дисках SAS в зеркало

и что показывает статус программного рейда?
...
Рейтинг: 0 / 0
13.12.2018, 14:06
    #39747385
westvovik
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4
Alex URSwestvovikпропущено...


Там gmirror настроен на двух дисках SAS в зеркало

и что показывает статус программного рейда?

После перезагрузки один диск падает в состояние STALE
Я делаю rebuild, диск пересобирается, синхронизируется и работает, до следующей перезагрузки и опять в STALE,
Даже если я не делаю rebuild и работает один диск, сервер все равно перезагружается, так что это не очень связанные вещи как я понимаю
...
Рейтинг: 0 / 0
13.12.2018, 14:11
    #39747387
Dimitry Sibiryakov
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4
westvovikДаже если я не делаю rebuild и работает один диск, сервер все равно перезагружается, так
что это не очень связанные вещи как я понимаю

Убери один из дисков из сервера физически. Симптомы напоминают те, что я видел при плохом
контакте в шлейфе питания.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
13.12.2018, 14:35
    #39747413
westvovik
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4
Dimitry SibiryakovwestvovikДаже если я не делаю rebuild и работает один диск, сервер все равно перезагружается, так
что это не очень связанные вещи как я понимаю

Убери один из дисков из сервера физически. Симптомы напоминают те, что я видел при плохом
контакте в шлейфе питания.


Знать бы какой диск убрать, а неужели реально могут быть плохой контакт у дисков которые в лотке вставляются в корпус и защелкиваются? Или в каком месте это может быть, там серверный корпус 1U?

Да и надо сказать в ДЦ все хорошо пыли нет нигде на комплектующих
...
Рейтинг: 0 / 0
13.12.2018, 14:43
    #39747419
Dimitry Sibiryakov
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4
westvovikЗнать бы какой диск убрать

Оба по очереди.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
13.12.2018, 18:03
    #39747575
Ivan_Pisarevsky
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4
Несколько месяцев назад пролечил похожие симптомы заменой БП.
westvovikнеужели реально могут быть плохой контакт у дисков которые в лотке вставляются в корпус и защелкиваются?могут. Наши на одном из серваков прямо на корпусе пометили одно из гнезд восьмидисковой корзины - т.к. в этом конкретном гнезде левые сбои дисков.
...
Рейтинг: 0 / 0
16.12.2018, 15:36
    #39748611
westvovik
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4
Я смог сделать принт скрин ошибки которая промелкивала

вот, похоже что это все же память как я понимаю?
...
Рейтинг: 0 / 0
17.12.2018, 09:07
    #39748787
Alex URS
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4
westvovik,


UNCOR PCC AC
приwestvovik...3. Тестировал память с помощью memtest86+ в разных режимах, ни одной ошибки не нашел....
возможно "приговор" для сервера, т.к. AC - это в твоём случае не модуль
но память на всякий случай передёрни...

PS
смотри порты, mcelog, оно гдето должно вылезти, не может быть, чтобы при ошибке контроллера памяти (не модуля) везде было "гуд"
...
Рейтинг: 0 / 0
17.12.2018, 10:12
    #39748799
Scott Tiger
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4
westvovikЭто наш сервер, размещен в ДЦ INTEL S5520UR,
удаленное управление только через KVM есть,
отдельного интерфейса с сетевухой для управления на нем нет

На этой плате есть BMC, проверьте - https://www.intel.com/content/www/us/en/support/articles/000007037/server-products.html?productId=36456&localeCode=us_en . Тж. см. https://www.intel.com/content/dam/support/us/en/documents/motherboards/server/s5520ur/sb/e44031012_s5520ur_s5520urt_tps_r1_9.pdf

Чтобы не терять сообщения на консоли, во-первых, отключите перезагрузку по аппаратному сбою, во-вторых - перенаправьте консоль на последовательный порт ( https://www.freebsd.org/doc/handbook/serialconsole-setup.html ) и подключите этот порт к консольному коммутатору, который умеет хранить историю (в ДЦ быть должен, Altusen или что-то подобное).

Переусадите модули памяти. Если не полегчает, поменяйте их местами - это позволит понять, ходит ли ошибка за модулем или за слотом (во втором случае это будет слот памяти, материнская плата или, менее всего вероятно, процессор).
...
Рейтинг: 0 / 0
17.12.2018, 11:28
    #39748831
westvovik
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4
Scott TigerwestvovikЭто наш сервер, размещен в ДЦ INTEL S5520UR,
удаленное управление только через KVM есть,
отдельного интерфейса с сетевухой для управления на нем нет

На этой плате есть BMC, проверьте - https://www.intel.com/content/www/us/en/support/articles/000007037/server-products.html?productId=36456&localeCode=us_en . Тж. см. https://www.intel.com/content/dam/support/us/en/documents/motherboards/server/s5520ur/sb/e44031012_s5520ur_s5520urt_tps_r1_9.pdf

Чтобы не терять сообщения на консоли, во-первых, отключите перезагрузку по аппаратному сбою, во-вторых - перенаправьте консоль на последовательный порт ( https://www.freebsd.org/doc/handbook/serialconsole-setup.html ) и подключите этот порт к консольному коммутатору, который умеет хранить историю (в ДЦ быть должен, Altusen или что-то подобное).

Переусадите модули памяти. Если не полегчает, поменяйте их местами - это позволит понять, ходит ли ошибка за модулем или за слотом (во втором случае это будет слот памяти, материнская плата или, менее всего вероятно, процессор).

Подскажите, а удаленно как я понимаю этим сервером я управлять через BMC не смогу, если у меня на метери не вставлен RMM3 модуль так, а он приобретается отдельно?

Тогда что можно сделать с помощью BMC без RMM, для какой цели он нужен, не очень понимаю?
...
Рейтинг: 0 / 0
17.12.2018, 11:48
    #39748842
Alex URS
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4
westvovik,

если ты не понимаешь, о чём тут пишут, хотя бы проверь это: ports, mcelog
и я так понял, что у тебя ни разу не сервер - это обычный desktop, которому так "приказали", ибо server - это не просто название
...
Рейтинг: 0 / 0
17.12.2018, 12:35
    #39748867
westvovik
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4
Alex URSwestvovik,

если ты не понимаешь, о чём тут пишут, хотя бы проверь это: ports, mcelog
и я так понял, что у тебя ни разу не сервер - это обычный desktop, которому так "приказали", ибо server - это не просто название

Зачем хамить то?

mcelog я установил!
Далее ему нужно скормить, как я понимаю логи для вывода инфы в человекочитаемом варианте, где взять эти логи или это Kernel Crash Dump?

Попробовал запустить его в режиме демона mcelog --daemon --logfile /var/log/mcelog, сервер перезагрузился, но в файле mcelog ничего нету!

что делаю не так?
...
Рейтинг: 0 / 0
17.12.2018, 20:23
    #39749160
Scott Tiger
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4
westvovik, RMM нужен для удалённого сетевого доступа к BMC. В его отсутствие можете работать с консоли (опять же, goto к админам ДЦ). Почитайте внимательно мою первую ссылку - SEL Viewer работает даже в EFI Shell.
...
Рейтинг: 0 / 0
18.12.2018, 11:45
    #39749334
westvovik
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4
Scott Tigerwestvovik, RMM нужен для удалённого сетевого доступа к BMC. В его отсутствие можете работать с консоли (опять же, goto к админам ДЦ). Почитайте внимательно мою первую ссылку - SEL Viewer работает даже в EFI Shell.

Спасибо за совет, SEL попробую!

Вчера при замене памяти в ДЦ сервер в биосе выдал что первые два слота память FAILED, вот переставили в другие два слота, сейчас все пока работает без перезагрузок, посмотрим что будет дальше.
...
Рейтинг: 0 / 0
Форумы / Unix-системы [игнор отключен] [закрыт для гостей] / Помогите sos, перезагружается постоянно FreeBSD 11.1-RELEASE-p4 / 22 сообщений из 22, страница 1 из 1
Целевая тема:
Создать новую тему:
Автор:
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]