powered by simpleCommunicator - 2.0.38     © 2025 Programmizd 02
Форумы / Unix-системы [игнор отключен] [закрыт для гостей] / fsck при старте системы после отключения питания (SLES11)
18 сообщений из 18, страница 1 из 1
fsck при старте системы после отключения питания (SLES11)
    #39309509
lYY
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
lYY
Гость
При загрузке ОС после потери питания запускается fsck, говорит
Код: c#
1.
fsck failed, please repair manually and reboot


и загрузка ОС останавливается.
Приходится выезжать на место инженеру. Удаленный kvm есть не везде, умные бесперебойники тоже не везде.
Как можно это побороть или отключить?

ОС SLES11 или OpenSUSE, да и думаю, и на других линуксах так же.

Код: sql
1.
2.
uname -a
Linux linux-vlig01 3.0.13-0.27-default #1 SMP Wed Feb 15 13:33:49 UTC 2012 (d73692b) x86_64 x86_64 x86_64 GNU/Linux


Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
cat /etc/fstab
/dev/disk/by-id/scsi-SAdaptec_Logical_device_52C2A9A8-part1 swap                 swap       defaults              0 0
/dev/disk/by-id/scsi-SAdaptec_Logical_device_52C2A9A8-part2 /                    ext3       acl,user_xattr        1 1
/dev/disk/by-id/scsi-SAdaptec_Logical_device_52C2A9A8-part3 /home                ext3       acl,user_xattr        1 2
proc                 /proc                proc       defaults              0 0
sysfs                /sys                 sysfs      noauto                0 0
debugfs              /sys/kernel/debug    debugfs    noauto                0 0
 usbfs  /proc/bus/usb  usbfs  defaults  0  0 
devpts               /dev/pts             devpts     mode=0620,gid=5       0 0


...
Рейтинг: 0 / 0
fsck при старте системы после отключения питания (SLES11)
    #39309562
irbis_al
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
lYY,

Ну ,говорят файловая система XFS к таким сбоям более устойчива.
...
Рейтинг: 0 / 0
fsck при старте системы после отключения питания (SLES11)
    #39309677
Вячеслав Любомудров
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Включить журнал

И отключить профилактическую проверку (раз в какой-то интервал и через сколько-то монтирований)

man tune2fs
...
Рейтинг: 0 / 0
fsck при старте системы после отключения питания (SLES11)
    #39309678
lYY
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
lYY
Гость
А отключить fsck никак? В винде скандиск как-то сам справляется, если надо, сканирует и исправляет.
...
Рейтинг: 0 / 0
fsck при старте системы после отключения питания (SLES11)
    #39309700
irbis_al
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
lYYА отключить fsck никак? В винде скандиск как-то сам справляется, если надо, сканирует и исправляет.

А что она у Вас всё время после отключения питания просит проверится...Это довольно странно я тоже использую (у своих клиентов) в том числе и SLES 11...
И таких боков не наблюдалось...разве,что регулярно вырубается по питанию...после 40 раз вырубания попросит(были такие идиоты -операторы в торговом зале,что вырубали комп по кнопке).
Хотя это всё индивидуально,если Ваш сервак постоянно что-то пишет к себе...то может и будет каждый раз просить проверится.
...
Рейтинг: 0 / 0
fsck при старте системы после отключения питания (SLES11)
    #39309741
lYY
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
lYY
Гость
irbis_alА что она у Вас всё время после отключения питания просит проверится...
Нет, не каждый раз.
В общем, сделал настройку
Код: sql
1.
tune2fs -c 100 /dev/sda1


для корневого раздела, а для других разделов отключил.

Всем спасибо за советы и мысли!
...
Рейтинг: 0 / 0
fsck при старте системы после отключения питания (SLES11)
    #39309748
Фотография bga83
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
виртуализация косвенно помогает избежать подобных проблем
...
Рейтинг: 0 / 0
fsck при старте системы после отключения питания (SLES11)
    #39309956
Вячеслав Любомудров
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
lYYirbis_alА что она у Вас всё время после отключения питания просит проверится...
Нет, не каждый раз.
В общем, сделал настройку
Код: sql
1.
tune2fs -c 100 /dev/sda1


для корневого раздела, а для других разделов отключил.

Всем спасибо за советы и мысли!Не вижу смысла
Даже если корневой раздел маленький почему именно 100?

Такие вещи очень раздражают, когда нужно уложиться в технологическое окно, ставишь быстренько патчи, перегружаешь и офигиваешь от того, что именно этот раз пришелся на 100 монтирование и оно вдруг решило профилактически проверить файловую систему.

Тебе ведь ничего не мешает запускать самому периодически эту проверку (fsck -nf /) и в удобное для тебя время попытаться полечить, если найдены повторяющиеся ошибки (на открытых файлах вполне могут быть и orphaned inode, и deleted/unused inode, и free blocks/inodes count wrong, и т.п.)

PS. Про журнал-то не забыл?
...
Рейтинг: 0 / 0
fsck при старте системы после отключения питания (SLES11)
    #39310146
irbis_al
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вячеслав Любомудров,

Я вот соглашусь...
я везде и всегда ставлю "отключение плановой проверки"

tune2fs -c 0 /dev/sda1
tune2fs -i 0 /dev/sda1
...
Рейтинг: 0 / 0
fsck при старте системы после отключения питания (SLES11)
    #39310153
lYY
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
lYY
Гость
Вячеслав ЛюбомудровПро журнал-то не забыл?
Про журнал я не понял, он вроде по умолчанию есть?
Где про него почитать?
...
Рейтинг: 0 / 0
fsck при старте системы после отключения питания (SLES11)
    #39310159
Вячеслав Любомудров
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
irbis_altune2fs -i 0 /dev/sda1i -1, насколько помню (хотя, может и 0 срабатывает)lYYВячеслав ЛюбомудровПро журнал-то не забыл?
Про журнал я не понял, он вроде по умолчанию есть?
Где про него почитать?Тот же tune2fs -l покажет тебе featuries

Если бы он у тебя был, то вряд ли fsck после сбоя работал больше пары секунд
...
Рейтинг: 0 / 0
fsck при старте системы после отключения питания (SLES11)
    #39312139
Мутаген
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Это сообщение при старте ОС обозначет, что в ФС такие повреждения, которые fsck в автоматическом режиме исправить не смог. При ручном запуске он задаст вопросы на тему: куда складывать обломки каталогов, предложит очистить сомнительные inode и тп. Всё это потенциально деструктивные действия, поэтому автоматом их не запускают. Иногда это можно в конфигах изменить.

Причиной таких повреждений при пропадании питания обычно является неверная работа кеша диска на запись - он не записывает данные на физический носитель, а держит их в своём буфере. После отключения питания буфер исчезает. Встроенный в диск кеш не выдерживает очередность записи (пришедшие от хоста блоки ФС могут быть записаны раньше журнала), поэтому журналы ФС оказываются бесполезными. Решением будет использование RAID-контроллера с защитой кеша (на батарейке/BBU или конденсаторе /supercap), дисков SSD с PLP или отключение кеша на запись в диске (hdparm -W0 /dev/sdX, будет тормозить на запись).

Проверка по числу дней/монтирований вроде открутили в redhat 6 и дальше, так что острота той проблемы снизилась. Как альтернативу можно проверять снапшот LVM через cron: http://www.redhat.com/archives/ext3-users/2008-January/msg00032.html
...
Рейтинг: 0 / 0
fsck при старте системы после отключения питания (SLES11)
    #39312345
Вячеслав Любомудров
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
МутагенЭто сообщение при старте ОС обозначет, что в ФС такие повреждения, которые fsck в автоматическом режиме исправить не смог. При ручном запуске он задаст вопросы на тему: куда складывать обломки каталогов, предложит очистить сомнительные inode и тп. Всё это потенциально деструктивные действия, поэтому автоматом их не запускают. С журналом автоматическое исправление таких логических повреждений на порядок вероятней
МутагенПричиной таких повреждений при пропадании питания обычно является неверная работа кеша диска на запись - он не записывает данные на физический носитель, а держит их в своём буфере. После отключения питания буфер исчезает. Встроенный в диск кеш не выдерживает очередность записи (пришедшие от хоста блоки ФС могут быть записаны раньше журнала), поэтому журналы ФС оказываются бесполезными.Нарушение очередности записи непосредственно при креше весьма редкая ситуация.
Чаще это просто не запись метаданных (не говоря уже про сами данные)
Опять же, без журнала все еще хужее
МутагенПроверка по числу дней/монтирований вроде открутили в redhat 6 и дальше, так что острота той проблемы снизилась. Как альтернативу можно проверять снапшот LVM через cron: http://www.redhat.com/archives/ext3-users/2008-January/msg00032.html В OL6.4 еще используется
LVM тоже не у всех юзается
Впрочем, к ТС это вообще никаким боком
...
Рейтинг: 0 / 0
fsck при старте системы после отключения питания (SLES11)
    #39313045
netwind
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
МутагенПричиной таких повреждений при пропадании питания обычно является неверная работа кеша диска на запись - он не записывает данные на физический носитель, а держит их в своём буфере.

Я так думаю, это пропадание питания во время починки после пропадания питания. Сам феномен "свет мигает" подразумевает, что перерыв не однократный.
Как еще объяснить, что даже при включенных журналах это все равно иногда возникает?
...
Рейтинг: 0 / 0
fsck при старте системы после отключения питания (SLES11)
    #39313058
Вячеслав Любомудров
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Да нет
Скорее всего запись журнала криво записалась.
Она хоть и маленькая по размеру, но может занимать несколько дисковых блоков (по 512 байт). Т.е. в дешевых дисках легко возможна ситуация когда один блок записался, а другой нет.

А есть еще и разные режимы журналирования (writeback, например, вполне очевидно допускает некоторое рассоглассование метаданных)

Плюс, файловая система могла быть поломана раньше вследствии, например, какого-нибудь бага (или "шаловливых" ручек). При этом, естественно, никакой накат логов не спасет, а ошибка вылезет только при проверке
...
Рейтинг: 0 / 0
fsck при старте системы после отключения питания (SLES11)
    #39314385
Мутаген
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
netwindКак еще объяснить, что даже при включенных журналах это все равно иногда возникает?

Очень просто. Например, создание файла: от хоста приходит команда записи блока 512байт в журнал, запись блока в inode, запись в каталог (ссылка на новый inode). Диск это сохраняет в кеш, но переупорядочивает записи блоков: сначала в каталог, потом журнал, потом питалово отключается, блок с inode остаётся незаписанный. При новом монтировании ФС получается ссылка в каталоге на неизвестный inode.

Точно также при незащищённом кеше на запись разваливаются оракловые базы, кстати. Записывается SCN в контрольный файл, потом в датафайл. Диск переупорядочивает, записывает сначала в датафайл, потом питание отключается. При включении получаются датафайлы новее контрольника.
...
Рейтинг: 0 / 0
fsck при старте системы после отключения питания (SLES11)
    #39314643
netwind
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Мутаген, не готов опровергать эту теорию цитированием исходников, но все равно что-то странное. Разве не для исключения этой ситуации существуют журналы и барьеры? Если они бесполезны, то никто бы и не стал их развивать.
...
Рейтинг: 0 / 0
fsck при старте системы после отключения питания (SLES11)
    #39314791
Вячеслав Любомудров
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Еще раз -- журналы бывают разные
Если это writeback, то никакая очередность даже не закладывается (и что самое прикольное -- часто это бывает достаточно)
Если ordered -- то запись метаданных идет синхронно (O_SYNC), другое дело что диск может подтвердить запись физически ее не произведя. Типо держит в своем внутреннем кеше, пытаясь оптимизировать движение головок. А тут раз -- и кирдык по питанию. Скорее всего Мутаген говорил именно об этом.

Как мне кажется, этим страдают уж совсем простейшие диски (естественно, с претензией на навороченность) -- обычно в сервера втыкают что-то более-менее брендовое, где таких портаков не наблюдается.
...
Рейтинг: 0 / 0
18 сообщений из 18, страница 1 из 1
Форумы / Unix-системы [игнор отключен] [закрыт для гостей] / fsck при старте системы после отключения питания (SLES11)
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]