|
smartd не отправляет email если self test завершен с ошибкой
|
|||
---|---|---|---|
#18+
Столкнулся с тем, что smartd не отправляет email если self test с ошибкой Имею следующую простую конфигурацию в smartd.conf : /dev/sdd -H -C 0 -U 0 -s L/../../6/04 -m admin@domain.com в логах я вижу как этот тест запускается как и задумано в ночь на субботу Dec 20 05:29:25 hostname smartd[29132]: Device: /dev/sdd, starting scheduled Long Self-Test. в smartctl я вижу как этот тест завершился ошибкой. статус теста установлен как с ошибкой, но пороговые значения счетчиков не достигнуты : smartctl -a /dev/sdd автор.... === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x85) Offline data collection activity was aborted by an interrupting command from host. Auto Offline Data Collection: Enabled. Self-test execution status: ( 113) The previous self-test completed having the read element of the test failed. Total time to complete Offline data collection: (4783) seconds. Offline data collection capabilities: (0x7b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 2) minutes. Extended self-test routine recommended polling time: ( 72) minutes. Conveyance self-test routine recommended polling time: ( 5) minutes. SCT capabilities: (0x103f) SCT Status supported. SCT Feature Control supported. SCT Data Table supported. .. SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Extended offline Completed: read failure 10% 56199 293042777 в man-е есть следующее описание касательно отправки результатов теста на почту : автор If a SCSI disk is listed, it will be monitored at the maximum implemented level: roughly equivalent to using the ?-H -l selftest? options for an ATA disk. So with the exception of ?-d?, ?-m?, ?-l selftest?, ?-s?, and ?-M?, the Directives below are ignored for SCSI disks. For SCSI disks, the ?-m? Directive sends a warning email if the SMART status indicates a disk failure or problem, if the SCSI inquiry about disk status fails, or if new errors appear in the self-test log . я протестировал всю цепочку отправки email с помощью -M. Письма ходят. В коде не готов разбираться. Тем более, что многие наверняка это используют и знают как на практике работает smartd в таких случаях. Что не так настроено? Почему я не получил уведомлений о тесте завершившимся с ошибкой ? ... |
|||
:
Нравится:
Не нравится:
|
|||
20.12.2014, 15:07 |
|
smartd не отправляет email если self test завершен с ошибкой
|
|||
---|---|---|---|
#18+
разобратся вот. опция -l selftest еще нужна : /dev/sdd -H -C 0 -U 0 -s L/../../3/14 -l error -l selftest -M diminishing -m email@domain.com syslogJan 7 14:44:45 hostname smartd[30523]: file /var/run/smartd.pid written containing PID 30523 Jan 7 15:14:46 hostname smartd[30523]: Device: /dev/sdd, starting scheduled Long Self-Test. Jan 7 16:14:47 hostname smartd[30523]: Device: /dev/sdd, Self-Test Log error count increased from 2 to 3 Jan 7 16:14:47 hostname smartd[30523]: Sending warning via mail to email@domain.com ... Кстати, не совсем понятна позиция гарантийных сервис-инженеров, производителей и хостеров в данном случае. Если мониторинг атрибутов вроде бы не показывает проблем, но тест завершается с ошибкой, что обычно делают ? ... |
|||
:
Нравится:
Не нравится:
|
|||
07.01.2015, 15:24 |
|
smartd не отправляет email если self test завершен с ошибкой
|
|||
---|---|---|---|
#18+
С той фигней я разобрался - неверно понял опции. А как мониторить падение конкретного атрибута ниже границы ? тут все еще более запутано. Обнаружил, что дешевые SSD одного не очень крутого производителя сильно деградируют в скорости записи при достижении 202 Percent_Lifetime_Used уже в 45%. То есть, с точки зрения настроек SMART от производителя - это не проблема, а с моей точки зрения проблемой является и знать про нее нужно заранее. К тому же, нормализованные границы в этом диске отсутствуют как таковые. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.08.2015, 02:11 |
|
smartd не отправляет email если self test завершен с ошибкой
|
|||
---|---|---|---|
#18+
netwind, up :) ... |
|||
:
Нравится:
Не нравится:
|
|||
21.10.2015, 00:46 |
|
|
start [/forum/topic.php?fid=25&fpage=26&tid=1481899]: |
0ms |
get settings: |
10ms |
get forum list: |
14ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
70ms |
get topic data: |
12ms |
get forum data: |
3ms |
get page messages: |
45ms |
get tp. blocked users: |
1ms |
others: | 250ms |
total: | 411ms |
0 / 0 |