我们有一个运行Ubuntu 18.04.6的服务器。Smartd配置为当其中一个hdds出现故障时发送警报电子邮件。它已经这样做了好几次,而有关的hdd已经被取代(几周前)。但是,这些消息一直被发送给那个硬盘,它甚至在系统中已经不存在了。今天2022-10-07我得到了:
此消息由运行在: host name: server DNS域: domain.com上的smartd守护进程生成。smartd守护进程记录了以下警告/错误:设备: /dev/sdi 塞特,失败的智能使用属性:7 Seek_Error_Rate。设备信息: WDC WD6003FRYZ-01F0DB0,S/N:V9JLADNL,WWN:5-000cca-0bde484c2,FW:01.01H01,6.00TB,详情见主机的SYSLOG。您还可以使用smartctl实用程序进行进一步调查。关于这个问题的原始消息是在星期五8月12日20:40:12 2022 CEST发送的,如果问题仍然存在,另一条消息将在24小时内发送。
那时它是一个6 TB的WD hdd,现在它是8 TB的Seagate hdd,所以我非常肯定这个错误不能持续。
在此期间,服务器至少被重新启动了两次。
我该去哪里找原因?
编辑:
我刚刚找到了目录/var/lib/smartmontools,其中包含几个*.csv和*.state文件,这些文件似乎包含文件的属性值。
ST1000DM003_1ER162-Z4Y3R2ER.ata.csv
和
smartd.ST18000NM000J_2TV103-ZR5C0BVS.ata.state
显然,这些文件用于存储当前状态(.state)以及某种历史记录(.csv)。
不幸的是,对于WD驱动器没有这样的文件,这都是关于。
发布于 2022-10-06 23:52:15
我建议阅读smartd
命令页上的信息。
似乎有一个配置文件,其中smartd
正在读取旧驱动器的信息。配置文件是/etc/smartd.conf
。
看起来,重新设置配置文件将修复这个问题。如果它不存在,就会创建一个新的。
建议执行以下操作来备份配置文件并重新启动smartd
:
sudo mv /etc/smartd.conf /etc/smartd.conf.bak
sudo systemctl restart smartd.service
在此之后,如果有必要,将旧配置/etc/smartd.conf.bak
中的相关部分插入到新/etc/smartd.conf
。
https://askubuntu.com/questions/1434220
复制