目前,我使用的方法是检查syslog中的文件系统错误、raid控制器/HBA burp错误,并主动将文件写入磁盘、检查其内容并删除它,以检查磁盘故障。这些结果适用于我们现有的任何监测解决方案(S),但这通常是一种拙劣的做事方式。XFS报告错误的方式不同于ext4或zfs,或者其他什么。
我觉得现在应该存在一些类似于/sys/block/sdc/write_error_count
的东西,它是一个计数器,在任何情况下块写失败时都会增加。read_error_count
类似物也会出现在那一边。对于文件系统也可能存在类似的东西(相对于原始块设备)。
现在Linux中真的存在类似的东西吗?如果没有,是否有任何真正规范的方法来检查失败的存储?
发布于 2019-01-02 16:49:42
智能工具,特别是smartctl
命令如何?smartctl
报告您从硬盘中返回智能统计信息,您将看到错误的数量、设备打开的小时数等等。
https://serverfault.com/questions/947358
复制相似问题