我们有一个具有以下详细信息的自定义服务器:
我的服务器负载异常增加。当我检查时,我在引导过程中遇到了raid错误1792和1779。在重新启用RAID之后,我们检查了硬盘,它们在raid管理软件中显示为OK。
然后,我们用SeaTools对windows进行了硬盘测试(智能、短和长dst测试)。两个硬盘有严重的问题,测试失败。
在DL380 G7这样的典型HP服务器中,HDD将颜色从绿色改为橙色以表示问题,但在我们这样的自定义服务器中,这一特性是不可用的。
我的问题是,在泄漏数据之前,我们如何检测硬盘问题?
发布于 2015-08-02 05:52:53
应该有可用于查询RAID控制器和确定阵列中驱动器的智能状态的工具。不知道你有什么特别的设备,我对使用什么没有任何建议。
一旦您知道该使用什么(以及如何使用它),您将需要自动化监视,因此当出现问题时,它会主动通知您(因为您将忘记手动检查它--我保证)。如果幸运的话,RAID控制器的管理工具可能具有内置的功能,但更有可能的是,您需要编写某种脚本来运行管理工具,如果它报告了问题,则发送电子邮件给您。
发布于 2015-08-02 07:48:21
有许多工具可以帮助您监视HDD状态,并预测它们何时会失败或是否已经失败,以便尽可能快地替换它们。
由于您没有提到您在服务器上运行的操作系统,所以我无法帮助您提供更具体的建议。
发布于 2015-08-04 13:03:05
P 400在ESXi 6.0中不受支持,所以您将无法从控制器获得健康状态。
https://serverfault.com/questions/710245
复制相似问题