在IT世界里我刚刚赢了两次彩票..。
今天,我们在一个raid阵列中出现了硬盘驱动器故障。几个小时后,我们在另一台服务器上出现了另一个驱动器故障.我们立即开始检查所有的环境日志和系统。湿度为40%,温度为75*,没有灰尘或其他微粒飞来飞去。我们检查了UPS日志,没有报告尖峰。大约3个小时后,第三个系统的另一个硬盘坏了.
回顾一下3惠普DL380 G7's,这些服务器都是顺序序列号。驱动器不是来自同一批,虽然我打赌阵列控制器和板是。惠普明早就会出来..。与此同时,我们希望这不会成为一种习惯.我们已经有一个驱动器失败在这整个服务器机架在2.5年内。今天在12小时内3点!
我们还应该找什么?还有其他人也有类似的问题吗?
任何帮助都是非常感谢的。这件事消耗了我们的备件..。如果我们有另一个失败,我们将寻找惠普来交换他们。
更新:这些是146 GB 10k rpm SAS驱动器和一个300 GB 10k rpm SAS驱动器。惠普的原始设备。
发布于 2014-01-28 22:01:54
这些事情会发生..。你一定会惊讶于我在同样的设备上所看到的。
通过检查环境中的ESD、温度和电源问题,您做得很好。
作为ProLiant DL380 G7单元,阵列控制器嵌入在系统板上。批号在那里控制得不太严。我不认为这绝对是巧合。然而,对于某些固件更新来说,这可能是一个很好的时机,因为错误的驱动器故障有时是错误修订的症状。
由于您有支持,让HP处理部件/替换,然后继续前进:)
顺便说一句-它将有助于详细的驱动器容量和类型(SAS,SATA,近线SAS)。
https://serverfault.com/questions/570557
复制相似问题