我有一个带有SAS6I/R控制器的戴尔T110服务器和RAID 1中的两个硬盘。
SAS端口报告: SAS宽端口2在PHY 2上丢失链接。:控制器0 (SAS 6/iR适配器)
大约20秒后,将出现以下信息消息:
SAS端口报告: SAS宽端口2恢复了PHY 2上的链接。:控制器0 (SAS 6/iR适配器)
直到现在,我还没有注意到在这个服务器上运行的程序有任何中断。这是控制器或磁盘未来问题的迹象吗?你们有人见过这样的东西吗?
更新
昨天,在我发布这个问题3天后,RAID 1安装程序失去了冗余。在上面提到的消息序列之后,记录了以下消息:
(10-07-2012 21:42:42) -检测到无效的SAS配置。详细信息: SAS拓扑错误:不可寻址设备。:控制器0 (SAS 6/iR适配器) (10-07-2012 21:42:45) -重置到设备\ device \RaidPort0。(10-07-2012 21:43:02) -设备故障:物理磁盘0:2控制器0,连接器0 (10-07-2012 21:52:59) -驱动程序在\ Device \RaidPort0上检测到控制器错误。(10-07-2012 21:53:02) -冗余丢失:虚拟磁盘1(虚拟磁盘1)控制器0 (SAS 6/iR适配器) (10-07-2012 21:53:02) -虚拟磁盘退化:虚拟磁盘1(虚拟磁盘1)控制器0 (SAS 6/iR Adapter) (10-07-2012 21:53:02) -重建由于目标物理磁盘上的错误而失败。
从这些消息中,我们可以假设问题在于数组中的一个磁盘。我现在正在使用戴尔在线诊断工具来测试磁盘。当其中一个磁盘完成测试时,另一个磁盘则停留在20%。所以我想我找到了凶手。
发布于 2012-10-05 13:10:12
正如Mitch所建议的,我首先要确保您服务器上的所有组件都安装了最新的固件和最新的驱动程序。我们有整个硬盘驱动器失败,因为他们没有最新的固件(实际上是连续3个,直到戴尔发现实际驱动器上的固件是过时的)。这与您的情况无关,但我想说明的是,将您的设备保存在最新的固件上不仅仅是“良好实践”。
只需在这里导航并输入您的服务标记:http://www.dell.com/support/home/us/en/04/home2。
我们已经监视戴尔事件很多年了,OpenManage记录的事件不应该掉以轻心。你收到的警告很可能是一个需要解决的问题。
您可能没有注意到任何问题的原因可能是因为您正在运行RAID 1。因此,即使完全断开一个驱动器也不会引起任何明显的问题,尽管它可能会导致raid重建(这也会被记录)。
如果您在更新了所有驱动程序和固件之后继续看到这些事件,我将关闭服务器(如果可能的话),断开和重新连接硬盘电缆。
如果问题持续,那么我会打电话给戴尔,因为它很可能是一个硬件问题,如缺陷电缆,背板等。
https://serverfault.com/questions/434807
复制相似问题