首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >不稳定的10 to铜连接,Broadcom和Intel卡到思科4900 M交换机

不稳定的10 to铜连接,Broadcom和Intel卡到思科4900 M交换机
EN

Server Fault用户
提问于 2015-08-03 18:30:42
回答 2查看 6.9K关注 0票数 6

我们用QLogic/卡购买了一些戴尔PowerEdge R730服务器,并将它们连接到Cisco4900M交换机--10‘t链接不能可靠工作。它们有时不连接,有时几分钟后连接,当它们连接时,它们一天下降几次。断开连接可持续4分钟或2小时。

思科交换机现有10 to铜连接到戴尔PowerVault SAN,这是稳定和工作了许多个月。

我在VMware日志中看到断开连接的消息如下:

代码语言:javascript
运行
复制
bnx2x 0000:82:00.1: vmnic5: NIC Link is Down

代码语言:javascript
运行
复制
 network connectivity on virtual switch "vSwitch2". Physical NIC vmnic5 is down.

我看不到任何有用的错误代码或以前的消息,只有由链接引起的消息下降。在Windows上,它显示为断开连接的卡,在开关上显示为断开连接的开关端口。

当链接连接时,它们可以工作--巨型帧平、iSCSI会话建立、数据存储显示与找到的所有路径。但这种联系是断断续续的。

我们查过了:

  • 电缆:
    • 最初是Cat5e单根电缆,现在是Cat6结构化布线。电缆总长度<7m。
    • 与新的电缆连接,主机开关没有补丁/接头和附近没有其他电缆。

  • 驱动程序/操作系统:
    • 最初VMware ESXi 5.5 U2戴尔构建("ESXi 5.5.0,2068190")与bnx2x驱动程序版本2.710.39.v55.2
    • 然后更新vmware.com的驱动程序,bnx2x版本2.710.70.v50.7
    • 然后是ESXi 6.0,Dell ("ESXi 6.0.0 2494585"),它的bnx2x版本为2.712.
    • 然后Windows 2012 R2与最新的驱动程序从戴尔的网站。

  • QLogic/Broadcom网卡固件;它是戴尔的最新版本,FFv7.12.17。
  • 交换端口配置,它只是简单的mtu 9000switchport access vlan NNN
  • 开关端口
    • 这些是8端口10 WS RJ45模块( WS-X4908-10G-RJ45 ),每个交换机一个.SAN占据每个模块中的前四个端口,新服务器占用每个模块中的其余四个端口。这似乎影响了我们用于新服务器的所有端口。所以它不是一个失败的端口,也不是一个失败的模块。
    • 我没有尝试中断SAN连接来测试这些端口,没有一些特定的理由认为端口1-4比5-8更可靠,这将是最后的手段。

  • 开关接口计数器,除断开连接外,没有错误。
  • 禁用Windows /Broadcom驱动程序中的各种卸载功能,并启用EnergyEfficientEthernet,迫使卡达到10 to而不是自动检测。
  • 将相同的主机连接到相同的交换机上,连接到1Gb的端口,这些端口看起来工作得很好,它们会很快地重复连接。
  • 交叉连接两个主机,它们以10 at的速度快速连接,并在几天内保持稳定的连接。
  • 我们买了一张英特尔X540-t2卡,并试了一下。它的行为是一样的。
  • 从那时起,我们买了猫6a补丁电缆,并测试了这些,没有变化。

我们在戴尔的支持下打了个电话,他们没有发现任何问题,认为交换机出了故障,但由于交换机运行10 We铜连接到戴尔PowerVault存储,据我所知,从我们的交换机监控日志和SAN事件日志中,这些链接没有丢失,我不愿意认为思科交换机是问题所在。

他们正在运行IOS 15.1(1)SG2,这不是最新的,但开关是动态和稳定的,我不想随意改变固件“以防万一”。

这发生在多个服务器、多个网卡、多个品牌的网卡、多个驱动程序版本、多个交换机上。它不可能是一件有问题的硬件。都装在一个空调的,有动力的架子上。

这是我们第一次尝试VMware主机在10 at上切换连接,因此我们没有其他配置可以与之相比,也没有可以连接到的硬件。

我们还能查到什么?

-编辑:我们想升级交换机固件,但我刚刚找到了一个相关链接--这似乎是思科WS-X4908-10G-RJ 45模块和Broadcom BCM57810卡之间的一个已知问题,后者依赖于IOS版本- https://supportforums.cisco.com/discussion/11755141/4900m-ws-x4908-10g-rj45-port-startup-delay,这引起了大量相关讨论,并导致:

https://tools.cisco.com/bugsearch/bug/CSCug68370 WS-X4908-10G-RJ 45和Broadcom57810S10Gb基础-T互操作性问题CSCug68370描述症状:10 10Gbps端口(在WS-X4908-10G-RJ45上)连接到Dell 820服务器上,使用Broadcom57810SDP 10GbBase-T。在重新装载开关或拆除/重新安装电缆端口后,很长一段时间(多达1小时)或根本不上来。条件: 1)模块WS-X4908-10G-RJ452)版本15.0( 2) SG至15.0(2)SG7,15.1(2)SG至15.1(2)SG3解决方案:降级至12.2(54)SG

这不是完全相同的服务器模式,也没有提到英特尔卡,但问题是一个非常点的匹配。

EN

回答 2

Server Fault用户

回答已采纳

发布于 2015-08-11 19:40:02

嗯,看起来这是思科的缺陷https://tools.cisco.com/bugsearch/bug/CSCug68370,升级到一个“已知的固定”IOS版本(15.1(2) SG4)似乎已经修复了它。

票数 2
EN

Server Fault用户

发布于 2015-08-03 18:58:54

请更新您的ESXi主机。这是您在故障排除步骤中真正错过的一件事。

您的5.5安装已经将近一年了!!

在本文撰写之时,当前版本 of ESXi 5.5是2718055。当前的ESXi 6.0版本号是2809209

戴尔惠普不重要..。您仍然应该更新您的ESXi安装。很多人都是忽视这一点,这是第二大原因--在我所看到的环境中,这往往是意外停机的原因。

票数 3
EN
页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://serverfault.com/questions/710560

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档