
一、全球首款102.4Tbps单芯片交换机:AI网络的带宽革命
2025年6月3日,博通(Broadcom)正式发布Tomahawk 6交换机芯片系列,成为全球首款单芯片具备102.4 Tbps交换容量的解决方案,带宽达到市场现有以太网交换机的两倍。这一突破直接瞄准下一代AI集群的核心需求——从数十个加速器扩展至数千甚至超百万XPU的规模时,网络带宽与低延迟成为关键瓶颈。
博通核心交换事业部高级副总裁兼总经理Ram Velaga指出,Tomahawk 6不仅是性能升级,更标志着AI基础设施设计的转折点,其将最高带宽、能效与自适应路由整合于单一平台,支持Scale-Up和Scale-Out双架构,满足超大规模AI集群的部署需求。彭博情报分析师Kunjan Sobhani强调,该芯片突破100Tbps壁垒,以开放标准架构避免专有技术锁定,为AI基础设施提供了灵活的发展路径。
二、共封装光学(CPO)与SerDes技术:全系统级能效革新
Tomahawk 6的创新不仅限于芯片本身,其通过博通领先的SerDes和光学生态系统实现全系统优化:
◆ 200G SerDes与铜缆互连:搭载行业领先的200G SerDes,支持长距离无源铜缆传输,降低系统延迟与成本,提升可靠性。同时提供100G SerDes版本,单芯片支持1,024个100G接口,便于客户利用原生100G接口连接XPU与光模块。
◆ 共封装光学(CPO)版本:基于Tomahawk 4/5已验证的CPO技术,CPO版本通过集成光学引擎与交换硅片(仅保留外部激光源),进一步降低功耗、延迟与链路波动,提升长期可靠性。这一设计针对超大规模AI网络的核心痛点,成为降低总拥有成本(TCO)的关键。
三、认知路由2.0:AI工作负载的智能网络调度
Tomahawk 6搭载的认知路由2.0(Cognitive Routing 2.0)专为现代AI工作负载(如混合专家模型MoE、强化学习等)设计,集成多项关键功能:
◆ 全局负载均衡(GLB):突破传统等价多路径(ECMP)技术的局限,基于全网智能动态选择最优路径,相比静态ECMP提升吞吐量约50%。
- 动态拥塞控制与快速故障恢复:支持逐包级负载均衡,链路故障响应速度比标准以太网快1000倍,保障超大规模集群的稳定性。
- 自适应流控制:结合先进遥测与数据包修剪功能,实现网络利用率逼近100%,满足AI训练对高带宽利用率的需求。
四、灵活拓扑支持:从512到超百万XPU的集群扩展
Tomahawk 6通过统一以太网架构,支持多样化拓扑需求:
◆ Scale-Up:单芯片支持512个XPU单跳连接,规模为竞品的7倍,适用于机架内紧密集群的GPU/TPU互连,满足缓存一致性与内存传输需求。
◆ Scale-Out:通过200G链路的两层Clos架构,可连接超10万个XPU,相比传统三层架构减少67%的光模块与物理连接,降低延迟与功耗。
◆ 开放拓扑兼容性:支持Clos、rail-only、环形(torus)等任意拓扑,兼容超以太网联盟(UEC)规范,支持AI传输、拥塞信令与大规模训练遥测。
五、开放生态与端到端解决方案:推动以太网统一化
博通通过开放标准与生态合作巩固技术领导力:
◆ SUE框架与OCP合作:2025年4月在OCP大会上发布Scale Up Ethernet(SUE)框架,提供XPU与NIC向上扩展接口的开放规范,推动以太网在机架内场景的标准化。Broadcom报告:以太网重构 AI 分布式计算架构
◆ 端到端产品矩阵:整合Tomahawk 及Jericho交换机、Thor NIC、Agera重定时器、Sian oDSP及CPO技术,形成从芯片到光学的全栈解决方案。其中,Jericho系列聚焦“交换机调度”架构,Tomahawk则面向“端点调度”,配合Thor NIC与小芯片技术,满足不同客户的智能分配需求。
六、市场预期与行业趋势:从InfiniBand到以太网的全面迁移
Tomahawk 6预计于2026年上半年投入超大规模集群部署,其100G与200G双版本策略兼顾过渡需求与高性能场景。博通作为超以太网联盟创始成员,推动UEC 1.0标准落地,加速行业从InfiniBand向统一以太网架构迁移——前端/后端网络已全面采用以太网,下一步将Scale up场景纳入统一技术栈,减少专有链路依赖。
产品线经理Pete Del Vecchio指出,CPO技术除了低功耗与成本优势,其减少链路波动的特性(通过消除中间有源组件)将显著提升GPU集群稳定性,成为“游戏规则改变者”。当前,ODM/OEM与超大规模客户正积极推进Tomahawk 6部署,以应对生成式AI爆发带来的算力与网络需求。
结语:AI基础设施的“网络心脏”
Tomahawk 6以102.4Tbps带宽、CPO集成、认知路由及开放生态,重新定义了AI集群的网络基础设施。其不仅解决了超大规模部署的带宽与延迟瓶颈,更通过统一以太网架构降低技术栈复杂度,为未来百万XPU级集群提供了可扩展的标准路径。随着生成式AI推动算力需求指数级增长,博通的这一突破或将成为AI基础设施从“专用架构”迈向“开放标准”的关键里程碑。