首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >ESUN诞生记:OCP 2025下,博通、英伟达与吉瓦(GW)级GPU买家的“新阳谋”

ESUN诞生记:OCP 2025下,博通、英伟达与吉瓦(GW)级GPU买家的“新阳谋”

作者头像
AGI小咖
发布2025-12-22 11:40:28
发布2025-12-22 11:40:28
950
举报

摘要

OCP 2025惊天变局!Oracle、OpenAI、Meta和Anthropic等吉瓦级(GW)数据中心建设如火如荼,吉瓦(GW)级GPU买家“新阳谋”——牵手英伟达、博通组建ESUN联盟,新Scale-up割裂生态——“一超(NVLink)+一统(ESUN)+多强(SUE-T/UALink)”?UALink(AMD/Intel主导)被“釜底抽薪”?博通SUE-T又如何“借壳上市”?英伟达又为何“拥抱”开放?接下来“AGI小咖”立足OCP 2025年峰会,尝试与您揭秘ESUN诞生背后的巨头“新阳谋”与Scale-up新动向,有不妥之处欢迎指点迷津!!!

01

OCP 2025的“惊天变局”

1.1 Scale-up割裂生态回顾

循着“AGI小咖”系列前文的脉络,我们不难发现,在OCP 2025之前,AI GPU Scale-up互联网络已然进入了群雄并起、“一超多强”的“战国时代”:一超(以NVIDIA NVLink为代表)+ 多强(以AMD、Intel、博通等巨头组建的UALink标准联盟、博通(Broadcom)的SUE + 字节 EthLink + 腾讯和信通院牵头搞的ETH-X、华为灵衢总线等

1.2 ESUN全新联盟横空出世

然而,OCP 2025峰会后Scale-up“一超多强”的割裂局面仿佛有了不一样的演进剧本。

一个在OCP峰会上正式集结的、由几乎所有行业巨头共同支持的“以太网统一战线”——ESUN(Ethernet for Scale-Up Networking)工作组——横空出世。其成员名单石破天惊:AMD、Arista、博通、思科、HPE、英特尔、Meta、微软英伟达(NVIDIA)、OpenAI、Oracle……

这份名单非常有意思,莫非奥特曼梯云纵、提锁连环战略也要在ESUN复现?

(1)反英伟达NVLINK联盟与英伟达同桌:UALink的核心创始成员(博通、微软、Meta、AMD)与英伟达坐在一起?

(2)大甲方与乙方同席:需求侧的终极“金主”(微软、OpenAI、Meta)与供给侧的“军火商”(英伟达、博通、AMD)赫然在列。

(3)以打造类“苹果生态”著称的NVIDIA破天荒地拥抱开放“安卓”生态,属实让人匪夷所思。

图1:ESUN工作组(有NVIDIA,又有Broadcom)

仅从Scale-up国际上的两大核心组织来看,ESUN的诞生,究竟是UALink 1.0的胜利交接,还是博通SUE的“借壳上市”

1.3 吉瓦(GW)级买家主导的“开放”革命

随着AI集群规模演进至“吉瓦级”数据中心,以微软的“星际之门 (Stargate)”、Meta的“Prometheus”(1GW)和“Hyperion”(5GW)等项目为标志,“吉瓦级”买家已成为市场主导力量,推动产业链的开放变革。

为实现“供应链安全”和“TCO可控”,这些“吉瓦级”买家正主导一场“开放胜过锁定”的战略转向。巨头们明确拥抱开放架构:Meta以此为大战略;微软靠此将GPT成本降低93%;Google也牵头所有巨头(包括NVIDIA)共建“敏捷和可互换 (Agile & Fungible)”的数据中心。

ESUN的成立即是这一转向的必然结果。它正是微软和Meta这两大“吉瓦级”买家战略意志的体现,迫使NVIDIA等厂商必须加入这个开放的Scale-Up(UALink/ESUN)生态。

图2:Meta的吉瓦级AI基建蓝图

02

ESUN + SUE-T一统江湖

OCP 2025峰会上看,未来的Scale-up之争可能演变为ESUN统治网络层,而传输层则成为SUE-T(博通主导)和UALink(AMD主导)两雄争霸的主场。

2.1 ESUN:统一“网络层”

2.1.1 吉瓦(GW)级买家需求推动(Meta/OpenAI)

传统以太网专为“松耦合应用”(高延迟容忍)设计,而“AI工厂”则是“紧密耦合处理”(低延迟容忍),在AI工厂中,突发性RoCE流量所形成“长尾延迟”会扼杀一切性能。

另外AI流量具有“低熵”特性,极易导致“哈希冲突”和“链路利用率低下”,在AI集群中,链路故障不再是“概率事件”,而是架构设计和运维中必须解决的“常态问题”。

针对上述问题,OCP峰会上Meta解决之道是通过NSF(非调度光纤网络)+ 自适应路由(Adaptive Routing, ARS)组合,同时还展示了其51.2T平台(Minipack3N)如何通过其自研的FBOSS网络操作系统、借助OCP SAI接口,实现了对博通、思科、英伟达等多家ASIC供应商的“解耦”支持,这一对“TCO可控”与“供应商解耦”迫切需求也成为驱动ESUN联盟加速前进的动力。

2.1.2 高密交换机的需求

ESUN要承载“星际之门”的海量规模,其技术可行性依赖于高密交换机。

为了承接未来“吉瓦(GW)级”数据中心互联需求,需要更高密交换机、单芯片更大吞吐量的交换机支持,例如阿里巴巴HPN8.0上规划化部署了102.4T交换机(实现64 x 1600G的高密度端口),这也在一定程度上证明搭载最大吞吐量和高密交换机ASIC是扩展AI高性能网络最高效的方式。

2.1.3 接口标准(SAI)

ESUN如何确保不同厂商的交换机(博通、思科、Arista)能协同工作?答案是SAI(交换机抽象接口)。

UEC(超级以太网联盟,ESUN是其OCP工作组)引入的关键技术(如CBFC(基于信用的流控)、LLR(链路层重试)和CSIG(拥塞信令))均已在SAI中定义了全新的对象(如 Virtual Channel Object、Port LLR Profile)和遥测模型,ESUN正通过SAI这一开放API,将下一代AI Fabric的关键控制权(如流控、拥塞管理)从ASIC硬件中抽象出来,从而实现对博通Tomahawk、英伟达Spectrum-X等不同硬件的“统一管理”和“解耦”。

2.1.4 ESUN + SUE-T:重构AI以太网协议栈

接下来我们来深度解读一下ESUN + SUE-T 如何重构AI以太网协议栈:

(1)L1/L2 (物理层/链路层) - ESUN的核心:ESUN的目标是构建一个硬件级的、可预测的、无损的L2 Fabric,不再依赖于TCP/IP有状态可靠连接。

  • 极简报文头压缩:最低6字节——AFH Gen 2 (Al Fabric Header Gen 2)代替传统以太网42字节报文头(Ethernet + IP + UDP)。

图3: SUE Lite的极简封装,AFH Gen 2仅占6字节

  • 两大技术创新——LLR + CBFC硬件级双保险:
    • 链路层重传LLR (Link Layer Retry):在FEC的基础上,当数据包因链路层错误损坏或丢失时,无需等待事务端点的检测结果,利用独创的硬件级的链路层重传机制,LLR能够自动恢复因信号衰减导致的损坏帧和及时修复通信故障,进一步提高数据传输的可靠性和时效性。
    • 基于信用的流控制CBFC (Credit Based Flow Control):在相同缓存区容量下相比PFC支持更多的无损类(32类 VS 8类),通过将“虚拟通道(Virtual Channel, VC)”与CBFC类进行映射,进而实现发送端对每个VC的信用使用情况一目了然,便于下一步SUE进行更精细的流量调度的处理。

(2)L4 (传输层) - SUE-T的核心:SUE-T(博通SUE Transport)运行在ESUN定义的无损L2 Fabric之上,利用其INC (In-Network Collectives)让交换机内部(如Tomahawk Ultra芯片)也可以处理GPU集合通信任务(占AI总带宽90%以上)。

而上述这一切(ESUN的LLR/CBFC/CSIG和SUE-T的INC)如何实现“开放”?答案是SAI。联盟正在为所有上述硬件功能定义标准SAI API(如SAIPORTLLRPROFILE, SAIVIRTUALCHANNELATTR)。这意味着微软(FBOSS)或谷歌(SONiC)未来可以用同一套NOS软件无差别地配置和管理博通Tomahawk或英伟达Spectrum-X的底层硬件。

果不其然行业顶级玩家定标准。

2.1.5 ESUN生态、标准与物理现实

当然ESUN所定义的标准也得到了生态、标准组织和物理产业链的一定程度上的支持与协同发展。

(1)开放组织 (UEC & OCP)

ESUN是OCP和UEC的结合体,超级以太网联盟(UEC) 扮演了“技术加速器”的角色,它绕开了传统IEEE 802.3漫长的标准化流程,快速定义了AI Fabric所需的关键协议(LLR, CBFC, CSIG)。而OCP(开放计算项目) 则是“标准出口”,通过SAI 将UEC的技术成果“合法化”为开放、可互操作的API。

(2)生态系统 (买家 & 卖家)

ESUN一定程度上也是大甲方与乙方共同作用力的结果,也是“生产”(Meta)和“仿真”(Google/Arista)层面深度绑定的利益共同体。

  • 大甲方:微软(Azure) 和Meta 是ESUN的核心驱动力。Meta的NSF(非调度光纤网络)已在生产环境中得到验证:通过FBOSS+SAI,同时运行着博通(Tomahawk5)、思科(G200)和英伟达(Spectrum-4) 的ASIC。

图4:Meta 51.2T NSF多厂商ASIC平台

  • 乙方:博通作为最大赢家贡献了SUE-T(INC)的核心思想,谷歌则扮演了“中立的赋能者”——AVS(Alpine虚拟交换机) 正协同博通(Bcmsim) 和Arista,、共同构建开放的“数字孪生”仿真环境。

(3)物理产业链 :TCO 与CPO 共舞

而ESUN在物理产业链上又是一场“可插拔”与“一体化”的路线之争:

  • 路线一:“可插拔”的TCO优化 (LPO/LRO)——这是Meta和Accelink等厂商主推的“近期”优化路径,本质是将‘信号均衡’(DSP)移出光模块(仅移除Rx端的DSP,保留Tx端的DSP)以降低功耗。LPO (Linear Pluggable Optics)功耗最低(1.6T 10W ),但“校准”、“诊断”(无DSP)和“互操作性”;而LRO在功耗(1.6T 15W)和诊断功能之间取得了最佳平衡,被Meta视为224G/lane(200G/L)的主流路径。
  • 路线二:“一体化”CPO远期方案——Marvell和Lightmatter等厂商远期目标寄希望于通过CPO(Gen III, 2.5D封装)和3D堆叠光子(Gen IV)先进封装技术将ASIC与光学引擎“共封装”于同一基板,这种依赖硅光 (SiPho) 微环、DWDM以及XSR SerDes技术实现超高带宽密度集成让液冷成为标配。CPO作为未来吉瓦级(GW)AI数据中心的关键技术,也带来极大的市场潜力和应用场景,根据Yole预测,CPO市场规模将从2024年的4600万美元飙升至2030年的81亿美元,年复合增长率(CAGR)高达137%

2.1.6 SRv6 & Packet Trimming:Scale-Across的“智能路由”

ESUN/SUE-T解决了“机柜内(Scale-Up)”的问题,但是面对“吉瓦级”算力集群Scale-Across(跨数据中心)的挑战如跨广域网的“低熵”、长距传输的无损可靠与低时延问题、故障快速恢复切换等,或许可以利用SRv6 (Segment Routing over IPv6)的“路径的可编程性(Path Programmability)”+“路径的感知性(Path Awareness)”这一套组合拳来实现AI后端网络的被动转发进化为主动防御和纠错。

那么问题来了 SRv6如何感知拥塞并快速切换路径?答案是Packet Trimming(数据包裁剪),其核心过程为:当网络(交换机)发生拥塞时,该交换机执行数据包“裁剪”并转发到目的NIC。目的NIC在收到“空信封”(Trimmed Packet)后会发送“Trim NACK”,源NIC随之在微秒级触发重传,与此同时利用SRv6的路径编程能力立即将重传包切换到一个新的、无拥塞的SID路径上。

2.1.7 空芯光纤单波1.2Tbps加速助力

最近中国电信联合长飞(YOFC)、华为和广东工业大学创造了一项突破性的传输纪录:利用空芯光纤的特性实现了高入纤功率(400G时高达40dBm),仅依赖常规的EDFA放大器便实现了400Gbps(726.1km)以及1.2Tbps(436.1km)的单跨无中继传输新纪录。其中,1.2T的成果更是全球首个单波1.2Tbps系统超200km的单跨无中继传输,此举充分验证了空芯光纤超低时延之外的应用潜力。

这一物理层 (L1) 的革命性进展,与SRv6所代表的网络层 (L3) “路径可编程性”与“路径感知性”的演进浪潮不谋而合,两者相得益彰。

这不再是“添一把火”,而是为微软、Meta等巨头未来部署“星际之门”、“Hyperion”和“Prometheus”等吉瓦级(GW-scale)项目提供了更多跨域的想象空间、端到端可编程的超融合网络蓝图梦想照进现实。

2.2 SUE-T vs UALink:同台竞争“传输层” (The Transport)

2.2.1 SUE-T(博通主导):“阳谋”的借壳上市

这是博通最精妙的一步棋——网络层博通参与开放“Ethernet for Scale-up Networking (ESUN)”,顺带将自家的SUE-T(传输层)也“借壳上市”,成为ESUN官方合作传输层指导供应商。

图5:博通定义的ESUN(网络层)与SUE(传输层)架构

由于AI Fabric中“集合通信(Collectives)占用了90%以上的带宽”,而交换机ASIC拥有远超GPU的网络带宽,有理由相信光纤网络是加速集合通信最自然、最高效的地方,所以博通推出SUE-T的“杀手锏”——“网络内集合通信(In-Network Collectives, INC)”,没有高质量、可互操作的PHY,任何开放标准都只是纸上谈兵。据说甲骨文实测的数据显示相同条件下INC可以带来集合通信完成时间2倍的提升。

看起来博通加入ESUN也带了一点私货进场——顺手将自家的SUE-T也“借壳上市”了。

2.2.2 UALink(AMD/Intel主导):被“釜底抽薪”?

UALink 1.0最初的设想是成为一个完整的、对标NVLink的“全栈”开放标准(从PHY到协议层)。

Meta, Broadcom在OCP 2025年峰会上所探讨的1.6T NIC和内存连接性(Connectivity)也是是UALink 1.0所关注的领域,另外,峰会上暂未发现关于UALink更多革命性、划时代的产品出来。

随着博通、微软、Meta等核心成员转投ESUN,UALink 1.0“另起炉灶”的努力被釜底抽薪。UALink从一个“全栈标准”的挑战者,被迫“降维”成了ESUN框架下与SUE-T竞争的“传输层”协议选项之一

图6:AI基础设施网络连接类型

03

通往“吉瓦级”算力的开放之路

3.1牌局复盘:巨头的“阳谋”与“输赢”

OCP 2025年峰会上,博通展现了其用以太网一统江湖的“阳谋”和野心——ESUN(开放网络层)和OCP SUE Transport(博通主导的传输层),成功“背刺”UALink 1.0,并将其SUE-T协议“借壳上市”为ESUN“官方传输层”候选人,与此同时博通成功的将SUE“阳谋”升级成为了全行业(包括NVIDIA和微软)共同背书的ESUN“阳谋”

峰会上博通还展示了以Tomahawk芯片为核心、SUE-T为协议的“端到端”AI网络蓝图,另外还与谷歌合作将其Bcmsim(ASIC的高保真行为仿真模型)深度集成到谷歌的“Alpine Virtual Switch (AVS)”(SONiC的虚拟交换机框架)中,此举意味着博通不仅在硬件上卡位,更在生态开发工具链的源头取得了主导地位。

而加入和共创ESUN的开放组织,也给了微软、Meta等未来部署“星际之门”、“Hyperion”和“Prometheus”等吉瓦级(GW-scale)项目创造了开放、多厂商、低TCO的统一标准,为下一步超级工程铺平了康庄大道。这看起来是一个利用市场规则(“星际之门”、“Hyperion”等千亿级GW订单)倒逼上游产业革命和开放升级,以实现自身利益(TCO与供应链安全)最大化的经济学博弈经典案例。

NVIDIA的入局,是阳谋中的阳谋,英伟达加入ESUN开放组织看似的矛盾,也有一种跟随“星际之门”、“Hyperion”和“Prometheus”等吉瓦级(GW-scale)项目满足大客户的需求的“战略防御”——一方面保订单“星际之门”、“Hyperion”等千亿级GW订单,另外一方面入场控标准,与其让对手定义标准,不如自己参与主导、控制标准:

  • 用“开放”反击“开放”: 宣布下一代“Vera Rubin”平台将“与OCP MGX兼容”,并扩大NVLink Fusion生态,将Intel, Samsung, Marvell等厂商拉入自己的“开放”生态。
  • 展示“开放”的战果: 高调宣布Meta、微软Azure、甲骨文OCI均已大规模部署其“开放”的Spectrum-X以太网交换机。

在ESUN联盟(NVIDIA/博通/微软/Meta共同站台)的万丈光芒相比,UALink有点上一代英雄落幕黯淡无光, UALink 1.0联盟有点“起了个大早,赶了个晚集”感觉。

3.2 吉瓦(GW)级算力新演义:骨干网集群VS大单机架构之争

正如“AGI小咖”在《三大超节点》一文中所述,骨干网曾面临思科 CRS-16(线卡框LCC+交换框FCC)的多机箱集群(Multi-Chassis)方案与新一代 NCS 6000 系列的大容量高密度单机(Single-Chassis)方案的对决。前者如同华为昇腾384超节点——“分布式”的Scale-Up集群;后者则如同NVIDIA GB200 NVL72——“一体化”的超级单体

骨干网当年的“集群”还是“大单机”的争论,背后也是以太网开放生态、架构解耦、供应链自由与绿色可持续性发展之争,在这一点上到与OCP的使命成为“首屈一指的AI开放系统组织(Premiere Organization for Open Systems for AI)”、生态愿景是“从芯片到系统,从物理设施到电网(From silicon to systems to physical facilities to grid)”的全栈开放遥相呼应。

3.3 新格局:“一超(NVLink)+一统(ESUN)+多强(SUE-T/UALink)”

综上所述,OCP 2025年峰会之后,AI GPU Scale-up网络百家争鸣的场面还是没有多大变化,短期内NVIDIA NVLink依旧统治金字塔尖,唯一有变的是多强局面:以太网江湖之网络层被ESUN一家独霸,而传输层则成为两个主力干将的主场——SUE-T vs UALink

那么被被釜底抽薪的UALink 1.0联盟还有机会吗?NVIDIA“拥抱”开放究竟是真心的战略转向,还是安插在ESUN内部的“特洛伊木马”?欢迎评论区留下您的判断?

媲美英伟达下一代GPU Scale-up:字节版NVLink重塑MegaScale万卡集群网络? 博通一统以太网江湖阳谋:SUE一超多强(字节Ethlink、NVLink与UALink)? 字节跳动MegaScale万卡集群复盘与推演

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-11-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AGI小咖 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档