首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >华为展出昇腾384超节点,算力高达300PFLOPS!

华为展出昇腾384超节点,算力高达300PFLOPS!

作者头像
芯智讯
发布2026-03-19 21:37:12
发布2026-03-19 21:37:12
4840
举报
华为首次线下展出昇腾384超节点!任正非的话应验:芯片问题其实没必要担心
华为首次线下展出昇腾384超节点!任正非的话应验:芯片问题其实没必要担心

7月26日,2025世界人工智能大会(WAIC)在上海世博中心启幕,华为首次线下展出昇腾384超节点,即Atlas 900 A3 SuperPoD,支持单集群300PFLOPS算力输出。

据介绍,该产品基于超节点架构,采用全对等(Peer-to-Peer)UB 总线,将384 颗 NPU + 192 颗鲲鹏 CPU 通过无阻塞 Clos 架构互联,单跳时延 <200 ns,带宽 392 GB/s,比传统 RoCE 提升 15 倍。3168 根光纤 + 6912 个 400 G 光模块实现百纳秒级互联,支持 2 m 以上长距部署,突破了铜缆距离限制。

这些大带宽低时延互联技术,解决了昇腾384超节点集群内计算、存储等各资源之间的通信瓶颈,通过系统工程的优化,实现资源的高效调度,让超节点像一台计算机一样工作。

华为首次线下展出昇腾384超节点!任正非的话应验:芯片问题其实没必要担心
华为首次线下展出昇腾384超节点!任正非的话应验:芯片问题其实没必要担心
华为首次线下展出昇腾384超节点!任正非的话应验:芯片问题其实没必要担心
华为首次线下展出昇腾384超节点!任正非的话应验:芯片问题其实没必要担心

具体性能上,昇腾384超节点单集群 BF16 稠密算力 300 PFLOPs,约为英伟达 GB200 NVL72 的 1.7 倍。能效比(MFU)从行业平均 30% 提升到 45% 以上,已用于训练 7180 亿参数的盘古 Ultra MoE 大模型。

值得一提的是,在今年5月的鲲鹏昇腾开发者大会上,华为推出了昇腾超节点(CloudMatrix 384),成功实现业界最大规模的384卡高速总线互联。昇腾超节点具备超大带宽、超低时延、超强性能的三大优势,包括多款训练和推理产品,基于超节点创新架构,更好的满足模型训练和推理对低时延,大带宽,长稳可靠的要求。

华为首次线下展出昇腾384超节点!任正非的话应验:芯片问题其实没必要担心
华为首次线下展出昇腾384超节点!任正非的话应验:芯片问题其实没必要担心
华为首次线下展出昇腾384超节点!任正非的话应验:芯片问题其实没必要担心
华为首次线下展出昇腾384超节点!任正非的话应验:芯片问题其实没必要担心
华为首次线下展出昇腾384超节点!任正非的话应验:芯片问题其实没必要担心
华为首次线下展出昇腾384超节点!任正非的话应验:芯片问题其实没必要担心

编辑:芯智讯-浪客剑

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-07-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 芯智讯 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档