首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >理论创新VS工程实操,谁是国产大算力“实干家”?

理论创新VS工程实操,谁是国产大算力“实干家”?

作者头像
科技旋涡
发布2026-06-01 13:43:12
发布2026-06-01 13:43:12
50
举报

算力,从设备走向基础设施

后摩尔时代,半导体与算力行业不断涌现新理论、新范式。

不久前,华为最新提出的“韬定律”,揭示了以时间缩微替代几何缩微的新思路。尽管外界不乏“理论空谈”声的质疑,但仍展现出中国企业在底层技术方向上的探索勇气。

当然,技术的最终价值还要靠工程落地、真机实测与规模化应用来检验。近期的天津智博会上,两大国产算力路线同场展示,恰好呈现出理念与实践并行、概念与实绩互证的行业图景。

其中,昇腾384超节点以成熟的产品形态,持续在百卡级市场验证垂直整合路线的可行性。最大算力达307P(BF16/FP16精度),单卡算力800T,可支撑千亿级参数大模型训练推理,软硬一体化设计特定场景效率突出,PUE值可低至1.1,成为算力垂直路线的一座地标。

中科曙光则选择了一条更考验工程能力的开放路径,不追求概念热度,而是用水磨工夫逐步解决开放架构面临的网络、存储、散热、调度等现实难题,算力密度大幅提升20倍、PUE降至1.04的行业极值,从单机柜640卡超节点到万卡超集群(总算力5EFlops)一路先行。

毋庸置疑,双方在集群算力赛道不断飙出新成绩,每一项指标都来自实测,每一项优势都体现在真实运行中。目前,昇腾384超节点已应用于自家盘古Ultra MoE大模型训练,曙光万卡超集群则成功在国家超算互联网核心节点上线运行,打造出全国最大单体国产AI算力池。

两大算力路线驰逐之下,也彰显出国产厂商从概念理论创新到工程实践落地的持续进阶。

尤其当算力集成规模抵达万卡级,绝非依靠简单的算力芯片堆叠而成。随着卡数从几百突破到上万,网络延迟、散热压力、故障概率、调度复杂度都会呈指数级上升。

scaleX万卡超集群为例,曙光通过自研400G原生RDMA高速网络,才顺利突破网络传输瓶颈,把通信延迟压到1微秒以内;浸没相变液冷系统则满足了单机柜大功率散热需求,保持长期稳定运行;另外,该集群通过存算传紧耦合设计,大幅提升了模型训练时的并发读写效率,再配以数字孪生与智能调度平台,最终保障了集群的高可用与高效运维。

更重要的是,这套系统采用了更复杂的开放架构,进一步加大系统集成难度的同时,也实现了兼容多品牌国产加速卡,全面适配主流AI框架与数百款大模型,进而有效降低用户迁移成本与厂商绑定风险,更适合当前国产芯片多元发展和现实场景需求快速迭代的市场环境。

综合来看,理论创新为产业点亮方向,而工程突破则把方向变成现实。“韬定律”的价值验证可能还需要时间,但其所倡导的系统优化理念,正在万卡集群上以另一种路径落地成真,为国产算力用户转化为看得见、用得上、可量化的产品力。

声明:此公号(ID:TechVortex)发布内容和图片的目的在于传播更多信息,版权归原作者所有,不为商业用途,如有侵犯,敬请作者与我们联系。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-05-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 科技旋涡 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档