理论创新VS工程实操，谁是国产大算力“实干家”？

科技旋涡

发布于 2026-06-01 13:43:12

算力，从设备走向基础设施

后摩尔时代，半导体与算力行业不断涌现新理论、新范式。

不久前，华为最新提出的“韬定律”，揭示了以时间缩微替代几何缩微的新思路。尽管外界不乏“理论空谈”声的质疑，但仍展现出中国企业在底层技术方向上的探索勇气。

当然，技术的最终价值还要靠工程落地、真机实测与规模化应用来检验。近期的天津智博会上，两大国产算力路线同场展示，恰好呈现出理念与实践并行、概念与实绩互证的行业图景。

其中，昇腾384超节点以成熟的产品形态，持续在百卡级市场验证垂直整合路线的可行性。最大算力达307P（BF16/FP16精度），单卡算力800T，可支撑千亿级参数大模型训练推理，软硬一体化设计特定场景效率突出，PUE值可低至1.1，成为算力垂直路线的一座地标。

中科曙光则选择了一条更考验工程能力的开放路径，不追求概念热度，而是用水磨工夫逐步解决开放架构面临的网络、存储、散热、调度等现实难题，算力密度大幅提升20倍、PUE降至1.04的行业极值，从单机柜640卡超节点到万卡超集群（总算力5EFlops）一路先行。

毋庸置疑，双方在集群算力赛道不断飙出新成绩，每一项指标都来自实测，每一项优势都体现在真实运行中。目前，昇腾384超节点已应用于自家盘古Ultra MoE大模型训练，曙光万卡超集群则成功在国家超算互联网核心节点上线运行，打造出全国最大单体国产AI算力池。

两大算力路线驰逐之下，也彰显出国产厂商从概念理论创新到工程实践落地的持续进阶。

尤其当算力集成规模抵达万卡级，绝非依靠简单的算力芯片堆叠而成。随着卡数从几百突破到上万，网络延迟、散热压力、故障概率、调度复杂度都会呈指数级上升。

以scaleX万卡超集群为例，曙光通过自研400G原生RDMA高速网络，才顺利突破网络传输瓶颈，把通信延迟压到1微秒以内；浸没相变液冷系统则满足了单机柜大功率散热需求，保持长期稳定运行；另外，该集群通过存算传紧耦合设计，大幅提升了模型训练时的并发读写效率，再配以数字孪生与智能调度平台，最终保障了集群的高可用与高效运维。