橡树岭国家实验室(ORNL)的前沿超级计算机-Frontier 被标记为第一个使用 AMD 的 EPYC 特伦托 CPU 创建的百亿亿次级系统 。内部使用 MI250X 计算加速器.整个系统都使用HPE的 Slingshot 链接系统。它是世界上最快的超级计算机,也是世界上唯一可操作的百亿亿次级别的计算机。
AMD MI250X 计算 GPU 和HPE的Slingshot互连可能是围绕前沿超级计算机性能下降和冲突的问题的幕后原因
HPE的 Cray EX 架构是为大规模应用而创建的,研究人员将能够从 2023 年开始访问这些应用来协助科学研究。但是,这台超级计算机在保持一整天的运行中无法避免多次的硬件问题。
橡树岭的 Frontier超级计算机只能启动最多只能产生 1 个 FP64 ExaFLOPS,而系统设计为提供 1.685 FP64 ExaFLOPS。虽然没有关于具体问题的消息,但外界仍然有些不同的说法
全球运算速度最快的超级计算机Frontier
首先,Slingshot互连(为 HPE Cray 超级计算机创建的网络)与 HPE 集群冲突。不幸的是,确切问题的特殊性尚不清楚。其次,有传言称AMD本能MI250X计算GPU和EPYC特伦托CPU与Slingshot互连相冲突。对此,ORNL前沿超级计算机的项目负责人或研究人员也没有官方消息。
能源部(DOE)百亿亿次级计算项目的迈克·伯恩哈特(Mike Bernhardt)表示,从明年开始,研究人员将完全集成ORNL Frontier,但没有被引用为对前沿超级计算机的全面启动有任何担忧或问题。
ORNL在百亿亿次级努力中的合作伙伴慧与和AMD已经提前向ORNL交付了新的Frontier系统。Frontier的安装和集成是一项庞大而复杂的工作,目前的进展表明,明年如预期的那样将Frontier用于开放科学的一切正常进行。
美国能源部百亿亿次级计算项目的沟通主管迈克·伯恩哈特表示,AMD的MI250X计算GPU仅适用于特定客户,这就是为什么缺乏基准来支持传闻中的说法的原因。美国能源部与橡树岭的前沿领导计算设施密切合作。ORNL Frontier超级计算机计划在错过2022年最初的截止日期后,于2023年1月1日全面投入运营。
全球前十名超级计算机
领取专属 10元无门槛券
私享最新 技术干货