受美国DARPA“快速网络接口卡”(FastNIC)项目资助,Perspecta实验室的研究人员提出了一种初步设计方案,称为“以10Tb加速执行的快速通道”(FLEET)。
2019年,DARPA启动FastNIC项目,旨在研发新的接口与传输系统,将机器学习分类器的分布式训练等加速1000倍。FLEET的核心是光网络接口卡(O-NIC),该接口卡符合PCIe总线标准,可直接插入计算机的接口插槽。O-NIC卡之间通过光子学连接器,由微机电系统开关控制,可以12Tbps的速度进行高效、低开销、透明零拷贝的内存数据传输。此外,O-NIC上还有FPGA芯片,提供安全校验、内存地址转换、虚拟化等功能。FLEET以集群方式构建,单个集群由4台服务器、3个GPU组、3个NVMe高速存储器组成,服务器、GPU、NVMe之间采用光纤连接。每组GPU包含8个GPU芯片,每个GPU芯片都有一个O-NIC。每台服务器包含8个CPU,每个CPU有3个O-NIC。初步分析表明,2台服务器之间可以12Tbps的速度交换数据,服务器可以12Tbps的速度从NVMe读取数据,3台服务器可以2+10Tbps的方式交换数据。
这项研究利用光网络接口卡,提高了内存数据交换效率,待技术成熟后,有望大幅改善高性能计算机分布式计算的计算性能。
领取专属 10元无门槛券
私享最新 技术干货