在当今这个数据驱动的时代,高性能计算和大规模数据存储已成为推动科技创新和产业升级的重要引擎。龙存科技,作为自主研发领域的佼佼者,凭借其核心产品——LoongStore大规模集群存储系统,再次展示了其在超大规模数据存储领域的卓越实力。今年上半年,我们成功部署并实施上线了一套支持GPU万卡集群的超大规模智算中心的核心并行文件系统,为行业树立了新的标杆。
项目背景
随着人工智能、大数据分析等领域的快速发展,对计算能力和数据存储的需求急剧增加。传统的存储系统在面对超大规模集群时,往往面临性能瓶颈、扩展性差等问题。龙存科技凭借对市场需求和技术趋势的深刻洞察,自主研发了LoongStore大规模集群存储系统,旨在解决这些挑战。
项目亮点
超大规模部署
本次项目中,LoongStore存储系统成功部署在了一个支持GPU万卡集群的超大规模智算中心,存储容量达到了 58 PB、GPU 计算节点超过 1250 台。这一部署不仅验证了系统的可扩展性和稳定性,也展示了龙存科技在超大规模数据存储领域的深厚积累。
快速上线与高效共享
LoongStore系统实现了快速上线,并成功支持了超过上千台计算节点的共享挂载。这一能力极大地提升了计算资源的利用率,降低了存储管理的复杂性,为科研机构和企业的数据密集型应用提供了强有力的支持。
RDMA提升存储访问性能
通过采用RDMA(远程直接内存访问)技术,LoongStore系统显著提高了存储访问性能。RDMA技术减少了数据传输过程中的延迟和开销,使得数据在存储节点和计算节点之间的传输更加高效,从而提升了整体系统的计算效率。
数千亿级别小文件高性能存储
在人工智能和大数据分析等领域,小文件存储是一个常见的挑战。LoongStore系统通过优化存储结构和算法,成功实现了对数千亿级别小文件的高性能存储,满足了这些领域对存储系统的严苛要求。
国产化硬件和操作系统兼容
龙存科技积极响应国家自主可控的号召,LoongStore系统全面兼容了国产化的硬件和操作系统。这一举措不仅提升了系统的安全性和可靠性,也为国内用户提供了更加便捷和高效的存储解决方案。
多协议互通与空间优化
LoongStore系统在一个共享存储池里面同时提供了文件、对象等存储协议,并实现了协议互通。这一创新设计不仅提高了协议之间数据共享访问的效率,还减少了空间浪费,为用户提供了更加灵活和高效的存储选择。
项目成果
自系统上线以来,LoongStore大规模集群存储系统一直运行稳定高效。它满足了智算中心对高性能数据存储的需求,为科研机构和企业的数据密集型应用提供了强有力的支持。这一项目的成功实施,不仅验证了龙存科技在超大规模数据存储领域的领先地位,也为行业树立了新的标杆。
其他相关文章
北京市海淀区知春路63号51号楼502
领取专属 10元无门槛券
私享最新 技术干货