有什么比绕开网络更快？第0层存储！

Hammerspace

发布于 2025-07-27 12:53:15

1850

文章被收录于专栏：NFSNFS

在科技领域，你要么开辟新的道路，要么被困在拥堵中。第0层存储（Tier 0）不仅清理了道路上的障碍，还建造了高速公路。它消除了低效率，粉碎了瓶颈，释放了GPU的真正力量。MLPerf1.0基准结果（详见：Hammerspace使用服务器本地NVMe磁盘打造全局共享存储，在MLPerf1.0基准中创造新纪录）明确了一件事：Tier 0不是增量改造，而是一场技术创新。

1.几乎没有CPU负载

英伟达CEO黄仁勋有一句名言：“让GPU闲置是一种罪过”。Tier 0仅使用标准Linux内核，即可将服务器处理器利用率降至几乎为零。想象一下，在不对计算资源产生巨大负荷的情况下运行大量工作负载，那是纯粹的效率提升。

这不是理论上的数据，而是可以在客户生产中看到的，也是我们在验室中得到证实的。使用Tier 0，服务器可以完成它们应该做的事情：计算和运行人工智能模型，而不是浪费存储时间。

2.单个Tier 0客户端的性能优于整个Lustre集群配置

这是令人瞠目结舌的结果：单个第0层客户端：只有1个标准Linux服务器客户端节点就比4个OSS节点、8个OST节点和18个客户端的Lustre集群多支持10%的H100 GPU数量。

当我们扩大Tier 0的客户端数量后，使其与Lustre集群客户端数量一样，均为18个，此时您将可支持比Lustre多20倍的H100 GPU数量，这不是渐进式的提升，而是无与伦比的加速。

而且不需要额外的硬件，Tier 0只是利用您已经在GPU服务器上的存储空间（本地NVMe磁盘）。通过解锁你已经拥有的磁盘而已，因为客户在购买GPU服务器时就已经选配了这些NVMe磁盘，但这些磁盘严重利用不足，Tier 0技术改变了这一切，唤醒了一只在沉睡的猛兽。

这不仅仅是小聪明，而是改变了游戏规则。