1. 使用Zoned Namespaces(ZNS)可以提高闪存驱动器性能和容量,同时降低成本。
2. ZNS是一种NVMe命名空间,支持固定大小的区域用于数据放置,并模仿了主机管理SMR硬盘的ZAC/ZBC模型。
3. ZNS已经得到广泛支持,包括Linux软件生态系统、SPDK等工具库以及许多存储硬件厂商产品。
超大规模数据中心和云服务提供商(CSPs)面临着大量数据挑战,并且客户对成本效益存储和高性能的需求不断增加。
指标 | 常规 SSD | ZNS SSD | ||
---|---|---|---|---|
TLC | QLC | TLC (性能) | QLC (容量) | |
IOPS/TB | ++ | + | +++ | ++ |
吞吐量 | ++ (读/写) | + (读) | +++ (读/写) | ++ (读) |
延迟/QoS | ++ | + | +++ | ++ |
生命周期 | ++ | + | +++ (典型 >3.5 DWPD) | ++ (典型 >1 DWPD) |
成本 (TB/$) | + | ++ | ++ | +++ |
性能:IOPS/TB、吞吐量、延迟/QoS
成本影响:容量/性能
生命周期/DWPD:5-7 年(典型 >1 DWPD)
DWPD(Drive Writes Per Day)是衡量存储设备耐用性的重要指标,表示在设备的保修期内,用户每天可以安全地写入多少次其总容量。例如,若一块容量为1TB的SSD标称DWPD为1,则表示在保修期内,用户每天可以写入1TB的数据,而不影响设备的寿命。 DWPD值越高,意味着存储设备的耐用性越强,适合高写入负载的应用场景,如数据库和虚拟化环境等。这个指标对企业用户尤其重要,因为它直接影响到数据中心的可靠性和维护成本。
超大规模存储系统面临的挑战和不同类型SSD的性能比较。常规SSD(TLC和QLC)与区域命名空间SSD在多个指标(如IOPS、吞吐量、延迟和成本)上进行了对比。
ZNS-SSD在性能和生命周期方面通常优于常规SSD,尤其在高负载环境下。整体上,随着数据量的增加,存储解决方案需要更高的成本效益和性能,以满足市场需求。
为什么使用带有分区命名空间(ZNS)的SSD?
吞吐量
延迟
图示了带有分区命名空间(ZNS)的SSD相较于传统SSD的优势,强调了ZNS在提高性能和一致性方面的潜力。通过消除垃圾收集和写放大问题,ZNS SSD在吞吐量和延迟上表现更佳,能够显著延长SSD的使用寿命并优化其行为。
这张图说明了在实际业务中,为保证传统SSD因写放大造成的寿命损失,需要超额配置。
超额配置会造成SSD硬件成本翻倍,而基于ZNS分区命名的SSD能有效缓解。
右图是ZNS的架构示意图,其从NVMe命令集规范演变而来,将多个标准LBA块封装成Zone,在Zone中应用软件是顺序读写的,因而极大改善基于块擦除机制造成的SSD寿命衰减。
ZNS 标准化的历史进程,强调了行业对标准化数据放置方法的需求。
2018年成立的ZNS工作组在2020年完成了初步修订并得到认可,随后ZNS被纳入Linux和SPDK生态系统。图中还提到,Google推动的UFS标准化也纳入了Zoned Storage支持,旨在实现不同存储设备之间的统一存储模型。
随着业界在2020年前后支持SSD with ZNS[1],行业内快速适配、发展,包括:纳入Linux标准发行版、MySQL&RocksDB兼容,btrfs文件系统兼容等。
区域命名空间命令集(ZNS)在多个供应商产品中的支持情况,以及在Linux生态系统中的发展。它强调了在本地文件系统和数据库系统方面的主要成就,并指出了成功大规模部署ZNS SSD所需的关键步骤,包括标准化设备模型和云编排平台的使用。整体上,图中展示了ZNS生态系统的成长和技术支持的广泛性。
介绍了SNIA区域存储技术工作组的标准化设备模型。它强调了区域存储生态系统对SSD的依赖,以及不同SSD供应商之间的属性差异所造成的混乱。为了解决这些问题,SNIA成立了工作组,发布了区域存储模型v1.0规范,旨在统一产品、增强多源供应和促进软件互操作性。图中还展示了两个主要模型,分别针对高性能和高容量的使用案例,并列出了区域存储设备的共同要求。
右图示意:在SNIA ZNS技术小组的组织下,ZNS-SSD的路线被规划成 A-高性能方向;B-海量存储方向。
讨论了如何简化区域存储的部署,强调了与存储即服务(SAAS)提供商的集成,特别是云编排平台如Kubernetes和OpenStack。它提到SAAS通常由主要云服务提供商(如Azure、AWS、GCP)提供,并探讨了在本地和混合云环境中利用区域存储的优势。图中还列出了相关的云编排和分布式存储解决方案。
区域云存储的两个主要层面:容量和性能。
在容量方面,强调了成本的重要性以及如何实现可扩展的存储解决方案;在性能方面,重点放在吞吐量和延迟上,认为成本不是主要考虑因素。
整体上,图中提到的各种技术和平台(如 Longhorn、OpenEBS、Ceph 和 CSAL)反映了云存储领域的技术差异和各自优势。
三种现代分布式存储系统的支持技术:Longhorn、Mayastor和SPDK的CSAL。Longhorn基于btrfs,未来将支持SPDK;Mayastor则专注于将区域存储直接暴露给容器;SPDK的CSAL提供高性能存储,利用NVMe over Fabrics技术来实现传统存储的高效访问。
这些技术代表了存储领域的最新发展,旨在提高存储效率和性能。
Ceph 分布式文件系统的 Crimson 更新,强调了区域存储的集成和性能提升。Crimson 版本将提供原生的区域存储支持,写入速度提高 1.6 倍,并在延迟质量方面有显著改善。
图表中比较了区域存储(ZNS SSD)与传统存储的读写性能,显示了更高的带宽和更低的延迟。预计在 2024 年上半年正式发布。
总结了带有分区名称空间的SSD的优势,包括高性能和可预测的延迟、成本效益及支持多种新工作负载的能力。提到其寿命为5-7年,并强调了明确的存储设备模型和软件使用案例的必要性,以促进行业的广泛采用。最后,强调了开发者在这一领域的重要性。
[1]
SSD with ZNS: https://zonedstorage.io/
---【本文完】---