前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >WD(西数):规模化部署ZNS-SSD

WD(西数):规模化部署ZNS-SSD

作者头像
数据存储前沿技术
发布2025-02-11 16:54:26
发布2025-02-11 16:54:26
2070
举报

关键要点

1. 使用Zoned Namespaces(ZNS)可以提高闪存驱动器性能和容量,同时降低成本。

2. ZNS是一种NVMe命名空间,支持固定大小的区域用于数据放置,并模仿了主机管理SMR硬盘的ZAC/ZBC模型。

3. ZNS已经得到广泛支持,包括Linux软件生态系统、SPDK等工具库以及许多存储硬件厂商产品。

超大规模数据中心和云服务提供商(CSPs)面临着大量数据挑战,并且客户对成本效益存储和高性能的需求不断增加。

指标

常规 SSD

ZNS SSD

TLC

QLC

TLC (性能)

QLC (容量)

IOPS/TB

++

+

+++

++

吞吐量

++ (读/写)

+ (读)

+++ (读/写)

++ (读)

延迟/QoS

++

+

+++

++

生命周期

++

+

+++ (典型 >3.5 DWPD)

++ (典型 >1 DWPD)

成本 (TB/$)

+

++

++

+++

性能:IOPS/TB、吞吐量、延迟/QoS

成本影响:容量/性能

生命周期/DWPD:5-7 年(典型 >1 DWPD)

DWPD(Drive Writes Per Day)是衡量存储设备耐用性的重要指标,表示在设备的保修期内,用户每天可以安全地写入多少次其总容量。例如,若一块容量为1TB的SSD标称DWPD为1,则表示在保修期内,用户每天可以写入1TB的数据,而不影响设备的寿命。 DWPD值越高,意味着存储设备的耐用性越强,适合高写入负载的应用场景,如数据库和虚拟化环境等。这个指标对企业用户尤其重要,因为它直接影响到数据中心的可靠性和维护成本。

超大规模存储系统面临的挑战和不同类型SSD的性能比较。常规SSD(TLC和QLC)与区域命名空间SSD在多个指标(如IOPS、吞吐量、延迟和成本)上进行了对比。

ZNS-SSD在性能和生命周期方面通常优于常规SSD,尤其在高负载环境下。整体上,随着数据量的增加,存储解决方案需要更高的成本效益和性能,以满足市场需求。

问题意识

为什么使用带有分区命名空间(ZNS)的SSD?

  • • 存储块接口与NAND闪存固有特性之间的不匹配;
  • • 消除了SSD的垃圾收集(GC)和写放大(WAF),主机写入混合在同一介质上,增加了GC负担;
    • • 对SSD的性能、寿命和行为有重大影响。

吞吐量

  • • 左下图显示了ZNS SSD与传统块SSD在不同写入量下的吞吐量对比。
    • • 随着写入数据量增加,ZNS SSD是吞吐稳定在1000MB/s;而传统SSD的吞吐在数据量达到2TB左右,出现向下波动,后稳定在400-600之间。

延迟

  • • ZNS SSD与传统SSD在不同写入负载下的平均读取延迟对比。

图示了带有分区命名空间(ZNS)的SSD相较于传统SSD的优势,强调了ZNS在提高性能和一致性方面的潜力。通过消除垃圾收集和写放大问题,ZNS SSD在吞吐量和延迟上表现更佳,能够显著延长SSD的使用寿命并优化其行为。

这张图说明了在实际业务中,为保证传统SSD因写放大造成的寿命损失,需要超额配置。

  1. 1. 写放大:写放大是指在写入数据时,实际写入的闪存数据量大于用户希望写入的数据量。例如,如果用户写入1GB数据,但闪存实际上写入了1.1GB到1.4GB,这就是写放大。
  2. 2. 超额配置:超额配置是指在SSD中保留额外的闪存空间,以便在需要时使用。这可以提高性能和延长闪存的寿命,因为它允许更有效的数据管理和垃圾回收。

超额配置会造成SSD硬件成本翻倍,而基于ZNS分区命名的SSD能有效缓解。

  • • 一种支持区域抽象的NVMe™命名空间
  • • 继承了来自NVM命令集的逻辑块、LBA、I/O命令(例如,读写命令)、管理命令、日志页等现有概念
  • • 逻辑块被划分为固定大小的区域,由主机软件用于数据放置
  • • 模拟了用于主机管理的SMR HDD的ZAC/ZBC模型,以利用其现有的软件生态系统
  • • NVMe设备可以同时支持传统命名空间和分区命名空间
    • • 例如,软件更新后可用于软启动,以利用分区存储模型

右图是ZNS的架构示意图,其从NVMe命令集规范演变而来,将多个标准LBA块封装成Zone,在Zone中应用软件是顺序读写的,因而极大改善基于块擦除机制造成的SSD寿命衰减。

ZNS 标准化的历史进程,强调了行业对标准化数据放置方法的需求。

2018年成立的ZNS工作组在2020年完成了初步修订并得到认可,随后ZNS被纳入Linux和SPDK生态系统。图中还提到,Google推动的UFS标准化也纳入了Zoned Storage支持,旨在实现不同存储设备之间的统一存储模型。

随着业界在2020年前后支持SSD with ZNS[1],行业内快速适配、发展,包括:纳入Linux标准发行版、MySQL&RocksDB兼容,btrfs文件系统兼容等。

区域命名空间命令集(ZNS)在多个供应商产品中的支持情况,以及在Linux生态系统中的发展。它强调了在本地文件系统和数据库系统方面的主要成就,并指出了成功大规模部署ZNS SSD所需的关键步骤,包括标准化设备模型和云编排平台的使用。整体上,图中展示了ZNS生态系统的成长和技术支持的广泛性。

介绍了SNIA区域存储技术工作组的标准化设备模型。它强调了区域存储生态系统对SSD的依赖,以及不同SSD供应商之间的属性差异所造成的混乱。为了解决这些问题,SNIA成立了工作组,发布了区域存储模型v1.0规范,旨在统一产品、增强多源供应和促进软件互操作性。图中还展示了两个主要模型,分别针对高性能和高容量的使用案例,并列出了区域存储设备的共同要求。

右图示意:在SNIA ZNS技术小组的组织下,ZNS-SSD的路线被规划成 A-高性能方向;B-海量存储方向。

讨论了如何简化区域存储的部署,强调了与存储即服务(SAAS)提供商的集成,特别是云编排平台如Kubernetes和OpenStack。它提到SAAS通常由主要云服务提供商(如Azure、AWS、GCP)提供,并探讨了在本地和混合云环境中利用区域存储的优势。图中还列出了相关的云编排和分布式存储解决方案。

区域云存储的两个主要层面:容量和性能。

在容量方面,强调了成本的重要性以及如何实现可扩展的存储解决方案;在性能方面,重点放在吞吐量和延迟上,认为成本不是主要考虑因素。

整体上,图中提到的各种技术和平台(如 Longhorn、OpenEBS、Ceph 和 CSAL)反映了云存储领域的技术差异和各自优势。

三种现代分布式存储系统的支持技术:Longhorn、Mayastor和SPDK的CSAL。Longhorn基于btrfs,未来将支持SPDK;Mayastor则专注于将区域存储直接暴露给容器;SPDK的CSAL提供高性能存储,利用NVMe over Fabrics技术来实现传统存储的高效访问。

这些技术代表了存储领域的最新发展,旨在提高存储效率和性能。

Ceph 分布式文件系统的 Crimson 更新,强调了区域存储的集成和性能提升。Crimson 版本将提供原生的区域存储支持,写入速度提高 1.6 倍,并在延迟质量方面有显著改善。

图表中比较了区域存储(ZNS SSD)与传统存储的读写性能,显示了更高的带宽和更低的延迟。预计在 2024 年上半年正式发布。

总结了带有分区名称空间的SSD的优势,包括高性能和可预测的延迟、成本效益及支持多种新工作负载的能力。提到其寿命为5-7年,并强调了明确的存储设备模型和软件使用案例的必要性,以促进行业的广泛采用。最后,强调了开发者在这一领域的重要性。

总结

  1. 1. ZNS SSD的优势:ZNS SSD相比传统SSD,在性能、成本和寿命等方面具有显著优势,特别是针对高容量需求和降低写放大问题,表现出独特的优越性。
  2. 2. ZNS SSD的应用场景:ZNS SSD适用于各种软件生态系统,如数据库系统和分布式文件系统等,可帮助提升设备性能和优化数据布局。
  3. 3. 实现ZNS SSD的大规模部署:为了实现ZNS SSD的大规模部署,需要云计算平台的支持和多源采购策略,以便更易于采用和推广该技术。
引用链接

[1] SSD with ZNS: https://zonedstorage.io/

---【本文完】---

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-08-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 王知鱼 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 关键要点
    • 问题意识
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档