首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >KIOXIA:既要容量又要性能?混合模式QLC-SSD重塑存储TCO

KIOXIA:既要容量又要性能?混合模式QLC-SSD重塑存储TCO

作者头像
数据存储前沿技术
发布2026-01-28 16:12:24
发布2026-01-28 16:12:24
3740
举报

阅读收获

  • 掌握 pSLC 物理实现与 4KB IU 映射粒度的核心关联,精准识别优化随机写入性能的底层逻辑。
  • 评估混合模式 SSD 如何通过消除“插槽税”和提升 RAID 空间利用率,在系统层面实现真正的 TCO 优化。
  • 洞察 NVMe 协议在物理隔离与 QoS 保障方面的演进趋势,识别未来 PLC 时代存储分层技术的潜在挑战。

全文概览

在数据中心存储架构中,我们长期面临一个“鱼与熊掌”的困境:想要极致的随机读写性能,就得忍受 SLC 昂贵的单价和极低的存储密度;想要海量容量,QLC 的写入寿命和随机性能又让人望而却步。为了平衡两者,架构师们不得不额外配置昂贵的缓存盘,但这不仅占用了宝贵的物理插槽,还增加了运维复杂度。

你是否曾想过,如果一块 SSD 能同时拥有 SLC 的快和 QLC 的大,且比例还能由软件定义,存储架构会发生怎样的质变?本文将深入探讨 Mixed Mode SSD 技术,看它如何通过 pSLC 与 QLC 的“同构异质”设计,在单一硬件内实现性能与成本的完美平衡,并思考这种变革将如何应对 AI 时代下严苛的 IO 挑战。

👉 划线高亮 观点批注


Mixed Mode SSD(混合模式固态硬盘)
Mixed Mode SSD(混合模式固态硬盘)

Mixed Mode SSD(混合模式固态硬盘)

图片的核心在于推介一种 基于“分区技术”的混合模式SSD架构,其核心观点如下:

  1. 二合一的架构理念: 该技术主张在同一个SSD物理硬件上,同时划分出 pSLC(高性能/高寿命区)QLC(大容量/低成本区)。这种“混合模式”旨在解决传统SSD在性能(SLC/TLC)与容量/成本(QLC)之间只能二选一的痛点。
  2. 极致的部署灵活性(Software-Defined): 这是该技术最大的卖点。用户不需要购买特定规格的硬件,而是可以通过固件或软件 自定义 pSLC 与 QLC 的比例。这使得同一批硬件可以适应多种不同的应用场景(如缓存密集型或容量密集型)。
  3. TCO(总体拥有成本)优化:
    • 简化运维: 通过减少FRU种类,降低了库存复杂度和供应链成本。
    • 性能与寿命平衡: 利用pSLC处理高频随机写入(提升IOPS和耐用性),利用QLC提供海量存储空间,从而在不牺牲太多寿命的前提下利用QLC的低成本优势。

一句话技术提炼: Mixed Mode SSD通过在单一设备内灵活划分pSLC和QLC区域,实现了高性能(IOPS/耐用性)与大容量的完美结合,并显著降低了数据中心的硬件库存管理难度。

pSLC 的物理层实现原理

NAND Flash 存储数据的原理是通过控制单元内的电荷量来划分不同的电压状态。

  • SLC (真正的 SLC): 只有 2 种电压状态(0 或 1)。电压判定非常简单,容错率极高。
  • QLC (四层单元): 有 种电压状态。为了在同一个单元里塞进 4 bit,电压被切分得非常细,相邻状态之间的干扰(电子泄露、读写干扰)极大,导致写入慢、寿命短。

pSLC 的做法:

它在物理上使用的是 QLC 或 TLC 的颗粒,但强制忽略中间的复杂状态,只使用电压最低(全空)和电压最高(全满)的两个极端状态来表示 0 和 1。

  • 技术效果:
    • 容错空间暴增: 就像从“在钢丝上跳舞”变成了“在足球场上跑步”,判定 0 和 1 变得极度轻松,不需要精确的纠错算法(ECC)反复校验。
    • 速度提升: 写入时不需要小心翼翼地微调电压,直接“拉满”或“清空”,速度接近原生 SLC。

为什么市场和用户需要这种混合模式
为什么市场和用户需要这种混合模式

为什么市场和用户需要这种混合模式

Mixed Mode SSD 是为了应对现实世界中“复杂且不均匀”的工作负载而生的。

  1. 解决“混合负载”的痛点: 现实中的业务场景很少是纯粹的顺序写入或纯粹的随机读取。Mixed Mode SSD 通过内部硬件分区,完美匹配了以下这对矛盾:
    • pSLC 区 负责处理:小块随机写入、热数据、元数据、短期缓存(Ingestion Buffer)。
    • QLC 区 负责处理:大块顺序写入、冷数据、用户实际数据、长期存储。
  2. 数据分层(Data Tiering)的内化: 传统架构可能需要购买昂贵的 SLC/SAS SSD 做缓存层,再买廉价 SATA/QLC SSD 做容量层。Mixed Mode SSD 将这种**“分层架构”直接做进了一块盘里**。
  3. 灵活性的价值: 强调了 Configuration Flexibility(配置灵活性) 的必要性。不同的客户(Voice of Customer)有不同的 IO 流特征,因此允许用户自定义 pSLC 和 QLC 的比例,是该技术满足多样化存储需求的关键能力。

不同IO模式下的pSLC和QLC性能对比
不同IO模式下的pSLC和QLC性能对比

不同IO模式下的pSLC和QLC性能对比

图片用数据回答了 “为什么我们需要 Mixed Mode SSD(尤其是 pSLC)?” 以及 “如何优化它?”

  1. 决胜战场在“随机写入”: 在顺序读取上,pSLC 和 QLC 没区别;在顺序写入上,pSLC 虽快但受容量限制。唯独在 随机写入(Random Write) 上,pSLC 展现出了不可替代的巨大优势。这是混合模式 SSD 存在的根本原因——为了弥补 QLC 随机写入极慢的短板。
  2. IU(Indirection Unit)粒度定成败: 这是非常硬核的技术细节。仅仅有 pSLC 介质是不够的,固件算法必须配合。
    • 关键发现: 必须使用 4KB IU(4KB 映射单元) 才能释放 pSLC 的潜能。
    • 原因推测: 如果使用 16KB IU 来处理 4KB 的随机数据,会导致严重的“写放大”和“读-改-写”开销,导致高性能的 pSLC 也跑不快。
  3. 应用指导: 对于存储系统设计者,这张图暗示了:如果你要用 Mixed Mode SSD 处理高频交易或数据库等随机业务,务必确保 FTL(闪存转换层)采用 4KB 的管理粒度,否则 pSLC 的价值将被浪费。

AI场景的SSD IO特征,一来是查询过程的IOPS负担高,二来是KV更新过程的小块随机读写,业务负载特征证明pSLC的场景价值。


容量与性能/寿命之间的交换汇率
容量与性能/寿命之间的交换汇率

容量与性能/寿命之间的交换汇率

图片的核心观点是:Mixed Mode SSD 是一场“空间换性能”的昂贵交易,其交换比率通常为 4:1。

  1. 残酷的数学(1:4 比例): 在基于 QLC 的 SSD 中,物理介质决定了 pSLC 模式的容量仅为原生 QLC 模式的 25%。这是物理定律(1 bit vs 4 bit)决定的硬性天花板。
  2. 为什么 pSLC 区域通常很小? PPT 中提到的“客户之声”指出,典型配置仅为 0.5% ~ 2%。原因就在于图表展示的斜率——太贵了。为了获得 1TB 的高性能 pSLC 空间,必须“烧掉” 4TB 的 QLC 存储潜力。因此,企业只会在最刀刃的地方(如元数据、写缓存)使用它。
  3. 技术演进的代价(1:8): 展望未来(PLC 时代),这种交换会变得更加“奢侈”,可能达到 1:8 的折损率。这暗示了随着存储密度增加,获得高性能/高耐久空间的相对成本在上升。

一句话总结: Mixed Mode Capacities 展示了 QLC 转化为 pSLC 时面临的 4倍容量惩罚(Capacity Penalty),解释了为什么这种高性能混合模式虽然强大,但在实际部署中通常只作为小容量的“战术缓冲层”使用。


SLC单盘与pSLC融合方案对比
SLC单盘与pSLC融合方案对比

SLC单盘与pSLC融合方案对比

图片从TCO(总拥有成本)系统架构的高度,论证了 Mixed Mode SSD 相比传统“独立缓存盘”方案的压倒性优势。

  1. 消灭“插槽税”(Slot Tax): 传统方案为了获得一点点高性能缓存,必须牺牲宝贵的物理插槽去插小容量的 SLC 盘,导致总存储容量下降。Mixed Mode SSD 让每一块盘都既是“容量盘”又是“缓存盘”,最大化利用了物理空间。
  2. 更优的数据保护效率(Mirror vs Parity):
    • 独立 SLC 盘: 数量少,通常只能做 RAID 1 镜像,空间浪费一半(50% 利用率)。
    • 混合模式 pSLC: 分布在所有盘上,可以做 RAID 5/6(奇偶校验),空间利用率极高(通常 >80%)。
    • 结果: 在占用更少资源的情况下,提供了双倍甚至更多的可用高性能空间(对比图中:3.2TB vs 6.1TB)。
  3. 极简运维(1个 FRU): 数据中心不再需要维护“缓存盘”和“容量盘”两种备件。一种盘通吃所有场景,降低了供应链和维护的复杂度。

一句话总结: Mixed Mode SSD 通过将 SLC 层“虚拟化”并分布到所有硬盘中,消除了物理插槽的浪费,实现了更高效的 RAID 校验保护,并简化了硬件供应链,是比“独立 SLC 盘”更优的系统级解决方案。


混合模式配置灵活性,允许用户在部署或扩容时进行灵活定义
混合模式配置灵活性,允许用户在部署或扩容时进行灵活定义

混合模式配置灵活性,允许用户在部署或扩容时进行灵活定义

图片的核心观点是:Mixed Mode SSD 具备“软件定义存储”的灵活性,能够根据系统生命周期的不同阶段动态调整性能与容量的平衡。

  1. 打破硬件锁定(No Hardware Lock-in): 用户无需在采购阶段就锁死 SSD 的性能/容量规格。同一款硬件,可以通过固件或管理工具,变成“高耐久型”(大比例 pSLC)或“大容量型”(小比例 pSLC)。
  2. 全生命周期优化(Lifecycle Optimization):
    • Day 1(部署日): 可以设置较高的 pSLC 比例以应对初始的高负载或元数据需求。
    • Day N(扩容日): 随着集群规模扩大(Scale-out),单盘的性能压力可能被分散,此时可以调低 pSLC 比例(如从 3% 降至 1%),以获取最大化的存储容量,避免资源浪费。
  3. 精细化管理(Fine Tuning): 支持细粒度的比例调整,让存储架构师能够精确计算 TCO(总拥有成本),在“昂贵的性能”和“廉价的容量”之间找到最适合当前业务的黄金分割点。

pSLC 逻辑架构与物理实现
pSLC 逻辑架构与物理实现

pSLC 逻辑架构与物理实现

图片从架构实现的角度定义了 Mixed Mode SSD:它不仅仅是一个带有缓存的硬盘,而是在同一块物理 PCB 上,通过固件和协议硬生生切分出的两个物理隔离的存储池

  1. 静态分区(Static Partitioning): 与消费级 SSD 动态变化的 SLC Cache 不同,企业级 Mixed Mode 是永久性的。一旦在部署首日(Day 1)划定了 pSLC 区域,这部分物理块就被“烧录”为 pSLC 模式,不能反悔退回给 QLC 使用。
  2. 物理与性能隔离(Isolation): 通过 Endurance GroupFDP 技术,pSLC 和 QLC 在底层是完全隔绝的。这意味着:
    • 磨损隔离: pSLC 的高频擦写不会消耗 QLC 的寿命配额。
    • 性能隔离: 即使 QLC 区域正在进行繁重的垃圾回收(GC),也不会拖慢 pSLC 区域的读写速度。
  3. 主机可见性(Host Visibility): 这种分层对操作系统是显式可见的。系统会看到独立的 Namespace(逻辑盘),管理员需要显式地将元数据或日志写入 pSLC 对应的盘符,将冷数据写入 QLC 对应的盘符,而不是依赖 SSD 内部黑盒算法自动分层。

永久刻录和灵活配置的场景理解

“Mixed Mode Configuration Flexibility” 这张图中,展示了从 3% pSLC (Initial) 变为 1% pSLC (Expansion),这不代表它是对同一块盘进行了在线修改。

  • 场景还原:
    • Day 1(初始期): 你买了 100 块 SSD 组建集群。因为盘少,总 IOPS 可能不够,所以你配置每块盘拿出 3% 做 pSLC 来抗压。这些盘被“烧录”为 3% 版本。
    • Day N(扩容期): 业务增长,你又新买了 100 块同样的 SSD 加入集群。此时总盘数多了,性能不再是瓶颈,容量才是瓶颈。
    • 灵活性的体现: 对于这新买的 100 块盘,你不需要沿用旧配置,而是可以利用“灵活性”将它们配置为 1% pSLC 版本。
    • 结果: 你的集群里同时存在“3% 版本”的老盘和“1% 版本”的新盘。这就是图中所说的“根据系统配置(Dependent on system configuration)”进行的灵活调整。

如何真的“反悔”?(技术上的重置)

虽然 PPT 说“Cannot be deleted once created(一旦创建不可删除)”,这通常指的是在保留数据或保留当前命名空间的前提下不可逆。

在实际的企业级运维中,如果你真的想把一块已经划分为 10% pSLC 的盘改成 1% pSLC,通常的做法是:

  1. 迁移数据: 把这块盘的数据全部挪走。
  2. 底层重置: 执行 NVMe 格式化命令(Format NVM)或安全擦除(Sanitize),这会将 SSD 彻底恢复出厂状态。
  3. 重新配置: 此时回到了“Day 1”状态,你可以重新划定新的比例。
用混合模式平衡性能
用混合模式平衡性能

用混合模式平衡性能

Mixed Mode SSD 通过硬件的“同构化”,解决了系统级的“负载不均衡”问题。

  1. 消除物理热点(Eliminating Hotspots): 传统架构把“快盘”和“慢盘”物理分离,导致插“快盘”的物理位置(槽位、背板、机柜)成为拥堵的瓶颈。Mixed Mode SSD 让每一块盘都既是快盘又是慢盘,从物理上消灭了瓶颈。
  2. PCIe 通道利用率最大化: 这是数据中心非常看重的 TCO 指标。在混合模式下,不会出现“昂贵的 PCIe 通道只跑着低速 QLC 流量”的浪费情况,每一条通道都能被 pSLC 的高速流量充分利用。
  3. 极简运维与线性扩展: 运维人员不再需要精心计算“这个机柜插几块 SLC,那个机柜插几块 QLC”。所有节点配置整齐划一,扩容时只需简单的“复制粘贴”(添加同样的盘),系统性能和容量呈线性同步增长。

一句话总结: Mixed Mode SSD 不仅优化了单盘性能,更在系统架构层面实现了流量与硬件资源的完美对称分布,避免了传统分层存储带来的局部过载和资源闲置问题。


Mixed Mode SSD 在微观物理层面是如何工作的,重点解释 pSLC 和 QLC 是如何共用底层硬件资源
Mixed Mode SSD 在微观物理层面是如何工作的,重点解释 pSLC 和 QLC 是如何共用底层硬件资源

Mixed Mode SSD 在微观物理层面是如何工作的,重点解释 pSLC 和 QLC 是如何共用底层硬件资源

Mixed Mode SSD 在微观上实现了“资源共享,逻辑隔离”,通过 Die 级均衡技术最大化硬件利用率。

  1. 同源异构(Shared Silicon): pSLC 和 QLC 物理上是“一家人”,住在同一个 Die 里。这不仅节省了成本(不需要额外采购 SLC 颗粒),还简化了电路板设计。
  2. Die 级并行(Die-level Parallelism): 通过在每个 Die 上都分配 pSLC 块,SSD 可以利用多通道并行写入的优势。如果 pSLC 集中在某一颗 Die 上,那性能就会受限于单颗 Die 的带宽;分散到所有 Die 上,性能就能线性倍增。
  3. IO 均衡挑战(Balancing Act): 既然共用物理资源,就会存在资源争抢。图中的 "Die IO Balancing" 是控制器的核心竞争力所在,它确保了在混合负载下,pSLC 的低延迟特性不会被 QLC 的后台操作(如垃圾回收)所拖累。

一句话总结: 这张图揭示了 Mixed Mode SSD 的物理本质——通过在共享的 NAND Die 上交错分布 pSLC 和 QLC 块,并利用智能 IO 均衡技术,在同一块硅片上同时实现了极速写入和海量存储。


Mixed Mode SSD 如何适配现有的 NVMe 标准体系
Mixed Mode SSD 如何适配现有的 NVMe 标准体系

Mixed Mode SSD 如何适配现有的 NVMe 标准体系

图片的核心观点是:Mixed Mode SSD 的落地不仅靠硬件创新,还需要 NVMe 协议标准的支撑,特别是在资源锁定机制和 QoS 保障方面。

  1. “永久性”写入标准: Mixed Mode SSD 的静态分区特性(Static Partitioning)被写入了规范。pSLC 的耐久度组和命名空间被定义为 "Permanent"(永久)"Undeletable"(不可删除),这从协议层面保障了企业级存储架构的稳定性,防止配置漂移。
  2. 主机感知的属性(Attribute): 通过标准化的命名空间属性,主机端软件(OS/文件系统)能够自动识别 pSLC 和 QLC 区域。这使得上层应用无需猜测,就能准确地将热数据路由到 pSLC。
  3. QoS 挑战与 TP 4176: 图片点出了混合介质面临的最大技术难题——如何防止“吵闹的邻居”(Noisy Neighbor)。即如何防止 QLC 的内部操作干扰 pSLC 的性能。引用的 TP 4176 表明 NVMe 组织正在制定相关标准(如更精细的隔离或限速机制),以确保这种新型 SSD 能满足企业级严格的服务质量要求。

延伸思考

这次分享的内容就到这里了,或许以下几个问题,能够启发你更多的思考,欢迎留言,说说你的想法~

  • 混合模式 SSD 强调“静态分区”以保障企业级稳定性,但在业务负载剧烈波动的云环境下,这种“不可轻易在线更改”的特性是否会成为新的资源瓶颈?
  • 面对 AI 业务中高频的元数据更新和小块 KV 读写,Mixed Mode SSD 带来的 4:1 容量惩罚与性能收益之间,是否存在一个普适的“黄金比例”?
  • 当存储介质向 PLC(5-bit)演进,容量折损率可能高达 1:8,这种情况下混合模式 SSD 的经济性边界在哪里?

原文标题:Mixed Mode SSD[1]

Notice:Human's prompt, Datasets by Gemini-3-Pro

#FMS25 #QLC大容量闪存生态

---【本文完】---

👇阅读原文,搜索🔍更多历史文章。

丰子恺-护生画集-暗杀·其二


  1. https://files.futurememorystorage.com/proceedings/2025/20250806_SSDT-203-1_Klemm.pdf ↩
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-01-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 王知鱼 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 如何真的“反悔”?(技术上的重置)
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档