关键要点
- 1. 下一代存储控制器需要考虑增加新的功能,如CXL接口和计算引擎。
- 2. 增加容量和功率效率是未来存储控制器的关键设计准则。
- 3. 在存储设备中使用近数据计算可以提高性能并减少接口速度和设备容量的加倍。
- 4. 使用高效的性能扩展和扁平内存寻址技术来实现下一代存储设备的设计目标。
- 5. Arm的技术可以帮助实现高效能、低功耗的下一代存储控制器。
问题意识:存储控制器的发展趋势
1. 增加容量
- • TLC SSD目前有16TB和32TB的大容量
- • QLC SSD即将推出64TB和128TB的超大容量
2. 高效能表现
- • 设计目标:饱和主机接口总线以实现最大带宽
- • PCIe Gen5和Gen6,UFS和eMMC
3. CXL连接性
- • CXL提供低延迟和一致的接口,允许主机远程连接到SSD存储、存储级内存和DRAM池
4. 分散计算
- • 不再将所有数据移至主机进行处理,而是在数据所在的驱动器内部进行处理
UFS(Universal Flash Storage)和eMMC(embedded MultiMediaCard)是两种常见的嵌入式闪存存储技术,广泛应用于智能手机、平板电脑和其他移动设备。
UFS(Universal Flash Storage)
- • 性能:UFS提供更高的读写速度,支持全双工数据传输,意味着可以同时进行读写操作,从而提高性能。
- • 架构:基于SCSI(Small Computer System Interface)协议,具有更低的延迟和更高的效率。
- • 应用:适用于高性能需求的设备,如旗舰手机和高端平板电脑。
eMMC(embedded MultiMediaCard)
- • 性能:相较于UFS,eMMC的速度较慢,通常采用半双工数据传输,即在同一时间只能进行读或写操作。
- • 架构:基于MMC(MultiMediaCard)协议,适用于对性能要求较低的应用。
- • 应用:常用于入门级手机、平板电脑和一些物联网设备。
展示了PCIe和UFS接口的速度与存储容量的快速增长,强调了在未来2-3年内,这些技术将继续双倍增长的挑战。PCIe的速度从4 GB/s到64 GB/s,而UFS则从0.3 GB/s提升至11.6 GB/s。
关键设计标准是电源效率和内存寻址,未来存储设备需要在性能和能效之间取得平衡。
PCIe Gen6 SSDs
- • 最高性能、功能齐全的 Cortex-R 用于下一代 SSD 和 HDD 控制器
- • Armv8-R ISA 提供确定性低延迟
- • 64 位支持更高的容量,最多支持 1TB 的扁平内存空间
- • TrustZone 兼容性在隔离的安全环境中运行
- • Neon 用于机器学习性能
- • MMU 用于嵌入式 Linux 和分解计算
- • +35% 性能效率
- • +20% 能源效率
- • +15% 空间效率
UFS 5.0 嵌入式闪存
- • 经过 PPA 优化的、功能齐全的 Cortex-M 用于下一代 UFS 和 eMMC 控制器
- • Armv8-M ISA 提供超低延迟
- • Arm 自定义指令高效执行工作负载
- • TrustZone 执行安全、隔离计算
- • PAC/BTI 用于可靠和安全操作
- • Helium 向量扩展用于机器学习和 DSP 性能
- • 4 倍机器学习性能
- • 3 倍 DSP 性能
展示了Cortex-R82处理器在不同频率和功率条件下的基准测试结果。它显示了在1.8GHz时,性能提升了55%,且功耗效率提高了20%。
当频率降低到1.15GHz时,保持相同性能的情况下,功耗降低了18%。保持1.15GHz频率进一步降低电压时,依然保持相同性能,但功耗降低了44%。这表明Cortex-R82在功耗管理方面具有显著优势。
关于 Dhrystone benchmark
- 1. 测试内容:Dhrystone 测试程序主要测量整数运算、字符串处理及控制结构的执行效率,适合用于评估非浮点运算的性能。
- 2. 单位:通常以“Dhrystones per second”来表示性能,即每秒执行的 Dhrystone 任务数量。
展示了下一代解耦和可组合数据中心的存储控制器架构,强调了不同类型 CPU(前端、近数据、后端)和存储组件(如 SRAM 和 DRAM)的协作。图中提到,未来的控制器需整合新功能,包括 CXL 接口和计算引擎,以提升性能和灵活性。
Cortex -A/R/M 的区别是什么?使用场景差异?
Cortex系列被分为三大类:Cortex-A,Cortex-R,和Cortex-M,每一系列针对不同的应用场景进行了优化。
- 1. Cortex-A 系列:
- • 特点:高性能,复杂操作系统支持,适用于需要高计算能力和多任务处理的应用。
- • 使用场景:主要用于智能手机、平板电脑、电视、服务器、高端嵌入式应用等。例如,Cortex-A53 和 Cortex-A76 是常见的在手机和平板电脑中使用的处理器内核。
- 2. Cortex-R 系列:
- • 特点:实时性能,高可靠性,适用于需要确定性响应时间和高安全性的实时系统。
- • 使用场景:主要用于汽车电子、网络设备、存储控制器和其他需要实时处理能力的领域。例如,Cortex-R5 常用于汽车引擎控制单元。
- 3. Cortex-M 系列:
- • 特点:低功耗,低成本,易于使用,适用于小型、低功耗的微控制器应用。
- • 使用场景:主要用于各种嵌入式微控制器,如智能家居设备、可穿戴设备、传感器节点、工业自动化设备等。Cortex-M0 和 Cortex-M4 是常见的微控制器内核。
ARM作为低功耗处理器的行业翘楚,在新一轮计算架构的变革中,充当着重要地位,AMBA CHI与UCIe及CXL保持着紧密合作。
Arm的存储解决方案带来价值和性能
- 1. 节能设计
Arm的Cortex处理器和系统IP提供高性能和节能的解决方案,专为存储设备的复杂计算任务而设计。
- 2. 成功的可信合作伙伴
经过验证的Arm技术已集成到数十亿个存储设备中,帮助优化开发并提供成功的基础。
- 3. 更快的上市时间
结合来自Linux的即用型开源代码、云原生软件技术和Arm的工具链,为存储解决方案的快速开发提供基础。
总结
1. 存储控制器发展趋势:
- • 增加容量:TLC和QLC SSD推动存储容量增长,如16TB和64TB。
- • 高效能表现:设计目标为饱和主机接口总线以实现最大带宽,采用PCIe Gen5和Gen6,UFS和eMMC。
- • CXL连接性:CXL提供低延迟和一致的接口,允许主机远程连接到SSD存储、存储级内存和DRAM池。
- • 分散计算:在数据所在的驱动器内部进行处理,不再将所有数据移至主机进行处理。
2. ARM在存储领域的解决方案价值:
- • 低功耗主控芯片:基于低功耗的ARM设计存储设备的控制器,实现更低能耗。
- • 强化系统设备互联通信:加强系统设备间的互联通信,提高整体性能。
---【本文完】---