首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Solidigm:SSD与数据中心可持续性

Solidigm:SSD与数据中心可持续性

作者头像
数据存储前沿技术
发布2025-02-11 19:49:53
发布2025-02-11 19:49:53
3330
举报

全文概览

随着人工智能(AI)的发展和应用日益广泛,预计到2030年将导致数据中心电力需求增加160%,其中在美国,AI预计将占据约19%的数据中心电力需求。

与此同时,人工智能处理一次查询所需的电力几乎是Google搜索的十倍,表明提高电力效率的进展正在放缓。全球数据中心的电力消耗中,仅美国因AI驱动的需求就增加了额外的100太瓦时电量。存储行业,尤其是固态硬盘(SSD),面临着提升能效以支持AI时代增长的挑战。

通过分析不同代际PCIe标准下(包括PCIe Gen4和Gen5)的六种不同供应商提供的七种SSD控制器,发现NAND占据了总功率的约50%,而" Rest " 包括了未被计数的所有其他电源消耗,如PMICs、电容器、电感器、ROM、时钟发生器等。ASIC(核心+PHY)占大约20%以上的份额,是第二大功率消耗部分。随着技术进步,即便是工艺节点不断优化,每一代PCIe标准仍会带来约500毫瓦的额外功耗。针对ASIC核心功率的研究显示,在不同架构选择之间存在明显差异,尤其是在采用硬件加速器的方案中。

为了维持性能扩展的步伐并应对未来PCIe Gen6及更高级别的需求,SSD控制器的架构必须优化以提高能源效率。

AI 的能耗常识

  • 根据高盛的报告,预计到2030年,人工智能将推动数据中心电力需求增长160%。
  • 在美国,人工智能将占据数据中心电力需求的约19%。
  • 一次ChatGPT查询所需的电力几乎是谷歌搜索的10倍。
  • 电力使用效率的提升速度减缓,而AI革命正加速发展。

全球数据中心电力消耗

  • 仅美国,人工智能将推动额外的100TWh电力需求。
  • 人工智能将占据数据中心电力需求的约19%。
  • 图表展示了全球及美国的人工智能电力需求与非人工智能电力需求的预估趋势。

图展示不同搜索方式的电力消耗。

Google原生搜索的电力消耗最少。而与之相比,ChatGPT、BLOOM以及AI增强的Google搜索(由不同公司研究提供)消耗的电力逐渐增多,其中AI增强的Google搜索(SemiAnalysis)的电力消耗最高。图表突出了人工智能模型和增强搜索在电力消耗上的差异,表明AI相关服务比传统的搜索引擎消耗更多的电力。

关于 BLOOM 大模型

BLOOM(BigScience Large Open-science Open-access Multilingual Language Model)是一个由国际合作团队开发的大型多语言预训练语言模型。该模型的目标是推动自然语言处理领域的开源研究,尤其是在多语言环境下的应用。BLOOM的开发采用了“开放科学”的原则,意味着研究团队公开了模型的训练数据和代码,以便其他研究者和开发者可以复制、评估和改进该模型。

一些BLOOM的特点包括:

  1. 多语言能力BLOOM是为支持多种语言而设计的,涵盖了大约46种语言,包括英语、法语、西班牙语、阿拉伯语、中文等。
  2. 大规模训练BLOOM是一个庞大的模型,包含了1760亿个参数,进行大规模的数据集训练,以提高它在理解和生成语言方面的能力。
  3. 开源与许多商业化的语言模型不同,BLOOM是完全开源的,任何人都可以自由使用和修改。这为学术界和开发者提供了一个强大的工具来进行研究和创新。
  4. 任务多样性BLOOM能够执行多种自然语言处理任务,包括文本生成、翻译、文本分类、问答系统等。

US 数据中心能耗

图展示了不同增长情景下,美国数据中心电力消耗的预测,特别是随着人工智能的快速发展以及能效提升的可能限制。图中的四种增长情景显示了从低增长(年增长率3.7%)到更高增长(年增长率15%)的电力消耗预测。在2030年,若采用更高增长情景,电力消耗将占美国数据中心总需求的9.1%。


存储行业的能耗意识

SSD 能耗分配

  • 基于PCIe Gen5
  • NAND占SSD总电力的约50%
  • "其他"包括所有未计算的电力消耗:PMICs、Capacitors、Inductors、ROM、时钟生成器等
  • ASIC(Core+PHY)占约20%,是第二大电力消耗部分

PCIe 物理层能耗

表格展示了不同版本的PCIe PHY接口电力消耗。PCIe Gen4x4的典型功率约为500mW,而PCIe Gen5x4和PCIe Gen6的功率分别为约1W和1.5W。尽管工艺节点不断优化,但每一代的电力消耗大约增加500mW。随着PCIe版本的提升,电力消耗会持续增加。

考虑到 ASIC Core 计算模块能耗较高,后文聚焦其优化空间。


图示不同 ARM 架构 IP的能耗差异:

  • ARM A-core 作为高性能核心,其应用能耗较高;
  • ARM R/M 系列次之;
  • 硬件加速方案的能耗相对来说是比较低的。

备注:图中共7条虚实线,代表不同SSD 主控方案的能耗情况。

ARM 不同架构 IP 介绍

ARM架构分为A、R、M三个系列,每个系列针对不同的应用场景。A系列主要用于高性能计算,如智能手机和平板电脑;R系列专注于实时操作系统,适用于工业控制和汽车电子;M系列则是为微控制器设计,强调低功耗和高性能。 更多关于主控IP架构能耗选择,可参考阅读:ARM:Cortex-R82 低功耗存储主控设计


小结

  • 研究了不同供应商的PCIe Gen4和Gen5 SSD控制器,重点在于功率效率和可扩展性。
  • SSD控制器架构必须优化能效,以保持性能的扩展步伐。
  • 采用硬件加速的架构在PCIe Gen6及以后的SSD中处于更有利的位置。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-01-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 王知鱼 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 全文概览
    • AI 的能耗常识
    • 全球数据中心电力消耗
    • US 数据中心能耗
  • 存储行业的能耗意识
    • SSD 能耗分配
    • PCIe 物理层能耗
    • 小结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档