
随着人工智能(AI)的发展和应用日益广泛,预计到2030年将导致数据中心电力需求增加160%,其中在美国,AI预计将占据约19%的数据中心电力需求。
与此同时,人工智能处理一次查询所需的电力几乎是Google搜索的十倍,表明提高电力效率的进展正在放缓。全球数据中心的电力消耗中,仅美国因AI驱动的需求就增加了额外的100太瓦时电量。存储行业,尤其是固态硬盘(SSD),面临着提升能效以支持AI时代增长的挑战。
通过分析不同代际PCIe标准下(包括PCIe Gen4和Gen5)的六种不同供应商提供的七种SSD控制器,发现NAND占据了总功率的约50%,而" Rest " 包括了未被计数的所有其他电源消耗,如PMICs、电容器、电感器、ROM、时钟发生器等。ASIC(核心+PHY)占大约20%以上的份额,是第二大功率消耗部分。随着技术进步,即便是工艺节点不断优化,每一代PCIe标准仍会带来约500毫瓦的额外功耗。针对ASIC核心功率的研究显示,在不同架构选择之间存在明显差异,尤其是在采用硬件加速器的方案中。
为了维持性能扩展的步伐并应对未来PCIe Gen6及更高级别的需求,SSD控制器的架构必须优化以提高能源效率。




图展示不同搜索方式的电力消耗。
Google原生搜索的电力消耗最少。而与之相比,ChatGPT、BLOOM以及AI增强的Google搜索(由不同公司研究提供)消耗的电力逐渐增多,其中AI增强的Google搜索(SemiAnalysis)的电力消耗最高。图表突出了人工智能模型和增强搜索在电力消耗上的差异,表明AI相关服务比传统的搜索引擎消耗更多的电力。
关于 BLOOM 大模型
BLOOM(BigScience Large Open-science Open-access Multilingual Language Model)是一个由国际合作团队开发的大型多语言预训练语言模型。该模型的目标是推动自然语言处理领域的开源研究,尤其是在多语言环境下的应用。BLOOM的开发采用了“开放科学”的原则,意味着研究团队公开了模型的训练数据和代码,以便其他研究者和开发者可以复制、评估和改进该模型。
一些BLOOM的特点包括:

图展示了不同增长情景下,美国数据中心电力消耗的预测,特别是随着人工智能的快速发展以及能效提升的可能限制。图中的四种增长情景显示了从低增长(年增长率3.7%)到更高增长(年增长率15%)的电力消耗预测。在2030年,若采用更高增长情景,电力消耗将占美国数据中心总需求的9.1%。



表格展示了不同版本的PCIe PHY接口电力消耗。PCIe Gen4x4的典型功率约为500mW,而PCIe Gen5x4和PCIe Gen6的功率分别为约1W和1.5W。尽管工艺节点不断优化,但每一代的电力消耗大约增加500mW。随着PCIe版本的提升,电力消耗会持续增加。
考虑到 ASIC Core 计算模块能耗较高,后文聚焦其优化空间。

图示不同 ARM 架构 IP的能耗差异:
备注:图中共7条虚实线,代表不同SSD 主控方案的能耗情况。
ARM 不同架构 IP 介绍
ARM架构分为A、R、M三个系列,每个系列针对不同的应用场景。A系列主要用于高性能计算,如智能手机和平板电脑;R系列专注于实时操作系统,适用于工业控制和汽车电子;M系列则是为微控制器设计,强调低功耗和高性能。 更多关于主控IP架构能耗选择,可参考阅读:ARM:Cortex-R82 低功耗存储主控设计
