本文由半导体产业纵横(ID:ICVIEWS)综合
SRAM广泛用于高性能处理器芯片的缓存。如果芯片无需访问外部存储器,其速度甚至可以更快。
SRAM 已经非常成熟,现在被认为是一种商业“管道”类型的内存,但 Marvell Technology 的最新定制 SRAM 正在展示这种现有内存如何在 AI 数据中心发挥作用。
显著降低功耗和芯片面积
Marvell 声称其定制 SRAM 是业界首款 2nm 定制 SRAM。它旨在提升加速基础设施中内存层的性能,提供高达 6Gbit 的高速内存,从而提升定制 XPU(处理器、加速器、GPU)和设备的性能。此外,在相同密度下,它还能显著降低内存功耗和芯片面积。
该公司的 SRAM 比类似密度的标准片上 SRAM 功耗低 66%,运行频率高达 3.75GHz,这是 AI 集群和数据中心管理其能源足迹和有效冷却组件的关键指标。
Marvell 首席内存架构师 Darren Anand表示:“Marvell 一直专注于优化 SRAM,以适应 AI/机器学习应用。这与我们目前的封装和定制高带宽内存 (HBM) 工作具有显著的协同效应,从而为 XPU 上的计算释放了更多的芯片面积。”
“SRAM 有创新的机会”
Anand 表示:“Marvell 的 SRAM 不是不断访问 HBM,而是将部分工作负载保留在芯片上,并支持 AI 工作负载所需的高带宽和宽 IO,从而有可能提高整体设备性能。”
在最先进的节点上,SRAM 可以与逻辑芯片集成在同一块芯片上。来源:Marvell Technology
他表示:“SRAM 是唯一在个位数工艺节点上可用的存储器,因此也是唯一能够支持近内存计算架构的高性能存储器。在这些前沿节点上,DRAM 无法在同一块硅片上使用。同样,NAND 闪存、磁阻 RAM (MRAM)、电阻式 RAM (ReRAM) 和相变 RAM (PCM) 等新兴存储器也无法在这些前沿节点上使用。”
Anand 解释说:“在尖端节点上,SRAM 可以与逻辑芯片集成在同一芯片上,从而支持可立即供 XPU 上的处理器和逻辑引擎使用的内存层次结构。” 在这方面,它不同于连接内存和逻辑芯片的典型冯·诺依曼架构。近内存计算架构将数据放置在更靠近需要的位置,从而降低了移动数据所需的功耗并增加了带宽。
他补充道:“典型的 XPU 至少有 30% 的硅片面积专用于 SRAM,有些设计甚至超过芯片面积的 50% 到 60%。我们正在尝试优化这一点,因为这会对芯片的芯片尺寸和成本产生重大影响。”
“在业界,SRAM 正变得像一个基本的 IP‘管道’,这意味着很多地方都需要它,但却缺乏技术创新。实际上,在 SRAM 架构中可以实现许多新技术,以优化功耗、带宽和许多其他指标。我们并不认为 SRAM 仅仅是一个管道,而是一个创新的机会,”Anand 说道。
Anand 认为,SRAM 面临的最大挑战是面积微缩。虽然逻辑单元和存储器都经历了多代的微缩,但 SRAM 单元似乎开始遇到瓶颈,导致过去几代先进节点的微缩停滞不前。“逻辑单元继续微缩,但存储器位单元却没有,”Anand 指出。
Objective Analysis 首席分析师 Jim Handy 表示:“Marvell 的方法实现了节能降耗和速度提升,同时也承认了 SRAM 芯片并非随着工艺制程线性扩展的事实。他们只是根据这些工艺制程尺寸对 SRAM 进行了轻微的调整。”
Handy 表示:“SRAM 广泛用于高性能处理器芯片的缓存。如果芯片无需访问外部存储器,其速度甚至可以更快。事实上,芯片上的所有核心每个周期都能执行一条指令,速度非常快。”
虽然SRAM和DRAM都是随机存取存储器的形式,但是它们的结构上有所不同。DRAM代表动态随机存取存储器。这种存储器在结构上与SRAM有所不同,因为它使用电容器而不是反相器和晶体管进行存储。因此,这种存储器需要刷新并因此发生变化,因此被定义为“动态”的。不像SRAM,其存储器存储在芯片上,DRAM存储在与芯片外部的主板上,因此访问时间更长。这导致SRAM是一种比DRAM更快的存储器。
每种内存在设备中存储的位置也不同。DRAM通常用作主要的存储器,因此通常存储在主板上,但是由于SRAM是CPU中常用的存储器,因此最可能在处理器上找到。
最后,这两种内存在成本方面也有所不同。由于SRAM需要更多的功率来运行,因此与DRAM相比,它也是一种更昂贵的内存选择。这是SRAM不总是主存储系统的理想选择的另一个原因。