第一时间掌握
新鲜的 AI for Science 资讯
编辑丨&
计算硬件的不断升级顺应着 AI 算法的突破,但为了真正释放 AI 的全部潜力,可能需要寻找一种新方法来替代现有计算硬件。
在热力学计算中,是否存在一种快速而低功耗的方法来加速 AI 的基本操作,尤其是针对生成式 AI 与概率性 AI?美国纽约的 Normal Computing Corporation 公司用他们研发的一台小型热力学计算机给出了答案。
他们称呼这项成果为随机处理单元,由印刷电路板上的 RLC 电路组成,具有 8 个单位单元,通过开关电容实现多对全耦合。
该研究以「Thermodynamic computing system for AI applications」为题,于 2025 年 4 月 22 日刊登于《Nature Communications》。
论文链接:https://www.nature.com/articles/s41467-025-59011-x
随机处理单元
AI 革命凸显了当今计算硬件的缺点,部分引领者认为机器学习目前卡在局部最优状态,如果该领域能够摆脱当前的数字硬件,那么就可以达到全局最佳状态。
概率 AI 是模拟硬件的一个特别引人注目的用例。这一分支处理贝叶斯推理、不确定性量化和采样任务,并导致生成式 AI(如扩散模型)的最新突破。
虽然它在当前的数字硬件上难以计算,但概率 AI 的数学恰好与热力学相符,而热力学是经典物理学中涉及随机动力学的分支。
所以在这项工作中,该团队提出了热力学计算的实验演示,并介绍了他们的随机处理单元(SPU)。
图 1:随机处理单元(SPU)。
SPU 可以在数学上建模为一组具有噪声电流驱动的电容耦合理想 RLC 电路,其排列在左上角三角形中的元件对应于耦合晶胞的可控耦合。
高斯采样和矩阵求逆
在硬件上,团队演示了高斯采样和矩阵求逆。
如论文内公式所述,SPU 中电压和电流的稳态分布取决于电路的无噪声和无耗散哈密顿量。随着收集到更多的样本,与分布矩相关的误差会随着时间的推移而下降。
图 2:在 SPU 上对二维高斯分布进行采样。
接下来考虑的是矩阵求逆。他们对 SPU 的三个不同副本执行算法,并获得了相似的结果,可用于证明可重复性。结果误差(即 SPU 逆矩阵和目标逆逆矩阵之间的相对 Frobenius 误差)随着样本数量的增加而下降。在收集了数千个样本后,SPU 逆函数在视觉上看起来与目标逆函数相似。
图 3:8 × 8 矩阵的热力学反转。
热力学的性能优势
团队将 SPU 的预期运行时间和能耗与最先进的 GPU 进行了比较,模型的运行时间和能耗数学模型涉及考虑三个关键阶段的影响:
从输入协方差矩阵计算电容器阵列的元件值(数字计算,在 GPU 上)
将元件值加载到设备(数字传输)
等待生成样本所需的物理动力学的积分时间(模拟运行时)。
最后将样本发送回数字设备。
他们假设 SPU 由在室温下运行的标准电气元件构成,理想的情况是具有 16 位精度的电气元件,并且 SPU 单元完全连接。
图 4:GPU 和估计的 SPU 性能的比较。
对于 10,000 个样本,GPU 在低维度下速度更快,但在高维度下,SPU 性能预计会优于 GPU。
SPU 的简单模型、其端到端运行所涉及的时间以及这些过程中的能源成本,相对于相对保守的假设里最先进的 GPU,SPU 潜在的加速和节能潜力提高了一个数量级。
一项有效的实验
这台热力学计算的原型机成功演示了热力学线性代数实验。它所使用的架构不包含电感器,而是使用了电阻(不是电容)耦合。
热力学计算的精度受到指定物理参数的精度的限制,并且不可避免地需要在精度和可扩展性之间进行权衡,这是扩展硬件时会遇到的问题。
这项工作还带来了更多发展空间,类似于此处介绍的设备的硬件可用于加速其他任务,例如求解线性系统等。团队为未来在非高斯情况下的实验工作提供了指导,这也许会解锁扩散模型等生成式 AI 的应用。
人工智能×[ 生物 神经科学 数学 物理 化学 材料 ]
「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。
领取专属 10元无门槛券
私享最新 技术干货