科技:用于脑部启发计算的新型突触体系结构

导语:大脑及其所有华丽的功能都不到20瓦。停下来思考一下。当我写这篇文章时,我的笔记本电脑使用的功率大约为80瓦,但功率仅为其四分之一,在能源效率和体积方面,我们的大脑在性能上超过了最先进的超级计算机几个数量级。自然是非常了不起的。

因此,世界各地的科学家们正在寻求人类大脑的灵感,作为开发下一代人工智能计算系统的有希望的途径,而IT行业在过去几年中取得了重大进展,尤其令人惊讶。在利用机器学习进行计算机视觉和语音识别时,当涉及到与其生物对应物的功率效率相匹配的深度神经网络时,当前的技术正在成为障碍,但这可能即将改变。

据Nature Communications上周报道,我和IBM研究院的同事以及EPFL和新泽西理工学院的合作者已经开发并试验了使用100万台设备的人工突触结构,这是实现大规模和能源的重要一步有效的神经形态计算技术。

当杰出的科学家约翰·冯·诺伊曼(John von Neumann)建立了今天的计算机体系结构时,他为世界上几乎100%的计算机提供了动力,他将记忆和处理分开。这意味着数据需要不断来回穿梭,产生热量并需要大量能源这是一个效率瓶颈。大脑当然没有不同的隔间,这就是它如此高效的原因。但这并没有阻止团队坚持使用冯·诺依曼的设计来建立一个神经网络,虽然他们取得了一些成功,但这些系统的效率仍然很低,你根本无法击败自然。

最近,包括IBM在内的科学家们采用了一种不同的方法,这种方法基于一种称为忆阻器的新型纳米级器件,这些器件在解决这一瓶颈方面显示出巨大的希望。我们的器件设计基于相变存储器(PCM),可以说是最先进的新兴非易失性存储器技术。对材料施加电脉冲,其通过其物理性质改变器件的电导。

正如我们在论文中所解释的那样:“PCM设备等忆阻设备将信息存储在其电阻/电导状态,并根据编程历史显示电导率调制。基于忆阻设备构建认知硬件的核心思想是将突触权重存储为电导状态和执行相关的计算任务。然而,在维持高网络精度所必需的宽动态范围内精确调制器件电导被证明是具有挑战性的。“

我们的突破在于我们的设计,我们将其称为多忆的突触结构。这种架构使我们能够在不增加功率密度的情况下提高突触精度,即使我们使用几个忆阻设备来代表一个突触。诀窍在于我们有一个很好的选择机制,基于一个全局计数器,告诉设备它需要改变什么时候。唯一的惩罚或成本是额外PCM设备需要更多的空间。

为了测试我们的架构,我们训练了尖峰和非尖峰神经网络。我们选择的数据是一个受欢迎的数据手写数字的MNIST数据集,我们的任务是手写数字识别,基本上我们的网络需要识别手写图像中出现的数字。在这两种情况下,我们都看到多忆阻突触明显优于具有两个设备的传统差分架构,清楚地说明了所提出的架构的有效性。这项工作的一个亮点是使用超过100万个相变存储器设备的尖峰神经网络中的多忆忆突触结构的实验演示。

结语:该架构适用于各种神经网络和忆阻技术,并且与交叉开关兼容。所提出的架构及其实验演示是朝着实现基于具有典型的,实验观察到的非理想特性的忆阻器件的高效,大规模神经网络迈出的重要一步。话虽如此,我们也专注于改善忆阻设备本身,它的准确性和动态范围,然后我们认为我们可以瞄准圣杯浮点性能。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181029A10L0K00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券