专注于纳米电子和数字技术的比利时微电子研究中心(Imec)联合全球领先的特种晶圆代工企业格芯(Global Foundries),今天对一款新型人工智能芯片进行了硬件展示。 这款人工智能芯片基于 Imec 的 Analog in Memory Computing (AiMC)架构,利用了格芯的 22FDX 解决方案,通过层层优化能在模拟领域的内存计算硬件上执行深度神经网络计算。
这款芯片的能效达到了创纪录的 2900 TOPS/W,是低功耗设备边缘推理的重要推动者。这项新技术在隐私、安全和延迟方面的优势,将对从智能音箱到自动驾驶汽车等多种边缘设备的人工智能应用产生影响。
从数字计算机时代初期开始,处理器和内存是分开的,因此使用大量数据进行的操作需要从内存存储中检索出同样多的数据元素。而这就是冯·诺伊曼瓶颈(von Neumann bottleneck)。
它是指在 CPU 与内存之间的流量(资料传输率)与内存的容量相比起来相当小,在现代电脑中,流量与CPU的工作效率相比之下非常小,在某些情况下(当CPU需要在巨大的资料上执行一些简单指令时),资料流量就成了整体效率非常严重的限制。CPU将会在资料输入或输出内存时闲置。由于CPU速度远大于内存读写速率,因此瓶颈问题越来越严重。
为了解决这一挑战,Imec 和包括格芯在内的合作伙伴启动了工业附属机器学习计划, 致力于开发新的架构,在 SRAM 单元中执行模拟计算来消除冯·诺伊曼瓶颈。
由此产生的模拟推理加速器(AnIA),建立在GF的22FDX半导体平台上,能效显著。特性测试表明,功耗效率达到峰值,即每瓦特每秒2900兆次运算(TOPS/W)。在微型传感器和低功耗边缘设备中的模式识别,通常由数据中心的机器学习来驱动,现在可以在这个高能效加速器上本地执行。
领取专属 10元无门槛券
私享最新 技术干货