首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

中国芯又迎来历史性进步,中国科学院的新突破

在人工智能领域,卷积神经网络是一种重要的技术,可以用于图像识别、自然语言处理、计算机视觉等任务。然而,卷积神经网络的运算量非常大,需要高性能的计算硬件来支持。目前,市场上主要的计算硬件是基于电子的冯·诺依曼架构,如英伟达的A100 GPU。这种架构存在数据传输速度和能耗之间的矛盾,难以满足海量数据实时处理的需求。

为了解决这一问题,中国科学院半导体研究所集成光电子学国家重点实验室微波光电子课题组李明研究员-祝宁华院士团队,研制出一款超高集成度光学卷积处理器。该芯片利用光波作为信息处理载体,提供了一种“传输即计算,结构即功能”的计算架构,有望避免冯·诺依曼计算范式中存在的数据潮汐传输问题。

该团队创新性地将波分复用技术结合光的多模干涉,以波长表征Kernel元素,输入到输出的映射实现了卷积中的乘法运算过程,波分复用和光电转换实现了卷积中的加法运算,通过调节四个热调移相器实现了相关卷积核重构。该芯片通过两个4×4多模干涉耦合器和四个移相器构造了三个2×2相关的实值卷积核。

该团队提出的光学卷积处理单元实验验证了手写数字图像特征提取和分类能力。结果表明,图像特征提取精度达到5 bit;对来自MNIST手写数字数据库的手写数字进行十分类,准确率达92.17%。

与其他光计算方案相比,该方案具有如下优点:(1)高算力密度:将光波分复用技术与光多模干涉技术相结合,采用4个调控单元实现3个2×2实值Kernel并行运算,算力密度达到12.74-T MACs/s/mm2。(2)线性扩展性:调控单元数量随着矩阵规模线性增长,具有很强的大规模集成的潜力。

据悉,该芯片不仅无需光刻机等昂贵设备制造,还具备超强算力,将英伟达A100 GPU甩在了身后。英伟达A100 GPU是目前市场上最先进的电子计算硬件之一,其峰值算力为312-T MACs/s,而该光学卷积处理器的峰值算力为1.02-P MACs/s,相当于3.27倍的A100。这意味着,该芯片可以在更短的时间内完成更多的卷积运算,从而提高人工智能的性能和效率。

该研究工作得到国家自然科学基金和中国科学院青年创新促进会的支持。该团队表示,他们将继续优化光学卷积处理器的设计和性能,探索其在更多人工智能应用场景中的潜力和价值。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OgyFz8-Hv_OEMyoNvkkyNf_A0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券