斯坦福大学重大突破:直接在光学芯片上训练人工神经网络

编译:chux

出品:ATYUN订阅号

斯坦福大学研究人员已经证明,可以直接在光学芯片上训练人工神经网络。这一重大突破表明光学电路可以执行基于电子的人工神经网络的关键功能,并且可以更便宜,更快速和更节能地执行诸如语音或图像识别之类的复杂任务。

大学的研究小组负责人Shanhui Fan表示,“使用光学芯片比数字计算机更有效地执行神经网络计算可以解决更复杂的问题,例如,这将增强人工神经网络执行自动驾驶汽车所需任务的能力,或者对口头问题做出适当的反应。它还可以用我们现在无法想象的方式改善我们的生活。”

人工神经网络是人工智能的一种,它使用连接单元以类似于大脑处理信息的方式处理信息。使用这些网络执行复杂的任务,例如语音识别,需要训练算法的关键步骤来对输入进行分类,例如不同的单词。

尽管最近光学人工神经网络已经通过了实验证明,但是传统研究是在数字计算机上使用模型进行训练,然后最终设置导入光学电路。在光学学会的高影响力研究期刊Optica中,斯坦福大学的研究人员报告了一种新方法,通过实现“反向传播”算法(这是训练传统神经网络的标准方法)的光学模拟直接在设备中训练这些网络。

“使用物理设备而不是计算机模型进行训练可以使过程更加准确,”该论文的第一作者Tyler W. Hughes表示,“另外,由于训练步骤是神经网络实现中非常耗费计算的一部分,因此光学执行此步骤对于提高人工网络的计算效率,速度和功耗至关重要。”

基于光的网络

尽管通常使用传统计算机执行神经网络处理,但是设计专门针对神经网络计算优化的硬件仍有很大的努力。基于光学的设备非常令人感兴趣,因为它们可以并行执行计算,同时使用比电子设备更少的能量。

在这项新工作中,研究人员通过设计一种复制传统计算机训练神经网络方式的光学芯片,克服了实施全光学神经网络的重大挑战。

一个人工神经网络可以被视作带一些旋钮的黑盒子。在训练步骤期间,这些旋钮各自转动一点,然后测试系统以查看算法的性能是否得到改善。

Hughes表示,“我们的方法不仅可以帮助预测转动方向的方向,还可以预测每个旋钮的旋转程度,从而更接近所需的性能。我们的方法显着加快了训练速度,特别是对于大型网络,因为我们可以并行获取有关每个旋钮的信息。”

片上训练

新的训练协议在具有可调谐分束器的光学电路上运行,可通过改变光学移相器的设置来调整。编码待处理信息的激光束被发射到光学电路中并由光波导通过分束器携带,分束器被调节为类似旋钮以训练神经网络算法。

在新的训练协议中,首先通过光学电路馈送激光。退出设备后,计算与预期结果的差异。然后该信息用于产生新的光信号,该信号通过光网络以相反的方向发回。通过在此过程中测量每个分束器周围的光强度,研究人员展示了如何并行检测神经网络性能相对于每个分束器设置的变化。可以基于该信息改变移相器设置,并且可以重复该过程直到神经网络产生期望的结果。

研究人员通过教授算法执行复杂任务,来测试训练技术和光学模拟,他们发现光学实现与传统计算机类似地执行。

Fan指出,“我们的工作表明你可以使用物理定律来实现计算机科学算法,通过在光学领域训练这些网络,它表明光学神经网络系统可以构建为仅使用光学器件来执行某些功能。”

研究人员计划进一步优化系统,并希望用它来实现神经网络任务的实际应用。他们设计的一般方法可以与各种神经网络架构一起使用,也可以用于其他应用,例如可重构光学器件。

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2018-07-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技大本营的专栏

移动应用AI化成新战场?详解苹果最新Core ML模型构建基于机器学习的智能应用

Google刚刚息鼓,苹果又燃战火!这一战,来自移动应用的AI化之争。 近日,苹果发布专为移动端优化的Core ML后,移动开发者对此的需求到底有多强烈?去年大...

37270
来自专栏AI研习社

用验证机制加强神经网络的能力:研究者提出机器学习防御措施 | 2分钟读论文

来源 / Two Minute Papers 翻译 / 洪振亚 校对 / 囧囧 整理 / 雷锋字幕组 本期论文 Reluplex: An Efficient S...

38150
来自专栏智能计算时代

机器学习与文本分析

image.png 原文作者:微软研究院杰出科学家Ashok Chandra博士,项目经理Dhyanesh Narayanan 译者:张鑫 ? 上个世纪七十年代...

41860
来自专栏人工智能快报

英特尔研究员展望人工智能与高性能计算的融合

高性能计算领域专业媒体HPCwire发表文章,介绍了英特尔研究人员对人工智能与高性能计算结合的技术展望。 将针对特定问题的深度神经网络扩展到具有数千个节点的大型...

30090
来自专栏PPV课数据科学社区

不可不知 | 有关文本挖掘的14个概念

版权声明 作者:杜尔森·德伦(Dursun Delen) 来源:《大数据掘金 挖掘商业世界中的数据价值》,中国人民大学出版社出版 本文由数据之王(ID:shuj...

36780
来自专栏机器之心

资源 | Style2paints:专业的AI漫画线稿自动上色工具

53440
来自专栏深度学习自然语言处理

谈谈我在自然语言处理进阶上的一些个人拙见

自然语言处理这个方向我感觉已经泛滥了,很多方向的人都开始转向该专业,当然也包括转向计算机视觉的。之前我写过一篇文章

13430
来自专栏数据科学与人工智能

【陆勤践行】机器学习与文本分析

原文作者:微软研究院杰出科学家Ashok Chandra博士,项目经理Dhyanesh Narayanan 译者:张鑫 ? 上个世纪七十年代,当我(Ashok)...

24990
来自专栏IT派

资源 | Style2paints:专业的AI漫画线稿自动上色工具

IT派 - {技术青年圈} 持续关注互联网、大数据、人工智能领域 由于档期限制,我们经常会看到动画由于制作时间紧张而出现作画崩坏的情况。来自苏州大学的研究者...

1K60
来自专栏大数据和云计算技术

似懂非懂Google TPU

谷歌的这款芯片被称作 Tensor Processing Unit,简称 TPU,是Google专门为深度学习定制的芯片。 第一次出现是在2016年的Googl...

33560

扫码关注云+社区

领取腾讯云代金券