前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >基于硅光芯片的深度学习

基于硅光芯片的深度学习

作者头像
光学小豆芽
发布2020-08-13 23:58:55
1.2K0
发布2020-08-13 23:58:55
举报
文章被收录于专栏:硅光技术分享

Nature Photonics在6月份报道了MIT Marin Soljacic教授组的一篇最新进展(https://www.nature.com/nphoton/journal/vaop/ncurrent/full/nphoton.2017.93.html#supplementary-information)。他们在硅光芯片上,利用56个级联的Mach-Zehnder干涉仪,演示了两层结构的深度学习网络,并验证了对4个元音的识别,准确率为76.7%。这篇文章将两个研究热点,硅光(silicon photonics)和深度学习(deep learning)结合在一起,引起了很大的关注。

首先,我们来看一下深度学习是如何与集成光路联系在一起的。深度学习是当前很热门的机器学习算法,是人工神经网络(artificial netural networks, 简称ANN)中的一种,其涉及到大量的矩阵相乘。ANN的示意图如下,

ANN主要由输入层、输出层和若干个隐藏层构成,它主要模仿人脑的神经系统,上图中的每个节点为一个神经元,不同层之间的神经元存在联系,最终的输出依赖于这些节点的连接方式。 这样一种结构,也可以通过光学实现,对应如下图,

特定的光学元件对应于一种映射关系,比如透镜是傅里叶变换,分束器是SU(2)变换等。但是基于体块的传统光路,其相位往往不够稳定,而且体积庞大。这也是人们致力于光学芯片研究的初衷,将体块光学元件等效地在光芯片上实现,一方面体积很小,利于大规模扩展,另一方面由于光学元件已经固化在芯片中,其相位稳定。硅光芯片,因为其较大折射率差,与CMOS工艺兼容,可片上集成Ge探测器、损耗低等优势,成为研究的一个热点(这个在以后的文章会展开讲)。

MIT研究小组正是基于硅光芯片,设计了由很多组MZ干涉器形成的集成光路,实现了光学深度学习。其中每个定向耦合器(directional coupler)的结构示意图如下,

通过热效应可以动态地调节定向耦合器的耦合比例,正是基于此,可以动态调节不同神经元之间的连接关系。MZ干涉器是光学中比较常见的一种结构。一个MZ干涉器由两个定向耦合器、一个相移器构成,如下图所示。

整个深度学习光芯片的示意图如下,由多个MZ干涉器构成。

整体结构还是比较复杂的。在实验中,每次将激光输入进光学干涉单元(optical inteference unit)中,利用片外的PD阵列探测,将探测结果输入进电脑,电脑中对数据做一个非线性变换。根据结果重新设置新的耦合系数,如此反复,直到训练出模型。

实验中,他们测试了对4个元音字母的识别,并和一个64位电脑的结果进行了对比,结果如下

光学神经网络的正确率位138/180=76.7%, 64位电脑的结果是165/180=91.7%。对C和D的识别,误差较大。他们分析了正确率不够高的原因,主要是由于光学相位分辨率不够高和探测器的噪声所导致。

这篇文章首次实现了光学神经网路,其意义十分巨大。传统基于冯诺依曼架构的CPU,执行机器学习算法并不是很高效率。光学神经网络开辟了一个新的实现途径。我觉得,在后续的实验中,可以尝试将PD也集成到光学神经网络芯片上。片上集成Ge PD技术已经较为成熟,这样一块运算处理的光芯片和一块控制的电芯片就可以实现整个神经网络算法。如何提高识别的正确率,也是一个需要解决的问题,这就涉及到如何优化MZ干涉器的相位精度,是否不再采用热效应调节相位的方式?另外还需要验证更为复杂的算法。

以上是对这篇文章的简单介绍,由于文章涉及的信息量很大,还有很多知识点不是很了解,后续再慢慢学习调研。介绍中如果有错误的地方,还请大家指出。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-06-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 光学小豆芽 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档