前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >专访 | 陈云霁:加速芯片是神经网络芯片的最终形态

专访 | 陈云霁:加速芯片是神经网络芯片的最终形态

作者头像
用户1737318
发布2018-06-05 15:03:02
1K0
发布2018-06-05 15:03:02
举报
文章被收录于专栏:人工智能头条人工智能头条

人工智能当前迅速发展的速度,很大程度上得益于深度学习带来的提升。深度神经网络也意味着庞大的计算量,快速迭代需要提速。为了提高算法的性能,产业链的先行者们绞尽脑汁,软硬兼施,如NVIDIA的cuDNN,百度日前正式公布的规模FPGA集群。但最前沿的研究,当属神经网络芯片,如IBM的TrueNorth,我国的DianNao(寒武纪)。

当然,神经网络芯片要走出实验室进入市场应用并不容易。如Yann LeCun就曾对IBM TrueNorth发表消极评论。然则神经网络芯片的何种研发路线更合乎计算机科学和生物学的发展趋势?神经网络芯片产品是否会完全颠覆现有的冯诺依曼架构体系?中国的神经网络芯片研发水平在全球处于什么样的地位?软件、算法从业人员需要为神经网络芯片做哪些准备?日前,CSDN记者采访了DianNao芯片主要研发者、中国科学院计算所计算机体系结构国家重点实验室未来计算组创始人陈云霁研究员,对神经网络芯片的发展进行了探讨。

陈云霁已于上个月入选2015年度的《麻省理工科技评论》35岁以下的全球最佳35名创新人士。他表示,从信息的角度看,神经网络芯片是智能硬件的核心。我们做芯片的最终目标是智能,而不是仿生。所以,最适当的方法应当是以智能算法根本,适当借鉴生物。当然,高级智能需要智能算法和神经科学共同努力。

寒武纪1号结构示意图和硬件版图(图片来自互联网)

从产品层面来说,陈云霁认为,加速芯片是神经网络芯片的最终形态,其任务是把智能把认知做好,而CPU还会是今后计算机的核心,因为加速芯片在数据库传统工作负载上还是比不上现有CPU。他强调,神经网络芯片的优势不在于突破了冯诺依曼架构,关键是智能能力、处理速度和能耗。把输入输出数据结构封装好,CPU和神经网络芯片之间利用一些现有的异构计算技术,很容易各司其职。真正的挑战在工程上:神经网络芯片计算和存储一体化,需要在高速IO技术上不断提升,未来甚至可以考虑光互联。

他还表示,目前神经网络处理器处于“春秋战国”时期,这个新兴领域和通用CPU不一样,不存在太多历史积累上的差距(相反深度神经网络处理器我们做的还是最早的),中国完全有领先的可能性。也就是说,北京市科委对脑认知和类脑计划的研究进行整合,非常有必要,这个时间点选得非常好。

以下为陈云霁采访实录:

CSDN:您如何看待目前人工智能领域所取得的成绩和面临的问题?

陈云霁:智能发展到现在,算法上的进步很多,也确实能解决很多实际应用中的问题(如模式识别)。但是和我们所期望的能“振奋人心”的智能还存在很大的距离。某种意义上说,现在的主流智能研究是在尝试把我们的眼耳鼻舌的能力赋予机器(也就是识别、分类)。但是真正大脑的高级智能能力,如联想、记忆、推理、涌现等,一般是避而不谈的。因为大家觉得太难了。

但是沿着识别、分类这条路一直走下去,高级智能能力是不会自动涌现出来的。和绝大多数智能研究者不同,我个人是从硬件的角度开展智能的研究的。我个人猜测,高级智能能力的探索需要软件,更需要硬件。打一个比方,从猿到人,大脑容量增长仅有3倍,但是高级智能能力一下子就出现了。因此,硬件的研究,尤其是神经网络芯片,对于人工智能进步、尤其是对于高级智能能力的实现,会有关键的作用。

CSDN:您认为神经网络是认知、智能的途径,希望寒武纪芯片成为智能爆炸的转折点,目前业界有模拟大脑和不模拟大脑两种模式,你两类都有研究,也展望了对不模拟大脑的系统,那么您认为哪种模式对认知能力的实现更加有效?另外寒武纪和IBM的TrueNorth主要有哪些区别?

陈云霁:人脑是一个神经网络。从信息的角度看,神经网络芯片是智能硬件的核心,就像是科学计算时代的CPU一样。目前神经网络芯片主要有两种思路,一种是以智能算法根本,适当借鉴生物,我们的寒武纪是这一类。另一类是以仿生为根本,适当借鉴智能算法,IBM的TrueNorth神经网络芯片是这一类。这就好像是爬珠穆朗玛峰,有南坡有北坡。

我们自己对于南坡起爬还是北坡起爬,其实是做了很长时间的功课。从08年到12年,我们一直在研究这个问题。最近我们在计算机硬件领域顶级会议MICRO上有篇论文,就是详细地阐述了哪边更合适。简而言之,我们做芯片,最终目标是智能,而不是仿生。所以,最适当的方法应当是以智能算法根本,适当借鉴生物。这样可以沿途下蛋,不断地形成有意义的中间成果,对于智能产业界产生影响。比如说,寒武纪可以把深度学习的速度和能效提升1个数量级甚至更多,这就有实用价值。而IBM的芯片,按照机器学习权威Lecun的原话“TrueNorth所采用的脉冲神经网络从未在任何有意思的(智能处理)任务上表现出与当前最好算法接近的精度”。如果在智能上体现不出优势,再像生物,在信息产业上用处也有限。

当然,毋庸多言,以智能算法根本,也必须加强对生物的借鉴。我们最近和神经科学家一起工作,就有很多有意思的新成果,可以显著提升神经网络芯片的能力。

由 16 块 TrueNorth 组成的神经元计算机原型(图片来自互联网)

CSDN:目前流行深度学习模型,基于BP算法,实际上可能和神经网络芯片的原理差别甚大,如果采用神经网络芯片,要达到最好效率,是否意味着智能算法模型甚至整个应用还需要一场革命?还是可以通过某种方式把现在的算法嫁接到新的芯片上运行?

陈云霁:首先,BP算法在生物上并非没有证据。蒲慕明先生十几年前在Nature上就有一篇长文,说明在生物神经网络上也有类似BP的现象。当然,生物里面更多更常见的是STDP这样的学习机制。但是很多STDP的机理,生物上不清楚,更不要说神经网络芯片上如何用STDP达到好的学习效果了

面对这个问题,现在大家只能摸着石头过河。这里有个误区,要完全照抄生物的机制。这是不对的。就像我们要造飞机,不可能照抄鸟,只能把空气动力学搞清楚。我个人预测,高级智能的“空气动力学”,需要智能算法和神经科学共同努力。这个“空气动力学”出来的话,肯定会引起神经网络模型、应用和芯片的革命。

CSDN:您谈到了手机端也需要持续学习的能力,需要很小的加速芯片,这应该类似gpgpu或者xeon phi的概念?加速芯片是一种折中和过渡,还是智能计算架构的最终形态?知乎上有一个观点说的是“DianNao是立足当下,TrueNorth是放眼未来”。

陈云霁:我认为加速芯片是神经网络芯片的最终形态。未来新的计算技术,无论是神经网络芯片,还是量子计算机,都不可能在所有的应用上做得比传统CPU好。神经网络芯片就是把智能把认知做好,但运行数据库、科学计算、Office、微信等,它不可能比现有的传统CPU做得更好。因为即便是我们的大脑本身,很多事情也是做不过CPU的。所以CPU还会是今后计算机的核心,但是它只是一个关键,大部分费时费力的任务会交到其它计算器件如GPU、神经网络芯片去做。

CSDN:但是神经网络加速芯片的已经超越了冯诺依曼体系。这样的芯片要和现在冯诺依曼架构下的通用处理器协同,还需要哪些工作?

陈云霁:冯诺依曼有一本至死没写完的书,叫做《计算机与人脑》。这本书我阅读了很多遍,深深地为他的远见卓识而折服。作为冯诺依曼架构的开创者,他比较了计算机与人脑之间的差别,包括语言、精度、记忆等等。在他看来,生物神经网络这样的结构,和他(及同事们)所创造的冯诺依曼架构确实有很大的差别。应该是这是我所知唯一一个冯诺依曼“官方认定”的非冯结构。

但是,神经网络芯片的优势不在于突破了冯诺依曼架构。突破不突破,只是手段问题,关键是效果:具备哪些智能能力,处理速度如何,能耗多少。我一直不认为非冯就比冯要牛一点。作为一个芯片工程师,我更看重的是在实际问题上的指标。

至于非冯芯片和冯芯片二者之间的协同,在理论层面上,其实不存在太大的挑战。把输入输出数据结构封装好,CPU和神经网络芯片之间利用一些现有的异构计算技术,很容易各司其职。真正的挑战在工程上(我们已经遇到了)。神经网络芯片计算和存储一体化,可以规避访存墙。但是这样IO带宽会成为新的瓶颈。和CPU和其它神经网络芯片的吞吐率有可能显著制约性能。这要求我们在高速IO技术上不断提升。未来甚至可以考虑光互联。

CSDN:北京市科委现在已经有一个脑认知与类脑计算的规划,要开展类脑计算的芯片和平台的研究,您认为国内和国外的差距如何?体现在哪些方面?

陈云霁:北京市科委对脑认知和类脑计划的研究进行整合,非常有必要,而且这个时间点选得非常好。原因就在于现在处在一个岔路口。我经常听清华施路平教授说,目前神经网络处理器处于“春秋战国”时期,大家各有各的技术路线。前面说了,我们和IBM分别在两条路上走。但是我们之间不是你追我赶,而是齐头并进。最终检验哪条路更好,需要看哪种芯片最终真正用起来,发挥出智能。所以,这个新兴领域和通用CPU不一样,我们不存在太多历史积累上的差距(相反深度神经网络处理器我们做的还是最早的),因此完全有领先的可能性。所以北京市科委现在做这个事情,如果找好发力点,精准用力,可能会有很好的效果。

CSDN:您曾经主持龙芯3号的设计,并参与多款龙芯的研发,能否介绍这个经历对您研究神经网络芯片的进展有哪些好处?

陈云霁:我的博士导师胡伟武研究员是龙芯的总设计师。要说龙芯的总师、灵魂,那只有胡老师。我只是在他的带领和指导下,曾经在龙芯干了十多年,负责过八核龙芯3号的研制。这段经历是我人生最宝贵的财富。从胡老师身上,我深深感受到了不信邪、敢为天下先的精神,也体会到关键时刻,必须熬夜玩命,否则搞不出真东西。某种意义上说,没有龙芯,就没有寒武纪。寒武纪团队很大层面上是继承了龙芯的精神。

虽然胡老师不做人工智能,但是他非常支持我们的研究。这些年,在龙芯产业化亟需人才的情况下,他依然非常慷慨地把自己的得意弟子们不断输送到我的课题组,以支持寒武纪的研制。师长们的大力支持让我们有勇气继续沿着这条路走下去。

CSDN:入选2015年度的《麻省理工科技评论》35岁以下的去全球最佳35名创新人士,您认为哪些工作习惯或者因素起到比较大的作用?

陈云霁:和真正优秀的科研人员相比,我的差距还很大,实在不敢乱说自己有什么好的习惯,以免产生误导。如果一定要说因素,中科院计算所各位师长的支持和鼓励,肯定是最关键的。他们具有长远眼光,并不计较一时的成败,给了我们宽松的研究环境。李国杰院士自己在攻读博士期间,就在人工智能和体系结构的顶级会议上发表论文,是二者交叉研究的先行者,对我们的工作给予了很多帮助。孙凝晖所长从体系结构的角度对智能计算所做的思考非常深刻,他的很多具体指导帮助我们突破了实验中的一些关键难点。徐志伟老师有非常开阔的研究思路,带领我们走进了异构体系结构和领域加速器的研究。胡伟武老师是我们开展做神经网络硬件研究的第一个支持者。和海外的研究者的交流,对于走到学术前沿,也很关键。Inria的Olivier Temam,普林斯顿的李凯教授,OSU的张晓东教授等,都给我在学术上很多的帮助。

嘉宾简介:陈云霁,男,1983年生,江西南昌人,中国科学院计算技术研究所研究员,博士生导师。同时,他担任了中国科学院脑科学卓越中心特聘研究员,以及中国科学院大学岗位教授。目前他带领计算机体系结构国家重点实验室未来计算组,研制机器学习计算机。陈云霁研究员主页。

本文为CSDN原创文章,未经允许不得转载,如需转载请联系market#csdn.net(#换成@)

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-09-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 人工智能头条 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
GPU 云服务器
GPU 云服务器(Cloud GPU Service,GPU)是提供 GPU 算力的弹性计算服务,具有超强的并行计算能力,作为 IaaS 层的尖兵利器,服务于深度学习训练、科学计算、图形图像处理、视频编解码等场景。腾讯云随时提供触手可得的算力,有效缓解您的计算压力,提升业务效率与竞争力。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档