机器学习有望更深入、更便宜

2016年3月,谷歌的计算机彻底打败了世界围棋冠军李世石(Lee Sedol),这是人工智能领域的里程碑事件。获胜的计算机程序由英国伦敦谷歌DeepMind实验室的研究人员创建,利用了深度学习人工神经网络。深度学习是一种策略,多层处理的神经网络以自动化方式配置,解决手边的问题。

那时公众还不知道谷歌有这个秘密武器。谷歌用来打败李世石的计算机有专用硬件——谷歌称之为“张量处理单元”(Tensor Processing Unit)的计算机芯片。围棋比赛两个月后,谷歌硬件工程师宣布了张量处理单元的存在,并在博文中解释说,早在一年多之前谷歌就用这些加速芯片装备自己的数据中心了。谷歌并没有直接分享这些芯片上有什么,但是很显然它代表了加速深度学习计算的越来越普遍的策略:应用型专用集成电路(application-specific integrated circuit, ASIC)。

另一个(主要被微软)追求的策略是利用现场可编辑门阵列(field-programmable gate array, FPGA),其优势在于可根据计算要求改变而再配置。但是更常用的方法是使用图形处理器(graphics processing unit, GPU),可同时进行多个数学运算,这种方法最重要的支持者就是图形处理器制造商英伟达(Nvidia)。2009年,图形处理器的发展启动了人工神经网络,当时,美国斯坦福(Stanford)的研究人员展示了这种硬件可在合理时间内训练深度神经网络。英伟达首席科学家指出,“现在每个人都在做深度学习。”对此,他表示,“图形处理器几乎与你能实现的一样好。”鉴于他的工作,他的这一说法可能在情理之中。他解释说要考虑三个方面。第一方面他称之为“数据中心的训练”,并提到了任何深度学习系统的第一步:调整神经元之间可能数百万个的连接,以便网络能进行指定的任务。

要构建作用于此的硬件,Nervana系统公司在这方面处于领先地位,该公司刚被美国英特尔(Intel)收购。据该公司计算机科学家表示,应用型专用集成电路深度学习加速器Nervana Engine将在2017年初到年中投入生产。一项计算密集型任务——比特币挖矿——从在中央处理器(CPU)上运行,到图形处理器、现场可编辑门阵列,最后到应用型专用集成电路,因为这种定制化提高了能效。

深度学习硬件另一个独特的作用是“在数据中心进行推断”。这里的推断是指已经过训练可进行某些任务的基于云端的人工神经网络正在进行的操作。每一天,谷歌的神经网络都要进行无数次这种推断运算,用于分类图片、翻译、识别语音等。虽然很难肯定,但谷歌的张量处理单元可能是专为执行这样的计算而打造的。

训练和推断通常所需的技能集很不一样。对于训练,计算机必须能以较高精度运算,通常是32位浮点运算。对于推断,可以牺牲精度,换取更高的速度或更小的功率效率。“这是活跃的研究领域。”Nervana系统公司计算机科学家指出,“你能实现多低呢?”

虽然英伟达首席科学家拒绝透露该公司的具体计划,但他指出英伟达的图形处理器一直在进步。英伟达早期的Maxwell架构可进行双精度(64位)和单精度(32位)的运算,而其现有的Pascal架构增加了16位运算的能力,与单精度运算相比,其通量和效率都翻倍了。所以,很容易想到英伟达最终会发布能进行8位运算的图形处理器,这将是云端进行推断运算的最佳工具,因为功率效率是降低成本的关键。他补充说:“深度学习三大支持的最后一点是在嵌入式设备中进行推断”,如智能手机、相机、平板灯。对于这些应用,关键是低功耗的应用型专用集成电路。在未来一年,深度学习软件会不断进入智能手机的应用,例如,目前已经用于检测恶意软件或翻译图片中的文字。

中国无人机制造商大疆创新公司(DJI)已在其精灵4(Phantom 4)无人机上采用了类似于深度学习应用型专用集成电路的应用,通过美国加州视觉处理器生产商Movidius生产的专门视觉处理芯片来识别障碍物(Movidius是最近英特尔收购的又一家神经网络公司)。此外,高通(Qualcomm)在其骁龙820处理器中植入了专门的电路,帮助执行深度学习计算。

虽然目前有很多利好刺激硬件设计,加速深度神经网络的运算,但也存在巨大风险:如果最先进技术发展得够远,专为运行过去的神经网络而设计的芯片在制造的时候就将过时了。“算法改变的速度很快”英伟达首席科学家指出,“这个领域的每个人都在努力地兼顾,力争万无一失。”

原文发布于微信公众号 - 人工智能快报(AI_News)

原文发表时间:2017-03-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能头条

知人知面需知心——论人工智能技术在推荐系统中的应用

2085
来自专栏大数据文摘

重磅清单 | 当前AI领域尚未攻克的29个难题及进展评估(附百篇文献)

1973
来自专栏新智元

2016 机器学习之路:一年从无到有掌握机器学习

【新智元导读】程序员 Per Harald Borgen 在 Medium 刊文,介绍了他在一年的时间里,从入门到掌握机器学习的历程。Borgen 表示,即使没...

3539
来自专栏人工智能

关于“机器学习”,医生们需要知道的5件事

作者:麦子 转载请注明:解螺旋·临床医生科研成长平台 机器学习,简单可以理解为一种数据分析的方法。医生们对数据驱动型预测研究应该不陌生,比如利用风险评分来指导抗...

1725
来自专栏AI科技大本营的专栏

你走过最长的路,就是机器学习过程中的弯路

营长的一位转型AI的朋友,最近对营长抱怨,“走过的最远的路,就是机器学习过程中的弯路”,然后开始各种blablabla,从论文的坑,到模型的坑,再到培训的坑.....

36010
来自专栏PPV课数据科学社区

【学习】写给新人数据挖掘基础知识介绍

一、数据挖掘技术的基本概念 随着计算机技术的发展,各行各业都开始采用计算机及相应的信息技术进行管理和运营,这使得企业生成、收集、存贮和处理数据的能力大大提高,数...

3036
来自专栏专知

剑桥大学计算机系博士孙琳:自然语言处理(NLP)的发展以及在教育领域的应用情况(附报告pdf下载)

? ? 大家好!我是孙琳,很高兴参加TAB教育科技论坛,今天分享的题目是“教育应用中的自然语言处理”。首先我先做一下自我介绍,我是剑桥大学计算机系的博士,博士...

5235
来自专栏算法channel

机器学习是万能的吗?AI落地有哪些先决条件?

这段时间,有幸聆听了几场大牛报告,一位是第四范式,目前工业界应用AI经验最丰富的之一,曾经在百度与吴恩达共同推进AI在工业界的落地;另一位来自学术界,新加坡国立...

1214
来自专栏CDA数据分析师

数据分析从哪里开始入门学习,可以推荐的书有哪些?

数据行业在迅速的发展,几乎每天都会出现新的技术和方法。因此,想要跟上这个行业的步伐是有挑战性的。之前CDA数据分析师曾列出了15位在科技和数据科学领域最具影响力...

4265
来自专栏机器之心

观点 | 人工智能的三个阶段:我们正从统计学习走向语境顺应

选自DataScienceCentral 作者:William Vorhies 机器之心编译 参与:黄小天、微胖、李泽南 我们处在人工智能的哪个阶段?我们将要去...

3479

扫码关注云+社区