机器学习有望更深入、更便宜

2016年3月,谷歌的计算机彻底打败了世界围棋冠军李世石(Lee Sedol),这是人工智能领域的里程碑事件。获胜的计算机程序由英国伦敦谷歌DeepMind实验室的研究人员创建,利用了深度学习人工神经网络。深度学习是一种策略,多层处理的神经网络以自动化方式配置,解决手边的问题。

那时公众还不知道谷歌有这个秘密武器。谷歌用来打败李世石的计算机有专用硬件——谷歌称之为“张量处理单元”(Tensor Processing Unit)的计算机芯片。围棋比赛两个月后,谷歌硬件工程师宣布了张量处理单元的存在,并在博文中解释说,早在一年多之前谷歌就用这些加速芯片装备自己的数据中心了。谷歌并没有直接分享这些芯片上有什么,但是很显然它代表了加速深度学习计算的越来越普遍的策略:应用型专用集成电路(application-specific integrated circuit, ASIC)。

另一个(主要被微软)追求的策略是利用现场可编辑门阵列(field-programmable gate array, FPGA),其优势在于可根据计算要求改变而再配置。但是更常用的方法是使用图形处理器(graphics processing unit, GPU),可同时进行多个数学运算,这种方法最重要的支持者就是图形处理器制造商英伟达(Nvidia)。2009年,图形处理器的发展启动了人工神经网络,当时,美国斯坦福(Stanford)的研究人员展示了这种硬件可在合理时间内训练深度神经网络。英伟达首席科学家指出,“现在每个人都在做深度学习。”对此,他表示,“图形处理器几乎与你能实现的一样好。”鉴于他的工作,他的这一说法可能在情理之中。他解释说要考虑三个方面。第一方面他称之为“数据中心的训练”,并提到了任何深度学习系统的第一步:调整神经元之间可能数百万个的连接,以便网络能进行指定的任务。

要构建作用于此的硬件,Nervana系统公司在这方面处于领先地位,该公司刚被美国英特尔(Intel)收购。据该公司计算机科学家表示,应用型专用集成电路深度学习加速器Nervana Engine将在2017年初到年中投入生产。一项计算密集型任务——比特币挖矿——从在中央处理器(CPU)上运行,到图形处理器、现场可编辑门阵列,最后到应用型专用集成电路,因为这种定制化提高了能效。

深度学习硬件另一个独特的作用是“在数据中心进行推断”。这里的推断是指已经过训练可进行某些任务的基于云端的人工神经网络正在进行的操作。每一天,谷歌的神经网络都要进行无数次这种推断运算,用于分类图片、翻译、识别语音等。虽然很难肯定,但谷歌的张量处理单元可能是专为执行这样的计算而打造的。

训练和推断通常所需的技能集很不一样。对于训练,计算机必须能以较高精度运算,通常是32位浮点运算。对于推断,可以牺牲精度,换取更高的速度或更小的功率效率。“这是活跃的研究领域。”Nervana系统公司计算机科学家指出,“你能实现多低呢?”

虽然英伟达首席科学家拒绝透露该公司的具体计划,但他指出英伟达的图形处理器一直在进步。英伟达早期的Maxwell架构可进行双精度(64位)和单精度(32位)的运算,而其现有的Pascal架构增加了16位运算的能力,与单精度运算相比,其通量和效率都翻倍了。所以,很容易想到英伟达最终会发布能进行8位运算的图形处理器,这将是云端进行推断运算的最佳工具,因为功率效率是降低成本的关键。他补充说:“深度学习三大支持的最后一点是在嵌入式设备中进行推断”,如智能手机、相机、平板灯。对于这些应用,关键是低功耗的应用型专用集成电路。在未来一年,深度学习软件会不断进入智能手机的应用,例如,目前已经用于检测恶意软件或翻译图片中的文字。

中国无人机制造商大疆创新公司(DJI)已在其精灵4(Phantom 4)无人机上采用了类似于深度学习应用型专用集成电路的应用,通过美国加州视觉处理器生产商Movidius生产的专门视觉处理芯片来识别障碍物(Movidius是最近英特尔收购的又一家神经网络公司)。此外,高通(Qualcomm)在其骁龙820处理器中植入了专门的电路,帮助执行深度学习计算。

虽然目前有很多利好刺激硬件设计,加速深度神经网络的运算,但也存在巨大风险:如果最先进技术发展得够远,专为运行过去的神经网络而设计的芯片在制造的时候就将过时了。“算法改变的速度很快”英伟达首席科学家指出,“这个领域的每个人都在努力地兼顾,力争万无一失。”

原文发布于微信公众号 - 人工智能快报(AI_News)

原文发表时间:2017-03-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ATYUN订阅号

【学术】量子算法与计算机对抗,胜者究竟是谁?

我们对“量子霸权(quantum supremacy)”的追求证明了量子计算机比普通计算机能够更快地做一些事情,但是,却自相矛盾地导致了准量子典型算法的繁荣。 ...

3114
来自专栏大数据文摘

【干货】推荐系统原理介绍

28411
来自专栏专知

深度学习为什么需要工业化标准

【导读】近日,深度学习作者Carlos E. Perez发表一篇博客,讨论了深度学习的工业化标准问题。我们知道,深度学习是当前AI领域的一个利器,其标准也不能照...

3295
来自专栏新智元

【详解】FPGA:深度学习的未来?

摘要 最近几年数据量和可访问性的迅速增长,使得人工智能的算法设计理念发生了转变。人工建立算法的做法被计算机从大量数据中自动习得可组合系统的能力所取代,使得计算机...

4086
来自专栏云计算

云端生存思考之三:算法制胜,工程亦然

什么是云计算?云计算代表的是社会的量化管理趋势,以大数据的形式表达出来。由于宣传的原因,人人以为大数据就是统计,云计算就是Hadoop,其实我们工程领域的某些计...

1835
来自专栏灯塔大数据

人工智能 |「凡是过往,皆为序章。」64岁的RODNEY BROOKS谈AI的起源与发展

我们距离通用人工智能还有多远?这是一个很多人都在试图回答的问题。然而对于人工智能领域的真正从业者来说,我们面前的道路还很长。Rethink Robotics 创...

703
来自专栏人工智能快报

人工智能平台可有效预测网络攻击

现今使用的安全系统通常分为两类:基于人或机器的安全系统。所谓“分析师驱动的解决方案”(analyst-driven solutions)基于的是真人专家所建立的...

3245
来自专栏ATYUN订阅号

微软宣布在中英文机器翻译方面取得重大突破

AiTechYun 编辑:nanan 微软本周三宣布,他们已经创造出了第一台机器翻译系统,能够以与人一样的准确度将新闻稿件从中文翻译成英文。该公司表示,他们对该...

3247
来自专栏CDA数据分析师

如何成为一名数据科学家 | 面试篇(附视频中字)

CDA字幕组 编译整理 本文为 CDA 数据分析师原创作品,转载需授权 数据科学家是21世纪最性感的职业,在本文中我们将解答如何找一份适合自己的数据科学工作。 ...

28610
来自专栏新智元

AI 再造搜索3招:谷歌如何用机器学习和深度学习直接给你答案

【新智元导读】搜索是最先一批被人工智能深刻改变的行业,这不仅仅是因为搜索公司(谷歌、百度、微软)跑在了AI 革命的前面。本文从搜索结果、视频搜索和精准营销/SE...

2974

扫描关注云+社区