盘点丨2016 这一年,深度学习开始主宰互联网

AI 科技评论按:2016 即将画上句号,当我们回顾这一年的科技进展时,很难不联想到一个词——深度学习。当它从研究室中脱胎而出,并成为今年的当红热词,实际上我们已经意识到深度学习的来临。从 AlphaGo 到 Google Translate,AI 科技评论也做过不少覆盖和解析。Cade Metz 为 Wired 撰文回顾了与深度学习同行的这一年,本文由 AI 科技评论进行编译。

在澳大利亚西海岸,Amanda Hodgson 正在操控无人机飞跃海面,无人机可以帮助他们在水面上拍摄照片,利用这些照片,可以定位澳大利亚珀斯湾的儒艮(也就是我们俗称的海牛)——世界上最珍贵的濒临灭绝保护动物之一。虽然照片拍摄的非常成功,但 Hodgson 和她的团队很快就遇到了一个新问题:如果仅靠肉眼甄别,他们没有能力从所有拍摄的约 4.5 万张照片中找到儒艮的身影。所以,她决定把这个工作交给一个深度神经网络来处理。

神经网络是一种机器学习模型,举个例子,Facebook 公司可以在其平台上的 news feed 里识别照片中的人脸。再比如你的安卓手机可以识别出你所问的问题,然后帮你运行谷歌搜索引擎。这些神经网络都是模拟了人类大脑,然后利用数据模型分析大量数据,进行自主学习各种事物。 现在,身为珀斯莫道克大学海洋生物学家的 Hodgson, 也在使用同样的技术在拍摄的数万张开放水域照片中寻找儒艮,这套神经网络是基于谷歌开源机器学习软件 TensorFlow 开发的。

正如 Hodgson 所解释的,检测这些儒艮需要特殊的定点精准度,因为它们通常都是潜伏在海洋表面,而且身体颜色和水面折射的波光很相似,所以分辨起来难度很大。不过,这并没有难倒神经网络系统,它们可以识别出分布在珀斯湾 80% 的儒艮。

目前,这个项目仍处于早期阶段,但已经向人们展示出了深度学习技术在过去一年里的强大影响力。2016 年,深度学习技术帮助“AlphaGo”战胜了世界顶级围棋手李世石,要知道就在几个月之前,还没有人能相信机器可以做到这一点。而打败围棋世界冠军,不过是机器学习领域里的一个“小插曲”而已,如今,机器学习已经不再是“忽悠”人的小把戏,更不是什么黑科技了,随着我们即将迈入 2017 年,像谷歌、Facebook、微软和亚马逊这些科技巨头也开始推广这一技术,这些互联网巨头加大了开源软件和云计算服务的部署,深度学习的实际应用逐渐增多。

全新的机器翻译

在过去的几年里,神经网络颠覆了很多领域,比如 Google Photos 应用让图像识别上升到了一个新高度;而 Google Now 和微软小娜这些数字助手在语音识别上也获得了重大突破。今年,机器学习技术开始应用到翻译领域,该技术可以将一种语言自动翻译成另外一种语言。今年九月,谷歌推出了全新的“谷歌神经机器翻译”服务,完全通过神经网络来运行,这套全新的翻译引擎在翻译特定语言的时候,能够将误差率降低 55-85%。

通过导入大量现有的翻译数据,谷歌开始训练这些神经网络,当然,有些训练数据质量并不高,包括之前版本的谷歌翻译应用所翻译的数据。但是这些数据中也包含人类翻译专家所做的高质量翻译数据。事实上,深度学习技术最让人着迷的地方,就是它可以克服数据质量参差不齐的问题,只要给神经网络足够多的数据,让它去学习,即使里面有各种缺陷,也一样能获得比较好的学习效果。

Mike Schuster 是一名谷歌高级工程师,他坦诚地表示,目前谷歌翻译距离完美还比较遥远,不过应用机器学习的谷歌翻译体现的是一种技术突破,因为谷歌翻译服务现在完全依赖于深度学习,所以未来谷歌想要改善、优化这项服务就会变得更加简单。谷歌可以专注于优化系统整体,而不是像过去那样一个个去优化机器翻译服务里的小模块。

与此同时,微软也在尝试在翻译应用中使用机器学习技术。就在这个月,微软公司发布了新版翻译应用 Microsoft Translator,可以翻译九种不同语言的实时对话。根据微软公司负责人工智能研究的副总裁 Harry Shum 透露,全新的翻译系统同样完全依赖于神经网络,不要小看它,因为这意味着微软的机器翻译能力很可能会在短时间内快速提升,获得重大突破。

全新的对话聊天

在 2016 年,深度学习技术在聊天机器人领域里得到了广泛应用,其中最让人关注的就是谷歌的 Google Allo,这款聊天机器人在今年秋季正式发布,它可以分析用户接收到的文本和照片,然后给予推荐和智能回复。Allo 聊天机器人是基于谷歌前期一项名为“智能回复(Smart Reply)”的技术研发出来的,后者更类似于电子邮件自动回复信息。深度学习在聊天机器人应用的很好,很大一部分原因是因为它尊重了今天机器学习技术的局限性。实际上,Allo 聊天机器人对话的回复通常比较简短,而且它通常也会给出几个建议,这主要是因为目前人工智能技术还无法正确地处理所有事情。

在 Allo 聊天机器人里,神经网络不仅可以利用谷歌搜索引擎回答用户提出的问题,同时它还能够将用户询问的问题反馈给谷歌公司,帮助他们优化答案。在谷歌搜索产品经理 David Orr 看来,如果没有深度学习技术的支持,Allo 聊天机器人本身根本没有回答任何问题的能力。他说道:

你需要使用升级网络——至少这是我们目前找到的唯一解决方案,我们不得不使用所有现在能够掌握的最先进的技术。

不过,神经网络真正无法做到的,其实是将一个实际对话持续下去,从这个角度来看,无论科技大咖们如何吹嘘自己的技术如何先进,聊天机器人依然有很长的路要走。不过,谷歌、Facebook、以及其他科技巨头旗下的研究人员会不断探索深度学习技术,希望能够尽快实现这一愿景。得益于这些研究人员的努力,我们已经看到了语音识别、图像识别、以及机器翻译得到了巨大进步,而聊天机器人会话将会是他们需要攻克的下一个前沿阵地。

全新的数据中心

今年夏天,谷歌人工智能工程师 Demis Hassabis 和 Google DeepMind 实验室团队推出了人工智能“AlphaGo”,并且打败了围棋世界冠军。不过,除了“AlphaGo”之外,他们还构建了一套人工智能应用,可以帮助谷歌高效运营全世界范围内的计算机数据中心网络。这项技术名为强化深度学习,该技术曾应用在早期围棋人工智能和 DeepMind 服务里面。现在,谷歌利用强化深度学习技术管理旗下数据中心运营,比如人工智能可以决定什么时候打开数据中心内数千台计算机服务器的冷却风扇开关、什么时候打开数据中心的窗户强化冷却效果、或是什么之后关闭昂贵的空调制冷等等。据悉,人工智能可以高效管理一个数据中心内 120 多项功能。

人工智能的确高效,谷歌已经节省了数亿美元成本,换句话说,谷歌在 2014 年以 6.5 亿美元的高价收购 DeepMind,现在基本上“回本儿”了。现在,DeepMind 正计划在谷歌所有计算设备上部署传感器,这样就能收集更多数据,帮助训练人工智能达到更高的管理水平。

全新的云计算服务

科技巨头们已经开始在自己的产品和服务中推动机器学习技术的应用,不过他们同样希望在其他领域里施展拳脚。2015 年末,谷歌开源了 TensorFlow。在过去的一年时间里,TensorFlow 软件造福了很多人,其中就包括前文提到的澳大利亚生物学家 Amanda Hodgson。与此同时,谷歌、微软、以及亚马逊等公司也开始在自己的云计算服务中应用深度学习技术,任何程序员或公司都可以开发自己的 App,“人工智能即服务”已然成为了互联网三大巨头最重要的核心业务。

在过去的十二个月,由于人工智能行业发展的日益火爆,这一领域里的人才也变得炙手可热。作为这一领域里的翘楚之一,斯坦福大学教授李飞飞最近被谷歌挖去,负责人工智能云计算业务。亚马逊公司也挖来了卡耐基梅隆大学教授 Alex Smolna,负责旗下人工智能云计算业务。互联网巨头们还是尽可能地笼络全球人工智能技术人才,好消息是,这些人才并没有拘泥于自己的小圈子,他们都愿意将自己的研究成果分享给大家。

随着人工智能技术的不断进化,计算科学家所扮演的角色也在发生转变,未来也许真的不需要人工程序员去编写代码软件了,反而需要更多人才去训练神经网络学习,所以掌握这一技能的人会更具竞争优势。像谷歌和 Facebook 这样的大企业,他们不仅招募了大量新型人才,同时也在积极引导自己的员工拥抱新技术——未来,我们的科技或许真的会由人工智能来定义,而且会影响到每个人的生活。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2016-12-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

奇点后人工智能会迎来大爆发? François Chollet发文阐释:你们想多了,不会的

AI 科技评论按:普通大众对“人工智能的智力超越人类,最终统治世界、灭绝人类”这件事充满了担忧,而实际上许多已经在从事人工智能相关工作的研究者也免不了有类似的担...

2936
来自专栏AI科技评论

观点 | 谷歌证明数据为王,初创公司们被泼上了一盆冰水

AI 科技评论按:上周我们报道了谷歌的一项研究 “数据为王”是真的吗?谷歌轻抚着100倍的数据量点了点头 - AI科技评论,它直观地体现了更多训练数据可以带来更...

3117
来自专栏罗超频道

多媒体搜索再进化

2015年百度世界展出了语音和图像为代表的多媒体搜索技术,这并非其首次亮相百度世界大会,多媒体搜索已成为百度的重头戏,与连接人与服务战略、人工智能战略一起构成百...

3348
来自专栏区块链入门

金融行业如何用大数据构建精准用户画像?

用户画像的焦点工作就是为用户打“标签”,而一个标签通常是人为规定的高度精炼的特征标识,如年龄、性别、地域、用户偏好等,最后将用户的所有标签综合来看,就可以勾勒出...

581
来自专栏钱塘大数据

【推荐阅读】如何用大数据构建精准用户画像?

什么是用户画像? 用户画像(User Profile),作为大数据的根基,它完美地抽象出一个用户的信息全貌,为进一步精准、快速地分析用户行为习惯、消费习惯等重...

5876
来自专栏镁客网

微软前副总裁谈人工智能:人类依然不可或缺

1235
来自专栏机器之心

观点 | Facebook数据泄露事件之后,还有哪些AI危机在等着我们?

选自Medium 作者:François Chollet 机器之心编译 参与:白悦、李泽南 自今年三月以来,由 Facebook 数据泄漏、「大数据杀熟」等事件...

2577
来自专栏PPV课数据科学社区

干货长文 | 如何用大数据构建精准用户画像?

什么是用户画像? 用户画像(User Profile),作为大数据的根基,它完美地抽象出一个用户的信息全貌,为进一步精准、快速地分析用户行为习惯、消费习惯等重...

5188
来自专栏华章科技

大数据不背“杀熟”的锅!高科技公司掌握了你的个人信息,都干了些啥?

首先大家对于“大数据杀熟”这件事怎么理解?“杀熟”是客户营销方面的标准操作吗?高科技公司掌握了我们的个人信息,难道只能用于诱骗客户进行过度消费吗?

592
来自专栏企鹅号快讯

腾讯优图为“刷脸”之旅打造新任守护者——“极光守卫”

机器之心原创 作者:高静宜 腾讯优图实验室成功研发光线活体技术,通过闪光模拟实现多重随机信息的编码和解码,使方法建立在密码学的坚实基础之上,是目前已知安全级别最...

1946

扫码关注云+社区