盘点丨2016 这一年，深度学习开始主宰互联网

AI科技评论

发布于 2018-03-09 11:45:50

7840

发布于 2018-03-09 11:45:50

文章被收录于专栏：AI科技评论

AI 科技评论按：2016 即将画上句号，当我们回顾这一年的科技进展时，很难不联想到一个词——深度学习。当它从研究室中脱胎而出，并成为今年的当红热词，实际上我们已经意识到深度学习的来临。从 AlphaGo 到 Google Translate，AI 科技评论也做过不少覆盖和解析。Cade Metz 为 Wired 撰文回顾了与深度学习同行的这一年，本文由 AI 科技评论进行编译。

在澳大利亚西海岸，Amanda Hodgson 正在操控无人机飞跃海面，无人机可以帮助他们在水面上拍摄照片，利用这些照片，可以定位澳大利亚珀斯湾的儒艮（也就是我们俗称的海牛）——世界上最珍贵的濒临灭绝保护动物之一。虽然照片拍摄的非常成功，但 Hodgson 和她的团队很快就遇到了一个新问题：如果仅靠肉眼甄别，他们没有能力从所有拍摄的约 4.5 万张照片中找到儒艮的身影。所以，她决定把这个工作交给一个深度神经网络来处理。

神经网络是一种机器学习模型，举个例子，Facebook 公司可以在其平台上的 news feed 里识别照片中的人脸。再比如你的安卓手机可以识别出你所问的问题，然后帮你运行谷歌搜索引擎。这些神经网络都是模拟了人类大脑，然后利用数据模型分析大量数据，进行自主学习各种事物。现在，身为珀斯莫道克大学海洋生物学家的 Hodgson, 也在使用同样的技术在拍摄的数万张开放水域照片中寻找儒艮，这套神经网络是基于谷歌开源机器学习软件 TensorFlow 开发的。

正如 Hodgson 所解释的，检测这些儒艮需要特殊的定点精准度，因为它们通常都是潜伏在海洋表面，而且身体颜色和水面折射的波光很相似，所以分辨起来难度很大。不过，这并没有难倒神经网络系统，它们可以识别出分布在珀斯湾 80% 的儒艮。

目前，这个项目仍处于早期阶段，但已经向人们展示出了深度学习技术在过去一年里的强大影响力。2016 年，深度学习技术帮助“AlphaGo”战胜了世界顶级围棋手李世石，要知道就在几个月之前，还没有人能相信机器可以做到这一点。而打败围棋世界冠军，不过是机器学习领域里的一个“小插曲”而已，如今，机器学习已经不再是“忽悠”人的小把戏，更不是什么黑科技了，随着我们即将迈入 2017 年，像谷歌、Facebook、微软和亚马逊这些科技巨头也开始推广这一技术，这些互联网巨头加大了开源软件和云计算服务的部署，深度学习的实际应用逐渐增多。

全新的机器翻译

在过去的几年里，神经网络颠覆了很多领域，比如 Google Photos 应用让图像识别上升到了一个新高度；而 Google Now 和微软小娜这些数字助手在语音识别上也获得了重大突破。今年，机器学习技术开始应用到翻译领域，该技术可以将一种语言自动翻译成另外一种语言。今年九月，谷歌推出了全新的“谷歌神经机器翻译”服务，完全通过神经网络来运行，这套全新的翻译引擎在翻译特定语言的时候，能够将误差率降低 55-85%。

通过导入大量现有的翻译数据，谷歌开始训练这些神经网络，当然，有些训练数据质量并不高，包括之前版本的谷歌翻译应用所翻译的数据。但是这些数据中也包含人类翻译专家所做的高质量翻译数据。事实上，深度学习技术最让人着迷的地方，就是它可以克服数据质量参差不齐的问题，只要给神经网络足够多的数据，让它去学习，即使里面有各种缺陷，也一样能获得比较好的学习效果。

Mike Schuster 是一名谷歌高级工程师，他坦诚地表示，目前谷歌翻译距离完美还比较遥远，不过应用机器学习的谷歌翻译体现的是一种技术突破，因为谷歌翻译服务现在完全依赖于深度学习，所以未来谷歌想要改善、优化这项服务就会变得更加简单。谷歌可以专注于优化系统整体，而不是像过去那样一个个去优化机器翻译服务里的小模块。

与此同时，微软也在尝试在翻译应用中使用机器学习技术。就在这个月，微软公司发布了新版翻译应用 Microsoft Translator，可以翻译九种不同语言的实时对话。根据微软公司负责人工智能研究的副总裁 Harry Shum 透露，全新的翻译系统同样完全依赖于神经网络，不要小看它，因为这意味着微软的机器翻译能力很可能会在短时间内快速提升，获得重大突破。

全新的对话聊天

在 2016 年，深度学习技术在聊天机器人领域里得到了广泛应用，其中最让人关注的就是谷歌的 Google Allo，这款聊天机器人在今年秋季正式发布，它可以分析用户接收到的文本和照片，然后给予推荐和智能回复。Allo 聊天机器人是基于谷歌前期一项名为“智能回复（Smart Reply）”的技术研发出来的，后者更类似于电子邮件自动回复信息。深度学习在聊天机器人应用的很好，很大一部分原因是因为它尊重了今天机器学习技术的局限性。实际上，Allo 聊天机器人对话的回复通常比较简短，而且它通常也会给出几个建议，这主要是因为目前人工智能技术还无法正确地处理所有事情。

在 Allo 聊天机器人里，神经网络不仅可以利用谷歌搜索引擎回答用户提出的问题，同时它还能够将用户询问的问题反馈给谷歌公司，帮助他们优化答案。在谷歌搜索产品经理 David Orr 看来，如果没有深度学习技术的支持，Allo 聊天机器人本身根本没有回答任何问题的能力。他说道：

你需要使用升级网络——至少这是我们目前找到的唯一解决方案，我们不得不使用所有现在能够掌握的最先进的技术。

不过，神经网络真正无法做到的，其实是将一个实际对话持续下去，从这个角度来看，无论科技大咖们如何吹嘘自己的技术如何先进，聊天机器人依然有很长的路要走。不过，谷歌、Facebook、以及其他科技巨头旗下的研究人员会不断探索深度学习技术，希望能够尽快实现这一愿景。得益于这些研究人员的努力，我们已经看到了语音识别、图像识别、以及机器翻译得到了巨大进步，而聊天机器人会话将会是他们需要攻克的下一个前沿阵地。

全新的数据中心

今年夏天，谷歌人工智能工程师 Demis Hassabis 和 Google DeepMind 实验室团队推出了人工智能“AlphaGo”，并且打败了围棋世界冠军。不过，除了“AlphaGo”之外，他们还构建了一套人工智能应用，可以帮助谷歌高效运营全世界范围内的计算机数据中心网络。这项技术名为强化深度学习，该技术曾应用在早期围棋人工智能和 DeepMind 服务里面。现在，谷歌利用强化深度学习技术管理旗下数据中心运营，比如人工智能可以决定什么时候打开数据中心内数千台计算机服务器的冷却风扇开关、什么时候打开数据中心的窗户强化冷却效果、或是什么之后关闭昂贵的空调制冷等等。据悉，人工智能可以高效管理一个数据中心内 120 多项功能。

人工智能的确高效，谷歌已经节省了数亿美元成本，换句话说，谷歌在 2014 年以 6.5 亿美元的高价收购 DeepMind，现在基本上“回本儿”了。现在，DeepMind 正计划在谷歌所有计算设备上部署传感器，这样就能收集更多数据，帮助训练人工智能达到更高的管理水平。

全新的云计算服务

科技巨头们已经开始在自己的产品和服务中推动机器学习技术的应用，不过他们同样希望在其他领域里施展拳脚。2015 年末，谷歌开源了 TensorFlow。在过去的一年时间里，TensorFlow 软件造福了很多人，其中就包括前文提到的澳大利亚生物学家 Amanda Hodgson。与此同时，谷歌、微软、以及亚马逊等公司也开始在自己的云计算服务中应用深度学习技术，任何程序员或公司都可以开发自己的 App，“人工智能即服务”已然成为了互联网三大巨头最重要的核心业务。

在过去的十二个月，由于人工智能行业发展的日益火爆，这一领域里的人才也变得炙手可热。作为这一领域里的翘楚之一，斯坦福大学教授李飞飞最近被谷歌挖去，负责人工智能云计算业务。亚马逊公司也挖来了卡耐基梅隆大学教授 Alex Smolna，负责旗下人工智能云计算业务。互联网巨头们还是尽可能地笼络全球人工智能技术人才，好消息是，这些人才并没有拘泥于自己的小圈子，他们都愿意将自己的研究成果分享给大家。

随着人工智能技术的不断进化，计算科学家所扮演的角色也在发生转变，未来也许真的不需要人工程序员去编写代码软件了，反而需要更多人才去训练神经网络学习，所以掌握这一技能的人会更具竞争优势。像谷歌和 Facebook 这样的大企业，他们不仅招募了大量新型人才，同时也在积极引导自己的员工拥抱新技术——未来，我们的科技或许真的会由人工智能来定义，而且会影响到每个人的生活。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2016-12-29，如有侵权请联系 cloudcommunity@tencent.com 删除

人工智能

深度学习

本文分享自 AI科技评论微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

人工智能

深度学习

登录后参与评论

0 条评论

热度