【AI大突破】Ian Goodfellow: 2016年是谷歌翻译，17年看医药领域

新智元

发布于 2018-03-27 10:41:49

6530

发布于 2018-03-27 10:41:49

文章被收录于专栏：新智元

【新智元导读】Future of Life 网站采访了 Richard Mallah 和 Ian Goodfellow，讨论 AI 在过去一年取得的进步，以及对2017年的展望。

2016年，AI 取得了一些重要的发展。我们采访了 Richard Mallah 和 Ian Goodfellow，和他们一起聊一聊 AI 在过去一年所取得的进步。Richard 是 FLI（Future of Life Institute） AI 项目的主管，他是多家AI 公司的资深顾问，创建了获得最高评价的企业文本分析平台。Ian 是 OpenAI 的研究科学家，Deep Learning 一书的第一作者，同时也是生成对抗网络（GAN）的提出者。

Ariel：对我来说，2016年有两件事比较难忘。第一件是 AlphaGo 在3月份击败世界顶级围棋棋手李世石。AlphaGo 是谁？为什么这一成就如此让人难以置信。

Ian：AlphaGo 是 DeepMind 的围棋游戏系统。围棋是这样一种游戏：两位玩家轮流在棋盘上放置棋子，玩家需要尽可多地占领领地。但是，每次放置棋子，我们面临的选择都有成百上千次。用计算机来模拟一些不同的围棋游戏，并且弄清楚，这一游戏未来会如何发展，通常被认为是无法实现的。要做到这一点，计算机需要依赖于直觉，正如人类棋手看着棋盘，会得到一种被称为“第六感”东西，告诉他棋局对他是否有利，下一步棋该如何走。要精确地计算出每位玩家下一步棋该怎么走，从计算能力上来说，是不可行的。

Richard： DeepMind 团队有一个网络用于所谓的价值学习（value learning），另一个深层网络用于策略学习（policy learning）。从根本上看，所谓的策略指的是，下一步棋该怎么走。价值网络则是关于该状态有多好，也就是智能体（agent）获胜的概率大小。然后它们会执行蒙特卡洛树搜索，这意味着它有一些随机性和许多不同的路径：大约是数千的数量级。所以它更像是一个人在思考一些不同的行动，并试图确定这些动作的效果如何。

Ian：从2012年到2015年，我们看到了许多突破，其中最令人兴奋的是AI已经能够复制人的能力。但是到了2016年，我们开始看到的突破是，AI 开始超越人类的表现。AlphaGo 令人兴奋的部分是，AlphaGo 不仅学习如何预测一个人类围棋专家会做什么，它还通过自我对弈，来学习如何比人类最好的棋手做得更好。所以我们开始看到，AI 现在能做的事，比人类告诉计算机要去做的事还多。

Ariel：那么这将如何应用于我们将日常的交互应用程序中？我们怎样才能开始看到这些技术的影响？

Richard：这些技术很多都是研究系统。他们不一定要直接进入产品化的管道，但它们正在帮助在AI系统和机器学习系统中隐含学习的模型，以获得更好的效果。

Ian：还有其他的策略，比如，生成和此前的研究类似的新研究，其中一个就是 WaveNet。这是 DeepMind 在2016年推出的语音生成模型。你给系统提供一句话，只需要把这句话写下来，你就能听到计算机把这句话读出来。WaveNet 可以创建一个听起来非常真实的音频波形，如人类发音一般。WaveNet 现在的主要缺点是它相当慢。它必须一次产生一个音频波形。我认为 WaveNet 需要两分钟才能生成一秒钟的音频，所以音频速度还不够快到支持交互对话。

Richard：类似的。我们也看到了用来为黑白照片上色、把素描变成逼真图像或者把文本转化成图像的应用。

Ian：是的，一个真正能证明我们已经走了多远的事情发生在2014年，其中一个重大的突破是，AI 能够生成一个句子来总结照片中的内容。在2016年，我们看到了处理一句话的不同方法，让计算机可以根据句子描述的内容，来生成一张照片。从几个字到一个非常逼真的、包含数千或数百万像素的图像比从图像到文字更复杂。

2016年，另一个令人兴奋的事是使用生成模型进行药物发现。该模型能真正地描绘出新的分子，这些分子的药效都是非常明确的。此前的模型只能描绘图像而不是分子。

Ariel：随后就是谷歌的翻译程序——谷歌基于神经网络的机器翻译。你们能聊聊这个吗？为什么这是一个大的突破？

Ian：说它是大的突破有两个原因。首先，谷歌基于神经网络的机器翻译比此前各种机器翻译技术都要好很多，它摒弃掉了许多人为设计的元素，只使用一个神经网络来弄清楚要做什么。

关于谷歌基于神经网络的机器翻译，另一件非常令人兴奋的事情是，机器翻译模型已经发展了我们所谓的“国际语”。过去，如果你想从日语翻译为韩语，你必须找到很多已经从日语翻译成韩语的句子，也就是语料，然后你可以训练一个机器学习模型，来复制此前的翻译过程。但现在，如果你已经知道如何从英语翻译成韩语，你就知道如何从英语翻译成日语。中间有国际语。也就是，你先从英语翻译成国际语，然后翻译成日语；把英语翻译成国际语，再翻译成韩语。你也可以把日语翻译成国际语或把韩语翻译成国际语，然后把国际语翻译成日语或韩语，你不再需要在某两种特定的语言中寻找一一对应的句子语料。

Ariel：用于语言的技术如何应用于其他地方？2017年及以后，你对这一发展有何预期？

Richard：我认为，我们从这个方法中学到的是，深度学习系统能够创造出关于现实世界的非常丰富的模型，能真实地表达我们可以想到的东西，这是一个非常令人兴奋的里程碑。能够将国际语与关于真实世界的更多结构化信息相结合是各个团队正在努力的方向，在未来几年，这会是一个大的开放领域。

Ian：在OpenAI，我们最大的项目——Universe，能让强化学习智能体玩许多不同的计算机游戏，这些智能体与游戏的交互方式与人类一模一样：通过键盘或者鼠标完成。相同的强化学习智能体基本上可以完成所有人类能进行的计算机交互行为。让一个智能体能做到所有这些不同的事，我们能真正地锻炼自己的能力，创造通用的人工智能。像谷歌的“国际语”翻译这样的项目，让我们有充分的理由去相信这是可以实现的。

Ariel：今年发生的事，还有什么你们觉得特别重要的？

Richard：单次学习 （One-shot learning），指的是，在面对一个新的任务时，你只能看到一点点数据，可能只有一个数据点，然后你可以推断出这是什么类型，或者这一功能大体是怎么样的。因此，基于非常少的数据，能够从一般的背景知识训练系统，这将是非常令人兴奋的。

Ian：让我兴奋的是一个新的领域——机器学习安全。其中攻击者可以欺骗机器学习系统，让其采取错误的行动。对象识别系统就是很容易欺骗的。例如，我们可以给它一个看起来很像熊猫的图像，但是它识别出来是校车，反之亦然。在现实中，骗过机器学习系统是可能的。有一篇名为 Accessorize to a Crime 的文章，说的是，通过佩戴不寻常的彩色眼镜，可以骗过面部识别系统。我和 GoogleBrain 的研究员一起在 Physical World 写了一篇名为“对抗实例”（Adversarial Examples）的文章，展示了我们可以给图像增加噪点，通过相机观看时，我们可以控制对象识别系统如何对这些图像进行响应。

Ariel：你认为2016年有什么重要的事件，或者2017年有什么期待吗？

Richard：是的，我认为2017年会更加专注于无监督学习。世界上大多数事物是没有人为标注的，一间房子的周围不会贴着便签，上面写着它们是什么。能够以更加无监督的方式处理[世界]将带来大量的新应用。

Ian：它（无监督学习）也将使AI更民主化。现阶段，如果你想使用真正高级的AI，你不仅需要有很多计算机，而且需要很多数据。这也是为什么在 AI 竞争中主要是非常大的公司在扮演角色。如果你想让AI把一个任务做得非常好，你得提供给计算机100万个不同的样本。在未来，AI将能够更像人类一样学习，少量的样本就已经足够。一旦我们的机器学习系统能够以人类的方式快速习得有关正在发生的事情的一般概念，就不再需要构建这些大型的数据集了。

Richard：我认为在接下来的一年里，一个重要的应用领域是自动检测假新闻，假音频，假图像和假视频。去年这方面的一些应用程序实际上专注于生成额外的视频帧。随着这些生成技术变得更好，像我们之前谈到的图像处理变得更好，还有音频模板也越来越好……我认为 Adobe，它们称自己是声音的 PhotoShop，你可以往里面输入一些文本，然后选择一个人，结果会听起来很像是那个人在说你输入的文字。所以我们需要能够检测的方法，因为假新闻这整个概念已经愈演愈烈。

Ian：值得一提的是，还有其他方法能够解决假新闻的传播。垃圾电子邮件检测使用多种不同的线索，它可以统计人们是否将电子邮件标记为垃圾邮件与这些线索的关联。我们有很多可以做的，而不需要推进底层的AI系统。

Ariel：就你在过去一年看到的进步，你有什么担忧吗？

Ian：就业问题。由于未来大部分工作都能够实现自动化，我们应该怎样确保每个人都从这种自动化中受益？而社会结构形成的方式，现在越来越多的自动化似乎都加快了财富的集中，每一个进步都有赢家和输家。我担心的是，过去需要数百万人的工作实现自动化后，将形成大多数输家和少数赢家，少数的赢家将赢得绝大多数的财富。

Richard：我也有点关心我们在接近通用AI的速度。看到系统能够做很多不同的事情，能够做它们之前从来没见过，或者只见过少次的任务，这非常让人激动。但这也引发了何时实施不同类型的安全技术的问题。虽然我认为我们还没到这个点上，但它确实提出了问题。

Ariel：用一个积极的问题作为结束：回顾去年看到的进步，你最希望我们的未来是什么样的？

Ian：我认为AI开始被用于医学这些领域是真正伟大的事情。在过去一年中，我们看到了很多在某些任务中可以超过人类能力的机器学习算法，我们也开始看到AI在医学领域上的应用，例如设计新药。这让我感到非常有希望，我们将看到AI的药物设计，以及AI真正使大众的生活更好的其他应用。

Richard：人们将发现他们的工作中许多人物都是自动化的。这将让他们能做更需创造性，有更多增值的事情，可能能在他们的领域里或跨领域地做更有趣的工作。我认为未来是开放的，开放本身已经令人兴奋。

原文地址：https://futureoflife.org/2017/01/31/podcast-top-ai-breakthroughs-with-ian-goodfellow-and-richard-mallah/

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2017-02-01，如有侵权请联系 cloudcommunity@tencent.com 删除

其他

本文分享自新智元微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

其他

登录后参与评论

0 条评论

热度

【AI大突破】Ian Goodfellow: 2016年是谷歌翻译，17年看医药领域

【AI大突破】Ian Goodfellow: 2016年是谷歌翻译，17年看医药领域

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐