百度让AI像婴儿一样学语言，还能举一反三听老师指挥走迷宫

量子位

发布于 2018-03-22 14:42:36

5570

发布于 2018-03-22 14:42:36

文章被收录于专栏：量子位

李杉李林编译整理量子位出品 | 公众号 QbitAI

把已经学会的技能用在新的任务上，对于人类来说是很简单的事，但这种“泛化”能力是机器所缺乏的。

百度研究院的一组科学家认为，想实现这种“让机器具有真正的智能、像人一样学习”的目标，关键在于开发一个复杂的语言系统。

百度研究院深度学习组的Haonan Yu、Haichao Zhang和Wei Xu在最近发表的论文中公布了一项重大进展：他们教会了一个虚拟Agent，如何根据“老师”的自然语言指令，在迷宫般的2D环境XWORLD中穿行。Agent每次躲避障碍都能获得奖励。

他们认为，想让机器像人一样学习，首先，需要用监督学习和强化学习结合起来，开发一个系统，让虚拟“老师”从零开始，用把语言与观念、行为联系起来的方式，教人工智能Agent学语言。

人类父母教孩子学说话，用的就是这种方式。你当时年龄还小，可能已经不太记得作为一个人类学说话的体验：父母向你展示图片，重复文字，并辅以充分的正强化，你就能将这些文字与图片联系起来，最终知道某个东西的名字。

训练完成后，Agent能够正确解读老师的指令了并做出相应的行动了。

非常让百度科学家们振奋的是，这个Agent最终发展出了“执行zero-shot指令”的能力，形成了基本的语法感。“zero-shot”是指没有对这一类别提供训练样本，包括两种情况：1）指令中的词语组合之前从来没有出现过，或者2）指令中包含从其他任务中学到的新物体概念。

也就是说，这个人工智能Agent可以将学到的东西应用于新的环境，这是计算机以前特别不擅长的。以下是百度研究团队对其中的差异给出的解释：

对人类来说，将过去的知识应用在新任务上非常容易，但对于端对端学习机器来说，目前仍然很困难。机器也许知道“火龙果”的样子，但却无法完成“用刀子切开火龙果”这样的任务，除非使用包含这个命令的数据集对其进行训练。相比而言，我们的Agent证明了这种能力，可以将其掌握的关于火龙果的视觉信息以及“用刀子切开某个东西”这个任务成功转化，而不必通过专门的训练让其完成“用刀子切开火龙果”这项任务。

对于人工智能而言，将之前使用过的技能进行泛化有着重大意义。尽管目前还仅限于类似于游戏的简单2D环境，但这种模型的确表明，人工智能系统可以像人类一样学习，并应用已经获得的知识。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2017-03-31，如有侵权请联系 cloudcommunity@tencent.com 删除

人工智能

本文分享自量子位微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

人工智能

登录后参与评论

0 条评论

热度