百度让AI像婴儿一样学语言,还能举一反三听老师指挥走迷宫

李杉 李林 编译整理 量子位 出品 | 公众号 QbitAI

把已经学会的技能用在新的任务上,对于人类来说是很简单的事,但这种“泛化”能力是机器所缺乏的。

百度研究院的一组科学家认为,想实现这种“让机器具有真正的智能、像人一样学习”的目标,关键在于开发一个复杂的语言系统。

百度研究院深度学习组的Haonan Yu、Haichao Zhang和Wei Xu在最近发表的论文中公布了一项重大进展:他们教会了一个虚拟Agent,如何根据“老师”的自然语言指令,在迷宫般的2D环境XWORLD中穿行。Agent每次躲避障碍都能获得奖励。

他们认为,想让机器像人一样学习,首先,需要用监督学习和强化学习结合起来,开发一个系统,让虚拟“老师”从零开始,用把语言与观念、行为联系起来的方式,教人工智能Agent学语言。

人类父母教孩子学说话,用的就是这种方式。你当时年龄还小,可能已经不太记得作为一个人类学说话的体验:父母向你展示图片,重复文字,并辅以充分的正强化,你就能将这些文字与图片联系起来,最终知道某个东西的名字。

训练完成后,Agent能够正确解读老师的指令了并做出相应的行动了。

非常让百度科学家们振奋的是,这个Agent最终发展出了“执行zero-shot指令”的能力,形成了基本的语法感。“zero-shot”是指没有对这一类别提供训练样本,包括两种情况:1)指令中的词语组合之前从来没有出现过,或者2)指令中包含从其他任务中学到的新物体概念。

也就是说,这个人工智能Agent可以将学到的东西应用于新的环境,这是计算机以前特别不擅长的。以下是百度研究团队对其中的差异给出的解释:

对人类来说,将过去的知识应用在新任务上非常容易,但对于端对端学习机器来说,目前仍然很困难。 机器也许知道“火龙果”的样子,但却无法完成“用刀子切开火龙果”这样的任务,除非使用包含这个命令的数据集对其进行训练。 相比而言,我们的Agent证明了这种能力,可以将其掌握的关于火龙果的视觉信息以及“用刀子切开某个东西”这个任务成功转化,而不必通过专门的训练让其完成“用刀子切开火龙果”这项任务。

对于人工智能而言,将之前使用过的技能进行泛化有着重大意义。尽管目前还仅限于类似于游戏的简单2D环境,但这种模型的确表明,人工智能系统可以像人类一样学习,并应用已经获得的知识。

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2017-03-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏phodal

我是如何为技术博客设计一个推荐系统(上):统计与评分加权

过去的两周里,我一直忙于为 『玩点什么』 设计一个推荐系统。在这个过程中,参考几本书籍,查找了一系列的资料。想着这些资料上,大部分都是大同小异的,实现了几个简单...

41660
来自专栏人人都是极客

助力边缘计算,Arm机器学习处理器来了!

如果能够拥有一部智能个人助理,它能听懂我们说的话并做出智能反应,然后处理日常任务,那感觉一定很棒。鉴于机器学习 (ML) 领域近期取得的进展,Arm相信这一天很...

21220
来自专栏PPV课数据科学社区

【翻译】数据科学的多语言协作编程方式:Python + R + SQL

在这篇文章中,我将试图使用一种新的方法来介绍数据科学编程。 R vs. Python question中集中谈论了数据科学编程的问题,每个人都...

33540
来自专栏PPV课数据科学社区

【学习】干货收藏:如何进行大数据分析及处理?

众所周知,大数据已经不简简单单是数据大的事实了,而最重要的现实是对大数据进行分析,只有通过分析才能获取很多智能的,深入的,有价值的信息。 那么越来越多的应用涉及...

89760
来自专栏机器之心

资源 | GitHub上的五大开源机器学习项目

42970
来自专栏PPV课数据科学社区

2017年最全的数据科学学习计划(完结篇)

注: 在PPV课微信公众号回复“数据科学计划”获取PDF全文,内附学习资料网址推荐,让学习直达源头,不用找度娘更省心! 本文为2017年最全的数据科学学习计划(...

422110
来自专栏ATYUN订阅号

【学术】不友好的天空:使用数据预测航班取消率-第1部分

这是本系列文章中的第一部分,我们将探索一个用例和几个不同的机器学习平台,看看我们如何构建一个模型,一个可以帮助预测航班取消的平台。在第一部分中,我们将讨论用例,...

378120
来自专栏AI科技大本营的专栏

Google VS 亚马逊 VS 微软,机器学习服务选谁好?

译者 | reason_W 编辑 | Just 对大多数企业来说,机器学习听起来就像航天技术一样,属于花费不菲又“高大上”的技术。如果你是想构建一个 Netfl...

31750
来自专栏木东居士的专栏

闲谈大数据和算法

20020
来自专栏AI科技评论

开发 | Twitter客户支持数据集公布:来自大企业的超百万条推文与回复

AI科技评论消息,近日,Kaggle平台上公布了Twitter客户支持数据集,这个数据集包括来自大企业的超百万条推文与回复,大家可以利用这个数据集做很多有意思的...

42750

扫码关注云+社区

领取腾讯云代金券