前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >百度让AI像婴儿一样学语言,还能举一反三听老师指挥走迷宫

百度让AI像婴儿一样学语言,还能举一反三听老师指挥走迷宫

作者头像
量子位
发布2018-03-22 14:42:36
5460
发布2018-03-22 14:42:36
举报
文章被收录于专栏:量子位量子位
李杉 李林 编译整理 量子位 出品 | 公众号 QbitAI

把已经学会的技能用在新的任务上,对于人类来说是很简单的事,但这种“泛化”能力是机器所缺乏的。

百度研究院的一组科学家认为,想实现这种“让机器具有真正的智能、像人一样学习”的目标,关键在于开发一个复杂的语言系统。

百度研究院深度学习组的Haonan Yu、Haichao Zhang和Wei Xu在最近发表的论文中公布了一项重大进展:他们教会了一个虚拟Agent,如何根据“老师”的自然语言指令,在迷宫般的2D环境XWORLD中穿行。Agent每次躲避障碍都能获得奖励。

他们认为,想让机器像人一样学习,首先,需要用监督学习和强化学习结合起来,开发一个系统,让虚拟“老师”从零开始,用把语言与观念、行为联系起来的方式,教人工智能Agent学语言。

人类父母教孩子学说话,用的就是这种方式。你当时年龄还小,可能已经不太记得作为一个人类学说话的体验:父母向你展示图片,重复文字,并辅以充分的正强化,你就能将这些文字与图片联系起来,最终知道某个东西的名字。

训练完成后,Agent能够正确解读老师的指令了并做出相应的行动了。

非常让百度科学家们振奋的是,这个Agent最终发展出了“执行zero-shot指令”的能力,形成了基本的语法感。“zero-shot”是指没有对这一类别提供训练样本,包括两种情况:1)指令中的词语组合之前从来没有出现过,或者2)指令中包含从其他任务中学到的新物体概念。

也就是说,这个人工智能Agent可以将学到的东西应用于新的环境,这是计算机以前特别不擅长的。以下是百度研究团队对其中的差异给出的解释:

对人类来说,将过去的知识应用在新任务上非常容易,但对于端对端学习机器来说,目前仍然很困难。 机器也许知道“火龙果”的样子,但却无法完成“用刀子切开火龙果”这样的任务,除非使用包含这个命令的数据集对其进行训练。 相比而言,我们的Agent证明了这种能力,可以将其掌握的关于火龙果的视觉信息以及“用刀子切开某个东西”这个任务成功转化,而不必通过专门的训练让其完成“用刀子切开火龙果”这项任务。

对于人工智能而言,将之前使用过的技能进行泛化有着重大意义。尽管目前还仅限于类似于游戏的简单2D环境,但这种模型的确表明,人工智能系统可以像人类一样学习,并应用已经获得的知识。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-03-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 李杉 李林 编译整理 量子位 出品 | 公众号 QbitAI
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档