论文 | 百度「一次包会」模型:「一次性」教会Agent认新事物

百度 Research 在近日发表了一篇博文,介绍了通过交互式对话来教 AI 智能体学会语言和一次性实现主动概念学习的方法。

AI 科技评论按:打造能够通过语言与人类自然交流并向人类学习的智能体,对 AI 科技的进步而言价值重大。百度 Research 研究人员的目标就是,开发能够通过自然交互来向人类学习的 AI 智能体。

在雷锋网旗下学术频道 AI 科技评论的数据库项目「AI影响因子」中,凭借百度 PaddlePaddle 开源平台负责人王益专访百度数据可视化实验室的成立NLP 团队在微软 MARCO 阅读理解数据集上的突出表现、被ACL 2018 接收的论文「Interactive Language Acquisition with One-shot Visual Concept Learning through a Conversational Game」,排在「AI影响因子」前列。

百度曾在去年的 6 月份发表过一篇「Learning to Speak via Interaction」,该方法教 AI 智能体如何通过与一位虚拟老师的互动来学习说话。在一项最新的研究中,百度重点关注了虚拟老师与 AI 智能体之间的对话互动,这种互动既可以作为语言学习的自然途径,也可以作为学习新的知识的自然途径。百度提出的联合仿真和强化方法可以通过一个对话互动游戏,来训练 AI 智能体学习接地气的语言和进行快速概念学习。

用该方法训练的 AI 智能体可以提问关于新事物的问题以主动获得信息,并在随后的对话中使用刚刚学到的知识;这个学习过程是单样本学习的。AI 智能体的「主动」体现在,它能够主动向老师问关于未知事物的信息,与此形成对比的是目前大多数的 AI 智能体范例还只能被动地学习预先收集好的标签数据。「一次性」意味着,在部署之后,被老师教会过一次的 AI 智能体就可以在无需进一步训练的情况下,学会识别一个此前从未见过的事物并且还将能正确地回答老师针对该新事物提出的相关问题。

为了教会智能体认知新事物,百度在虚拟环境中搭建了一位老师来同 AI 智能体交谈。该虚拟环境与老师的设计灵感来自人类如何教婴儿学习语言和认知新事物的经历。在每一节课程的开头,虚拟老师会随机选择一个事物来与学生(AI 智能体)互动,并针对这个事物随机提出一个问题(如「它是什么」),然后保持沉默或者给出一个陈述语句(如「它是猴子」)。随后,老师将根据学生的回答来做出相应行为,要么回答智能体提出的问题,要么转向下一个随机事物再继续。老师也会依据 AI 智能体回答的适当程度提供给它一个鼓励或者不鼓励的奖励信号,例如,AI 智能体问关于新事物的信息的时候,或者在仅仅教了一次之后就能正确回答问题到时候,AI 智能体都会收到激励信号。

百度的该 AI 智能体始于新生儿般的白纸状态。它必须学会破解语言的奥秘并理解原始视觉和语言信号。AI 智能体只会通过与老师交流来评估自己的知识状态和记住有用的信息,与老师的交流包括听,冒泡,通过模仿进行学习以及通过老师的激励进行强化学习。经过最初的训练后,AI 智能体无需进一步的任何训练就能成功地将成熟的语言和「一次性」概念认知能力迁移至新的测试场景。

例如,经过动物数据集的训练后的 AI 智能体,在面对属于此前它从未见过的事物类别的一张樱桃图片时,AI 智能体能够问提问「它是什么」并且只需要被教会一次「这是樱桃」,在面对新的一张樱桃图像的时候也能正确回答其中是樱桃。

百度的下一步目标是进一步增加该语言学习任务的复杂性和多样性,以及研究该方法在其他相关任务上的应用和普遍性。该教学环境在百度自己的开源引擎 XWorld 模拟环境上运行,模型训练则在 PaddlePaddle 深度学习平台上完成的。更多细节,大家可以前往查看这篇 ACL 2018 的接收论文 https://arxiv.org/abs/1805.00462。

via 百度 Research,AI科技评论编译。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2018-05-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

人物 | Yann LeCun:让Facebook学会思考的人

选自BuzzFeed 作者:Alex Kantrowitz 机器之心编译 Yann LeCun 是深度学习研究领域内一个响当当的名字。作为 Faceboo...

2769
来自专栏AI科技大本营的专栏

程序员如何开启机器学习之路?我也遇到过这个问题

学习机器学习,但无从下手怎么办?尝试过各种学习方法,为什么依然是个门外汉?为什么传统的学习机器学习的途径收效甚慢? 作为一名对机器学习心有向往的程序员,我该以什...

3075
来自专栏AI科技评论

从 Google Trends,看各大深度学习框架使用热度

AI 科技评论按:随着深度学习在计算机视觉、自然语言处理等领域取得的成果越来越显著,对深度学习的讨论越来越多。作为当下最热门的话题,从 2015 年至今,短短三...

882
来自专栏SDNLAB

云计算的三大挑战:安全性、合规性和成本控制

在Fugue公司最新发布的针对300多名IT运营人员、高管和开发人员的调查中发现,大多数受访者认为由于合规性和安全问题、预期之外的下游成本以及云计算管理工具的过...

3654
来自专栏新智元

Facebook AI 野心与LeCun的小目标:拥有类人智能的对话助理

【新智元导读】 不同于以往的“深度好文”,这篇描写 Facebook AI发展的文章不仅仅聚焦在机器学习技术,更多地强调各种先进的机器学习模型与Faceboo...

2836
来自专栏新智元

谷歌趋势:人工智能首超大数据,深度学习关注度上升最快

【新智元导读】 KDnugget 在谷歌趋势(Google Trends)上对比了几个相关关键词的关注度,对大数据、机器学习、人工智能、数据科学和深度学习进行排...

4996
来自专栏数据科学与人工智能

【机器学习】机器学习正在五个方面重塑我们的世界

机器学习的技术越来越成熟,与大数据结合在一起为我们的世界带来了巨大的变化。对此,大数据专家Bernard Marr总结了机器学习在听、说、读、写、看五个方面如何...

2408
来自专栏智能算法

“忘掉大数据”之“建模术”:数据挖掘还原用户的生活场景

建模无疑是大数据里面最艺术的部分,也是最令大数据从业者痴迷、得意的领域,一个好的模型就是一篇作品,是一首诗,令人心旷神怡。建模、模型并不是什么新鲜事...

3466
来自专栏腾讯技术工程官方号的专栏

游戏AI探索之旅:从AlphaGo到MOBA游戏

3K6
来自专栏企鹅号快讯

深度学习软件开放平台TensorFlow可以用来做什么

文/腾讯《一线》薛芳 1月19号在北京开幕的极客公园创新者大会上。Google Brain首席工程师陈智峰发表了《寻找答案从定义问题开始——TensorFlow...

22510

扫码关注云+社区

领取腾讯云代金券