前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >用自然语言指导强化学习agent打游戏,这是斯坦福的最新研究

用自然语言指导强化学习agent打游戏,这是斯坦福的最新研究

作者头像
量子位
发布2018-03-30 17:49:11
9110
发布2018-03-30 17:49:11
举报
文章被收录于专栏:量子位量子位
问耕 编译整理 量子位 报道 | 公众号 QbitAI

斯坦福大学计算机科学系的三位学者,在近日发表的论文中,介绍了一个打Atari游戏的深度强化学习agent,不同之处是,这个agent听从自然语言的指导。

人类的学习,不是处在真空隔离、毫无互动的状态中,相反我们生活在一个复杂的因果世界。在人类的学习中,会得到来自他人的自然语言指导。

基于上述想法,斯坦福的三位学者想要探索能够接受自然语言指令的人工智能agent,而他们选择的试验场景还是Atari游戏世界。

视频内容

整个过程分为两个阶段。

第一阶段,agent学习英语指令的意义,以及在游戏中的映射关系。第二阶段,agent基于已经学会理解的指令开始探索环境,并且学习需要什么操作来满足给定的指令。

这篇论文表示,他们训练出来的agent,表现优于Deep-Q Networks(DQN)和A3C训练出来的agent,也超过OpenAI Gym上的最佳agent。

他们所使用的游戏,是Atari 2600中难度很高的一款:蒙特祖玛的复仇。

所有详细的内容,请直接查看斯坦福论文。获取论文地址,请在量子位微信公众号(ID:QbitAI)对话界面,回复:“复仇”两个字即可。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-04-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 问耕 编译整理 量子位 报道 | 公众号 QbitAI
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档