专栏首页新智元UC 伯克利为 AI 植入好奇心,探索能力超过 AlphaGo 蒙特卡洛树搜索

UC 伯克利为 AI 植入好奇心,探索能力超过 AlphaGo 蒙特卡洛树搜索

【新智元导读】加州大学 UC 伯克利分校的一队研究者在他们的 AI 系统中嵌入了一种能力,能让系统在即使没有短期结果驱动的情况下,也会采取行动。这与 AlphaGo 采用的蒙特卡洛树搜索的方法不同,有可能避免 AI 只追求一系列短期结果,而产生长期的、整体上的不良结果。研究给出了视频,展示了他们的研究成果。

粽情 AI,新智元祝读者端午安康!

很少有人在玩儿游戏的时候——比如说超级玛丽吧——会一口气跑到关底。你总会这里看看,那里顶顶,找找隐藏的钱或蘑菇。现在,研究人员已经开始尝试把这种好奇心植入 AI 系统。

加州大学 UC 伯克利分校的一队研究者在他们的 AI 系统中嵌入了一种能力,能让系统在即使没有短期结果驱动的情况下,也会采取行动。比如说,谷歌的 AlphaGo 采用了蒙特卡洛树搜索的方法。这意味着它是从经验中学习的,这种经验是指,如果 AlphaGo 采取了某一特定行动,那么对手最可能的下一步是什么。根据可能产生的结果,每个可能的移动都被从最优到最差打了分。这样,AI 每轮会选择最好的一步。你用正向激励训练狗时也是用的类似方法。问题是,这也会让 AI 的思维变得非常狭窄。

永远选择最好的可能结果,AI 会追求一系列有短期收益的行动,即使从长期来看整体上会有不好的结果也在所不惜。相反,UC 伯克利的 AI 似乎采取了随机行动,努力在探索其他的可能性。这解释起来有点难,研究人员把它描述为“通过自监督逆动力学模型在可见特征空间里预测自我行动产生结果的能力中的错误”(the error in an agent‘s ability to predict the consequence of its own actions in a visual feature space learned by a self-supervised inverse dynamics model)。

视频内容

为了训练 AI,研究团队教它玩超级玛丽和 VizDoom(一个基于游戏毁灭战士的AI 训练和研究平台)。一个标准的 AI 每次的玩法会一模一样,因为它在每一步都会追求价值的最大化。然而,UC 伯克利的 AI 玩儿得更像人,在游戏中总是尝试探索更广阔的可能性。

这一研究指出:“在许多真实世界的场景中,能够给智能体的外在奖励真的是太稀疏了,或者整体上是缺失的。这种情况下,好奇心就扮演着内在奖励的角色,能够使智能体去探索环境,学习未来可能会用到的技能。”

这听上去似乎不是特别有用,但它实际上暗示了巨大的可能性。未来,这种训练方法可能帮助 AI 系统更自然的学习,从探索中获得技巧,以备不时之需。

原文地址:http://www.indiatimes.com/technology/news/uc-berkeley-researchers-have-built-human-like-curiosity-into-an-artificial-intelligence-system-322386.html

本文分享自微信公众号 - 新智元(AI_era)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-05-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 马库斯批判Hinton、吴恩达、LeCun等三大神煽风点火!指媒体炒作将再引发AI寒冬

    “过度的宣传和错误的信息将导致AI寒冬再来”,纽约大学心理学与认知科学教授、畅销书作家加里 · 马库斯 (Gary Marcus) 最近在The Gradien...

    新智元
  • 【新智元100】7 张图看懂美国人工智能产业

    【新智元导读】本文是O‘reilly的报告《 美国人工智能新市场》的作者Aman Naimat针对报告所写的解读文章。通过数据分析的方法,Aman 对美国人工智...

    新智元
  • 【未来5年AI应用报告】谷歌、DeepMind、英伟达科学家支招企业AI应用(24P)

    来源: reworkco 编辑部 【新智元导读】 ReWork的一份最新AI落地应用报告,阐述了企业该如何使用AI技术。谷歌的Ian GoodFellow、De...

    新智元
  • TMD后,下一波超级巨头会出现在什么赛道?答案是……

    中国互联网已有二十年历史。这二十年间,互联网市场格局不断变化,先是三大门户(新浪、网易和搜狐)形成“三座大山”,接着BAT崛起成为“新三座大山”,再接着三小巨头...

    罗超频道
  • 为什么AI人才这么贵、需求这么迫切?

    用户1737318
  • 有电脑病毒就会有杀毒软件!李开复和MIT彭特兰这样看AI挑战

    近日,创新工场董事长兼CEO李开复博士与阿莱克斯·彭特兰教授(Alex Pentland)展开了一场”AI如何重塑人类社会”的精彩对话。

    量子位
  • AI生态赋能2018论坛来袭!转型AI看这里!

    用户1737318
  • AI浪潮下的技能转型,你准备好了吗?

    用户1737318
  • 全新DPU处理器三年算力跨千倍,你的AI还能跟上么?

    第二波驱动力来自乔布斯的智能手机和4G,今天全球已有30多亿人通过多点触摸的方式连上了移动互联网。

    新智元
  • 速成班出来的AI人才,老板到底要不要?6位导师告诉你行业真相

    用户1737318

扫码关注云+社区

领取腾讯云代金券