首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【DeepMind】首发并开源Alchemy,一种元强化学习(meta-RL)基准环境。

元学习作为一种增加强化学习的灵活性和样本效率的方法,科研学者对此的关注兴趣迅速增长。然而,该研究领域中的一个问题是缺乏足够的基准测试任务。通常,过去基准的基础结构要么太简单以至于无法引起兴趣,要么就太不明确了以至于无法进行有原则的分析。在当前的工作中,DeepMind科学家介绍了用于元RL研究的新基准:Alchemy,该基准是将结构丰富性与结构透明性相结合。它是在Unity中实现的3D视频游戏,涉及潜在的因果结构,该过程都经过程序重新采样,从而提供了结构学习,在线推理,假设测试以及基于抽象领域知识的动作排序。并在Alchemy上评估了一对功能强大的RL方法,并对这些方法进行了深入分析。结果清楚地表明,Alchemy作为元RL的挑战性基准提供了验证。

02
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【犀牛鸟·学问】CCF-腾讯犀牛鸟基金线上学术报告—大数据空间下的图性能度量与评估(201902)

    设立CCF-腾讯犀牛鸟基金线上学术报告交流活动,其主要目的是为参与基金项目的青年学者、企业研发专家及项目相关的研究型人才提供一个广泛而专业的学术交流平台。 项目组将定期邀请学界学者与企业研发专家举行在线或线下学术研讨会,讨论专项研究课题,分享最新的研究及实践成果。 基金期待大家在这个平台上自由地进行分享,理性地进行讨论,从而碰撞出更为闪耀的学术火花。通过丰富的学术与思想交流,基金期待更好地助力参与者在产学研合作过程中拓宽学术视野,提升实践能力,为科技自主研发的探索和创新储备能量。 报告时间:2019年

    03
    领券