深度强化学习-Report
来源:icml2019 conference
编辑:DeepRL
强化学习是一种通用的学习、预测和决策范式。RL为顺序决策问题提供了解决方法,并将其转化为顺序决策问题。RL与优化、统计学、博弈论、因果推理、序贯实验等有着深刻的联系,与近似动态规划和最优控制有着很大的重叠,在科学、工程和艺术领域有着广泛的应用。
RL最近在学术界取得了稳定的进展,如Atari游戏、AlphaGo、VisuoMotor机器人政策。RL也被应用于现实场景,如推荐系统和神经架构搜索。请参阅有关RL应用程序的最新集合。希望RL系统能够在现实世界中工作,并具有实际的好处。然而,RL存在着许多问题,如泛化、样本效率、勘探与开发困境等。因此,RL远未被广泛部署。对于RL社区来说,常见的、关键的和紧迫的问题是:RL是否有广泛的部署?问题是什么?如何解决这些问题?
在国际会议上的机器学习(ICML)是一个国际学术会议上机器学习。它是机器学习和人工智能研究中高影响力的两个主要会议之一。每年的ICML中都有大量的关于强化学习的文章,其中2019总共接收强化学习论文46篇(已经是很高比例了,快接近10%),下面是本次会议文章的总结,文章pdf版本汇总下载链接见文章末尾。
注:部分文章还没有在arxiv上,或者没有的请自行Google