深度强化学习报道
来源自:DeepMind
编辑:DeepRL
完整pdf请看文章末尾
本slide是Namdo de Freitas教授在KHIPU上做强化学习报告的slide, 他于2017年加入DeepMind工作,本文主要涉及了策略梯度、分布式强化学习、PPO、强化学习应用以及Batch强化学习等。
.......
.......
.......
........
......
......
........
.......
.......
.......
GitHub仓库
https://github.com/NeuronDance/DeepRL