此论文扩展应用:
1 openai RND:https://blog.openai.com/reinforcement-learning-with-prediction-based-rewards/
2 https://sites.google.com/view/polo-mpc https://arxiv.org/abs/1811.01848
https://arxiv.org/abs/1806.03335
本文分享自 CreateAMind 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!