MontezumaRevengeNoFrameskip-v4'
https://github.com/openai/random-network-distillation
https://blog.openai.com/reinforcement-learning-with-prediction-based-rewards/
最严强化学习打卡群
本文分享自 CreateAMind 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!