专栏首页CreateAMind强化学习的 bayes 探索

强化学习的 bayes 探索

此论文扩展应用:

1 openai RND:https://blog.openai.com/reinforcement-learning-with-prediction-based-rewards/

2 https://sites.google.com/view/polo-mpc https://arxiv.org/abs/1811.01848

https://arxiv.org/abs/1806.03335

本文分享自微信公众号 - CreateAMind(createamind)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-12-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Diversity Is All You Need -- paper code

    用户1908973
  • Large Scale Activity Recognition Challenge 大规模人类活动检测比赛介绍

    用户1908973
  • 面试论文:cpc-hrl 很难

    https://github.com/tensorflow/models/tree/master/research/efficient-hrl

    用户1908973
  • GoCN每日新闻(2019-09-23)

    1. 查看 Go 的代码优化过程 http://xargin.com/go-compiler-opt

    landv
  • 前端技术观察第六期 - Chrome 77里有什么新东西给开发者?

    ConardLi
  • 如何成为一名区块链工程师? | 附学习资源

    区块链大本营
  • GoCN每日新闻(2019-09-27)

    1. Golang新版本发布:Go 1.13.1和Go 1.12.10 https://golang.org/dl/

    landv
  • 关于MySQL 8.0的几个重点,都在这里

    在MySQL8.0中重新设计了redo log,主要改进fsync,使得效率更高,减少锁,优化flush机制,不会频繁flush。同时,支持更高用户并发请求。

    [3306 Pai ] 社区
  • CV Code | 本周新出计算机视觉开源代码汇总(含自动驾驶目标检测、医学图像分割、风格迁移、语义分割、目标跟踪等)

    刚刚过去的一周含五一假期,工作日第一天,CV君汇总了过去一周计算机视觉领域新出的开源代码,涉及到自动驾驶目标检测、医学图像分割、风格迁移、神经架构搜索、图卷积神...

    OpenCV学堂
  • CV Code | 本周新出计算机视觉开源代码汇总

    C3F 的开源使得人群计数领域终于有了自己的框架。(开发者就在我们52CV行人群里哦)

    CV君

扫码关注云+社区

领取腾讯云代金券