专栏首页CreateAMind强化学习教程3 规划中的动态编程

强化学习教程3 规划中的动态编程

Video-lectures available https://www.youtube.com/watch?v=2pWv7GOvuf0

Lecture 1: Introduction to Reinforcement Learning

Lecture 2: Markov Decision Processes

Lecture 3: Planning by Dynamic Programming

Lecture 4: Model-Free Prediction

Lecture 5: Model-Free Control

Lecture 6: Value Function Approximation

Lecture 7: Policy Gradient Methods

Lecture 8: Integrating Learning and Planning

Lecture 9: Exploration and Exploitation

Lecture 10: Case Study: RL in Classic Games



本文分享自微信公众号 - CreateAMind(createamind),作者:David Silver

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2016-10-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 强化学习优质教程1

    Lecture 1: Introduction to Reinforcement Learning

    用户1908973
  • 强化学习优质教程2 有视频

    Lecture 1: Introduction to Reinforcement Learning

    用户1908973
  • 强化学习优质教程2 马尔可夫决策过程 有视频

    Video-lectures available https://www.youtube.com/watch?v=2pWv7GOvuf0

    用户1908973
  • 强化学习优质教程1

    Lecture 1: Introduction to Reinforcement Learning

    用户1908973
  • 强化学习优质教程2 有视频

    Lecture 1: Introduction to Reinforcement Learning

    用户1908973
  • 强化学习优质教程2 马尔可夫决策过程 有视频

    Video-lectures available https://www.youtube.com/watch?v=2pWv7GOvuf0

    用户1908973
  • 强化学习教程4: Model-Free Prediction

    Video-lectures available https://www.youtube.com/watch?v=2pWv7GOvuf0

    用户1908973
  • 斯坦福系列课程:教你用CNN进行视觉识别(全部视频放出)

    允中 发自 稻香湖 量子位 报道 | 公众号 QbitAI ? 又有新的学习资源放出了。 这次是来自斯坦福大学工程学院的课程:Convolutional Neu...

    量子位
  • 伯克利新课:深度无监督学习视频+PPT+100篇讲师精选论文

    值此元宵佳节之际,新智元首选祝大家元宵快乐!今天全国各地普降雨雪,大家注意保暖、带伞。

    新智元
  • 资源 | 斯坦福课程:深度学习理论

    用户1737318

扫码关注云+社区

领取腾讯云代金券