课程概述

强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益,主要应用于游戏、机器人、金融等领域。

本课程首先介绍了什么是强化学习,并展示了使用强化学习可以实现的效果;然后结合具体案例分别展示了Q Learning、Sarsa、将Q Learining优势与神经网络结合的DQN、Policy Gradients等算法的原理和实现,一般包含算法更新和思维决策两个环节;最后,

扩展讲解了Actor Critic、DDPG、A3C、PPO/DPPO等强化学习算法。

【课程目标】

了解强化学习

掌握Q Learing、Sarsa、DQN、Policy Gradients等算法的原理

【适用对象】

AI开发者、学生、机器学习研究人员,机器学习以及强化学习的相关人群

【课程大纲】

  • 什么是强化学习Reinforcement Learning:强化学习Reinforcement Learning介绍
  • Q Learning算法概述:要求准备、简单例子、Q Learning算法更新、Q Learning思维决策
  • Sarsa算法概述:Sarsa算法更新、思维决策
  • DQN算法:DQN算法更新、DQN神经网络、DQN思维决策、OpenAI Gym using Tensorflow、Double DQN using Tensorflow、DQN with Prioritised Replay using Tensorflow、Dueling DQN using Tensorflow
  • 其他算法:Actor Critic 演员评论家、DDPG (Deep Deterministic Policy Gradient)、A3C (Asynchronous Advantage Actor-Critic)、PPO/DPPO Proximal Policy Optimization

机构简介

腾讯产业互联网学堂

腾讯云旗下面向云生态用户的一站式学习成长平台

讲师简介

  • 周沫凡
    毕业于澳洲格里菲斯大学工程系。乐于分享深度学习的技能。在自然语言处理,强化学习方面有丰富的学术和行业经验。在腾讯云主要负责智能对话系统的研发。

课程评价(0)

感谢你参加本课程,请你作出评价:
0/300

以下选自学员评价

暂无精选评价