强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益,主要应用于游戏、机器人、金融等领域。
本课程首先介绍了什么是强化学习,并展示了使用强化学习可以实现的效果;然后结合具体案例分别展示了Q Learning、Sarsa、将Q Learining优势与神经网络结合的DQN、Policy Gradients等算法的原理和实现,一般包含算法更新和思维决策两个环节;最后,
扩展讲解了Actor Critic、DDPG、A3C、PPO/DPPO等强化学习算法。
【课程目标】
了解强化学习
掌握Q Learing、Sarsa、DQN、Policy Gradients等算法的原理
【适用对象】
AI开发者、学生、机器学习研究人员,机器学习以及强化学习的相关人群
【课程大纲】
腾讯云旗下面向云生态用户的一站式学习成长平台
课程学习交流
请扫码关注腾讯产业互联网学堂微信公众号