前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >斯坦福2019强化学习课程完结,讲义、PPT、视频已提供下载

斯坦福2019强化学习课程完结,讲义、PPT、视频已提供下载

作者头像
量子位
发布2019-04-22 16:53:05
8260
发布2019-04-22 16:53:05
举报
文章被收录于专栏:量子位量子位
晓查 发自 凹非寺 量子位 出品 | 公众号 QbitAI

斯坦福大学AI课程资源接二连三开始更新。上周NLP课程才结束,这周强化学习(RL)课程也已全部完结。

现在,强化学习课程讲义、PPT可以在官网下载,第一部分的课程已上传至YouTube。

本课程主讲人是斯坦福大学的助理教授Emma Brunskill。她2009年从MIT博士毕业,现在是斯坦福统计机器小组成员,2012年曾入选微软研究院Fellow。

Emma教授的主要研究方向是高风险场景下的强化学习:当获取经验的成本和风险很高时,智能体如何从经验中学习并做出正确的决策。实际应用包括教育软件、医疗决策、机器人等。

课程内容

斯坦福大学今年的RL课程从1月7日开始,每周2节课,共持续10周,到今年3月13日结课。

课程内容主要有:强化学习入门、学习评估策略、函数近似、大空间中的模仿学习、策略搜索、元学习、批量强化学习等等。

Emma教授给学生制定了这些目标:

定义强化学习的关键特征,并将其与非交互式的机器学习区别开来; 确定是否能将实际问题公式化为RL问题,如何定义这类问题,说明哪种算法最适合解决它; 常见RL算法的代码实现; 描述用于分析评估RL算法的标准; 描述探索与开发的挑战,并对比至少两种解决这一挑战的方法。

学完本课程后,你可以用这套标准来衡量自己的学习成果。

所需基础知识

本课程不是面向零基础人士,需要掌握以下知识:

Python:本课程使用numpy、TensorFlow以及Keras 大学微积分和线性代数:理解矩阵向量的运算和符号 概率与统计学:了解概率、高斯分布、期望值、标准差等基础知识 机器学习基础:本课程将定义损失函数,并通过梯度下降算法进行优化

课程资料汇总

最后附上课程全部资源:

课程主页: http://web.stanford.edu/class/cs234/index.html

《强化学习入门》第二版: http://incompleteideas.net/book/the-book-2nd.html

PPT下载地址: http://web.stanford.edu/class/cs234/schedule.html

视频地址: https://www.youtube.com/playlist?list=PLoROMvodv4rOSOPzutgyCTapiGlY2Nd8u

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-04-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 课程内容
  • 所需基础知识
  • 课程资料汇总
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档