资源 | 台大李宏毅教授最新课程,深度强化学习有国语版啦!

大数据文摘出品

入坑深度学习的同学肯定都听过台湾大学的李宏毅教授,或者是他那本非常受欢迎的课程——《1天搞懂深度学习》。这门课程的讲义PPT总共有286页,深入浅出的介绍了深度学习的概念、框架及展望。

课程内容通俗易懂,适合深度学习初学者及相关从业人员,在大数据文摘后台回复“深度学习”可下载课程讲义。

文摘菌今天要给大家推荐的是李老师最近更新的课程:深度强化学习(deep reinforcement learning),目前这门课程在youtobe上更新了4个视频,分别是策略梯度算法(Policy Gradient)、近端策略优化(Proximal Policy Optimization,PPO)、Q-learning算法基本概念和Q-learning算法高级技巧。

每个视频大约40分钟左右,PPT内容为英文,讲授语言为中文。课程内容主打强化学习,涉及理论和论文解读,需要一定的强化学习的基础,感兴趣的小伙伴可以学起来啦!

深度强化学习youtube链接:

https://www.youtube.com/watch?v=z95ZYgPgXOY

深度强化学习B站链接:

http://www.bilibili.com/video/av24724071

文摘菌对视频内容做了简单介绍,供大家参考。

策略梯度算法:

  • 策略梯度算法理论
  • 算法实现
  • 实用建议

近端策略优化:

  • 采样问题
  • PPO算法理论
  • 对论文结果的解读

Q-learning算法基本概念:

  • 蒙特卡洛方法
  • Actor-Critic算法
  • Q-learning理论

Q-learning算法高级技巧:

  • Double DQN
  • Dueling DQN
  • 高级技巧

目前课程在连载状态,感兴趣的同学可以关注李宏毅的youtube主页:

https://www.youtube.com/channel/UC2ggjtuuWvxrHHHiaDH1dlQ/videos

此外,李老师在youtube还有《机器学习》和《深度学习》两门课程的视频讲解,这两门课程也获得了不错的口碑,课程链接如下:

机器学习youtube链接:

https://www.youtube.com/watch?v=CXgbekl66jc&list=PLJV_el3uVTsPy9oCRY30oBPNLCo89yu49

机器学习B站链接:

http://www.bilibili.com/video/av19144978

深度学习youtube链接:

https://www.youtube.com/watch?v=KKT2VkTdFyc

深度学习B站链接:

http://www.bilibili.com/video/av20961661

李宏毅老师简介:主要研究领域为机器学习(特别是深度学习)、口语语义理解和语音识别。

  • 2012年从台北 National Taiwan University (NTU) 博士毕业。
  • 2012年9月—2013年8月,在 Sinica Academia 的 Research Center for Information Technology Innovation 做博士后。
  • 2013年9月—2014年7月,在 MIT Computer Science and ArtificialIntelligence Laboratory (CSAIL) 的 Spoken Language Systems Group 做访问学者。
  • 现任 Department of Electrical Engineering of National TaiwanUniversity 副教授。

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2018-06-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

Caffe2推出强化学习库,包含多个基于Caffe2的RL实现

安妮 编译自 Caffe2.ai 量子位 出品 | 公众号 QbitAI 今年4月,Facebook正式发布了轻量化和模块化的深度学习框架Caffe2。将近5个...

3227
来自专栏AI研习社

AI 玩微信跳一跳的正确姿势——跳一跳 Auto-Jump 算法详解

最近,微信小游戏跳一跳可以说是火遍了全国,从小孩子到大孩子仿佛每一个人都在刷跳一跳,作为无(zhi)所(hui)不(ban)能(zhuan)的 AI 程序员,我...

3608
来自专栏机器之心

NIPS 2018 | MIT等提出NS-VQA:结合深度学习与符号推理的视觉问答

作者:Kexin Yi、Jiajun Wu、Chuang Gan、Antonio Torralba、Pushmeet Kohli、Joshua B. Tenen...

622
来自专栏PPV课数据科学社区

【学习】详解数据挖掘十大经典算法!

国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖...

3457
来自专栏程序员宝库

AI 玩微信小游戏跳一跳的正确姿势,Auto-Jump 算法详解

来源:肖泰洪 + 安捷 链接:zhuanlan.zhihu.com/p/32636329 ? 最近,微信小游戏跳一跳可以说是火遍了全国,从小孩子到大孩子仿佛每...

3295
来自专栏新智元

【重磅】谷歌推出 Wide Deep Learning,开源 TensorFlow API

【新智元导读】今天(美国加州当地时间29日),资深软件工程师 Heng-Tze Cheng 在 Google Research 发表博文,宣布谷歌研究所最新推出...

4185
来自专栏机器之心

TensorFlow发布面向JavaScript开发者的机器学习框架TensorFlow.js

机器之心报道 参与:机器之心编辑部 当时时间 3 月 30 日,谷歌 TenosrFlow 开发者峰会 2018 在美国加州石景山开幕,来自全球的机器学习用户围...

37512
来自专栏一心无二用,本人只专注于基础图像算法的实现与优化。

一年去雾算法研究的总结。

  从最开始的Crimm Imageshop中最简单的去雾功能开始,到前不久为止研究的诸多去雾算法,再到近日和一些朋友的关于去雾经验的交流,感觉自己对这个方面的...

18910
来自专栏机器之心

教程 | AI玩微信跳一跳的正确姿势:跳一跳Auto-Jump算法详解

37011
来自专栏WOLFRAM

木星切片剪影:JunoCam 图像处理

911

扫码关注云+社区