资源 | 台大李宏毅教授最新课程,深度强化学习有国语版啦!

大数据文摘出品

入坑深度学习的同学肯定都听过台湾大学的李宏毅教授,或者是他那本非常受欢迎的课程——《1天搞懂深度学习》。这门课程的讲义PPT总共有286页,深入浅出的介绍了深度学习的概念、框架及展望。

课程内容通俗易懂,适合深度学习初学者及相关从业人员,在大数据文摘后台回复“深度学习”可下载课程讲义。

文摘菌今天要给大家推荐的是李老师最近更新的课程:深度强化学习(deep reinforcement learning),目前这门课程在youtobe上更新了4个视频,分别是策略梯度算法(Policy Gradient)、近端策略优化(Proximal Policy Optimization,PPO)、Q-learning算法基本概念和Q-learning算法高级技巧。

每个视频大约40分钟左右,PPT内容为英文,讲授语言为中文。课程内容主打强化学习,涉及理论和论文解读,需要一定的强化学习的基础,感兴趣的小伙伴可以学起来啦!

深度强化学习youtube链接:

https://www.youtube.com/watch?v=z95ZYgPgXOY

深度强化学习B站链接:

http://www.bilibili.com/video/av24724071

文摘菌对视频内容做了简单介绍,供大家参考。

策略梯度算法:

  • 策略梯度算法理论
  • 算法实现
  • 实用建议

近端策略优化:

  • 采样问题
  • PPO算法理论
  • 对论文结果的解读

Q-learning算法基本概念:

  • 蒙特卡洛方法
  • Actor-Critic算法
  • Q-learning理论

Q-learning算法高级技巧:

  • Double DQN
  • Dueling DQN
  • 高级技巧

目前课程在连载状态,感兴趣的同学可以关注李宏毅的youtube主页:

https://www.youtube.com/channel/UC2ggjtuuWvxrHHHiaDH1dlQ/videos

此外,李老师在youtube还有《机器学习》和《深度学习》两门课程的视频讲解,这两门课程也获得了不错的口碑,课程链接如下:

机器学习youtube链接:

https://www.youtube.com/watch?v=CXgbekl66jc&list=PLJV_el3uVTsPy9oCRY30oBPNLCo89yu49

机器学习B站链接:

http://www.bilibili.com/video/av19144978

深度学习youtube链接:

https://www.youtube.com/watch?v=KKT2VkTdFyc

深度学习B站链接:

http://www.bilibili.com/video/av20961661

李宏毅老师简介:主要研究领域为机器学习(特别是深度学习)、口语语义理解和语音识别。

  • 2012年从台北 National Taiwan University (NTU) 博士毕业。
  • 2012年9月—2013年8月,在 Sinica Academia 的 Research Center for Information Technology Innovation 做博士后。
  • 2013年9月—2014年7月,在 MIT Computer Science and ArtificialIntelligence Laboratory (CSAIL) 的 Spoken Language Systems Group 做访问学者。
  • 现任 Department of Electrical Engineering of National TaiwanUniversity 副教授。

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2018-06-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器学习之旅

Kaggle&TianChi分类问题相关算法快速实现导读理论解析如何设计一个Stacking|Ensemble的模型?案例复现

17/12/30-update :很多朋友私密我想要代码,甚至利用金钱诱惑我,好吧,我沦陷了。因为原始代码涉及到公司的特征工程及一些利益trick,所以我构造了...

1202
来自专栏深度学习与数据挖掘实战

【AI头条&优质资源】中国AI生态报告,崛起的5大因素是?

《如何评价 DeepMind 新提出的关系网络(Relation Network)?》

572
来自专栏大数据文摘

科技网红Siraj最新油管视频:如何用4分钟搭建神经网络

1688
来自专栏量子位

传送门!ICML2017(国际机器学习大会)最佳论文(附下载)

允中 整理编译 量子位 报道 | 公众号 QbitAI ? 8月6日,第34届国际机器学习大会(ICML 2017)已在悉尼拉开帷幕。 其中最受关注的论文奖项已...

39514
来自专栏AI科技大本营的专栏

AI 技术讲座精选:数学不好,也可以学好人工智能(五)——深度学习和卷积神经网络

【AI100 导读】欢迎阅读《数学不好,也可以学好人工智能》系列的第五篇文章。如果你错过了之前的四部分,一定记得把它们找出来看一下!本文主要介绍了深度学习架构—...

36210
来自专栏AI科技大本营的专栏

资源 | 2017深度学习优秀论文盘点(建议收藏)

本文是伦敦帝国学院博士生Pierre Richemond所写的年度深度学习论文盘点,他属于该大学的BICV计算机视觉团队。这些论文在他们每周的Imperial ...

37111
来自专栏量子位

轻叩次元壁——谈谈真人头像的漫画化

在这篇自带萌点的文章中,作者提出了一种新型模型TwinGAN,可以将真人头像转化成漫画风的卡通头像。打通二次元和三次元的世界的方法,都在这里面了~

902
来自专栏人工智能头条

Top 50机器学习项目实战总结

1932
来自专栏钱塘大数据

【干货】2018年深度学习必读的31篇论文,赶紧收藏!

Kloud Strife在其博客上盘点了今年最值得关注的有关深度学习的论文,包括架构/模型、生成模型、强化学习、SGD & 优化及理论等各个方面,有些论文名扬四...

1933
来自专栏人人都是极客

自动驾驶中的时空坐标系

下面我们介绍自动驾驶技术中几种常用的坐标系统,以及他们之间如何完成关联和转换,最终构建出统一的环境模型。 所谓时空坐标系,包括三维空间坐标系和一维时间坐标系。在...

6017

扫码关注云+社区