两日公开课:伯克利深度强化学习训练营 | 视频+PPT

千平 发自 凹非寺 量子位 出品 | 公众号 QbitAI

又有新公开课放出~

加州大学伯克利分校的Pieter Abbeel教授,最近联合他的两位博士生Yan (Rocky) Duan、Xi (Peter) Chen,以及现任特斯拉人工智能和Autopilot视觉总监Andrej Karpathy,共同发起了一个两日的深度强化学习训练营。

除此以外,还有来自DeepMind和OpenAI的客座讲师。

强化学习被认为是下一代人工智能系统的驱动力,在模式识别之外带来了更多的进步。例如强化学习让AI学会了玩Atari游戏,帮助AlphaGo在围棋世界称霸。所有这些都依赖于深度神经网络和强化学习之间的协同。

在这个为期两天的训练营里,将通过讲座和动手实验相结合的课程,教授深度强化学习的基础。

这个训练营的主题包括

  • 强化学习基础
  • 策略梯度
  • Actor-Critic算法
  • Q-learning
  • 进化策略
  • 强化学习故障排除和调试策略
  • 当前的研究

组织者希望学过这些课程之后,能帮助你了解相关的基础知识,能从头开始应用最先进的方法,能在rllab上构建高级应用程序,能够将深度强化学习应用在更多的新领域。

课程表

  • Core Lecture 1 Intro to MDPs and Exact Solution Methods — Pieter Abbeel
  • Core Lecture 2 Sample-based Approximations and Fitted Learning — Rocky Duan
  • Core Lecture 3 DQN + Variants — Vlad Mnih
  • Core Lecture 4a Policy Gradients and Actor Critic — Pieter Abbeel
  • Core Lecture 4b Pong from Pixels — Andrej Karpathy
  • Core Lecture 5 Natural Policy Gradients, TRPO, and PPO — John Schulman
  • Core Lecture 6 Nuts and Bolts of Deep RL Experimentation — John Schulman
  • Core Lecture 7 SVG, DDPG, and Stochastic Computation Graphs — John Schulman
  • Core Lecture 8 Derivative-free Methods — Peter Chen
  • Core Lecture 9 Model-based RL — Chelsea Finn
  • Core Lecture 10a Utilities — Pieter Abbeel
  • Core Lecture 10b Inverse RL — Chelsea Finn
  • Frontiers Lecture I: Recent Advances, Frontiers and Future of Deep RL — Vlad Mnih
  • Frontiers Lecture II: Recent Advances, Frontiers and Future of Deep RL — Sergey Levine
  • TAs Research Overviews

以上所有的课程视频和PPT,现在已经全部放出。有兴趣的同学,请前往以下网址学习:

https://sites.google.com/view/deep-rl-bootcamp/lectures

温馨提示:应该需要更科学的上网方式才能访问。

另外,这次的公开课得到了好几家赞助商的支持。其中,钻石赞助商是亚马逊,另外京东是白银赞助商。

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2017-10-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Vamei实验室

为什么说“概率”带来一场现代革命?

作者:Vamei 出处:http://www.cnblogs.com/vamei 严禁转载。

1223
来自专栏灯塔大数据

每个分析师都会遇到的7个面试谜题

现在,想在分析行业里分得一杯羹是非常不容易的事情。约三成的分析公司(特别是顶尖公司)会要求应聘者解决谜题,并借此评估他们的能力。从中他们能够观察出你是否逻辑清...

2889
来自专栏AI科技大本营的专栏

“打脸”世界杯:AI界没有预测比赛的章鱼保罗

即便不是足球迷,你也应该听说过章鱼保罗。2010 年南非世界杯,这条八爪鱼预测的比赛结果 8 猜全中,这一不可思议的神奇预测让它受到了全世界球迷的追捧,并赐封其...

962
来自专栏挖数

论程序员怎么拥有咪蒙的文笔

作为半个程序员的我,是怎么训练我的文笔的呢?今天,我就跟陈独秀一起,分享一些提升文笔的小技巧

1314
来自专栏DT数据侠

如何用数据找到“钱多事少离家近”的工作?

“钱多事少离家近,位高权重责任轻,睡觉睡到自然醒,数钱数到手抽筋”, 这样的工作真的存在吗?快随本文数据侠,一起搜罗吧~

1050
来自专栏深度学习之tensorflow实战篇

R语言自带的数据文件

R语言有大量的样本数据可以直接用来作为数据分析和挖掘案例,可以收藏着以后用! R:datasets >install.packages("datasets")...

76511
来自专栏生信技能树

R语言系列:探索R自带数据包

向量 euro #欧元汇率,长度为11,每个元素都有命名 landmasses #48个陆地的面积,每个都有命名 precip #长度为70的...

1182
来自专栏腾讯高校合作

【犀牛鸟·视野】SIGGRAPH Asia 2017 视觉盛宴精彩回顾

ACM SIGGRAPH Asia 今年是第10届,全球6000名Computer Graphics and Interactive Techniques领域的...

3096
来自专栏SIGAI学习与实践平台

永远的金大侠-人工智能的江湖

金庸先生已离我们远去,笔者当天在朋友圈看到这一消息时心情非常沉痛。作为在小学时就开始读金庸小说的80后,先生给我们的,不仅仅是一个个鲜活的人物,跌宕起伏的故事情...

881
来自专栏SIGAI学习与实践平台

永远的金大侠-人工智能的江湖

金庸先生已离我们远去,笔者当天在朋友圈看到这一消息时心情非常沉痛。作为在小学时就开始读金庸小说的80后,先生给我们的,不仅仅是一个个鲜活的人物,跌宕起伏的故事情...

1753

扫码关注云+社区

领取腾讯云代金券