DeepMind推出深度学习与强化学习进阶课程(附视频)

机器之心报道

参与:张倩、李泽南

OpenAI 推出强化学习课程 Spinning Up 后不久。昨天,DeepMind 与 UCL 合作推出了一门深度学习与强化学习进阶课程,以在线视频形式呈现。该课程共有 18 节课,每节课都长达 1 小时 40 分钟,内容从深度学习框架 TensoFlow 的介绍到构建游戏智能体,可谓全面。

课程地址:https://www.youtube.com/playlist?list=PLqYmG7hTraZDNJre23vqCGIVpfZ_K2RZs

该课程最初在伦敦大学学院(UCL)进行,为方便在线观看进行了录像。多位 DeepMind 的研究人员、UCL 教师参与了课程的设计。

参与课程制作的 DeepMind/UCL 团队

课程由两部分组成,一是包含深度神经网络的机器学习,二是利用强化学习进行预测和控制,两个部分相互穿插。在探讨深度学习的过程中,这两条线交汇在一起,其中的深度神经网络被训练为强化学习背景下的函数逼近器。

课程中的深度学习部分首先介绍了神经网络及使用 TensorFlow 的监督学习,接下来探讨了卷积神经网络、循环神经网络、端到端及基于能量的学习、优化方法、无监督学习、注意力及记忆。涉及的应用领域包括目标识别和自然语言处理。

第一课视频截图

深度强化学习部分介绍了马尔科夫决策过程、动态规划、无模型预测与控制、值函数近似、策略梯度方法、学习与规划整合、探索/利用困境等。涉及的应用领域包括学习玩经典棋盘游戏或电子游戏等。

第一课视频:

从第一课来看,本课程将讲解 DeepMind 的 AI 方法,深度强化学习在雅达利、AIphaGo 等游戏中的应用。

课程目录

深度学习 1:基于机器学习的人工智能简介

深度学习 2:TensorFlow 简介

深度学习 3:神经网络基础

强化学习 1:强化学习简介

强化学习 2:探索和利用

强化学习 3:马尔科夫决策过程及动态规划

强化学习 4:无模型预测与控制

深度学习 4:图像识别之外、端到端学习、嵌入

强化学习 5:函数逼近及深度强化学习

强化学习 6:策略梯度及 Actor Critic 算法

深度学习 5:用于机器学习的优化

强化学习 7:规划与模型

深度学习 6:用于自然语言处理的深度学习

强化学习 8:深度强化学习进阶主题

深度学习 7:深度学习中的注意力与记忆

强化学习 9:深度强化学习智能体概览

深度学习 8:无监督学习和生成模型

强化学习 10:经典游戏案例学习

课程门槛

当然,这样一门进阶课程也是有一定门槛的。授课者提到,去年就有很多人抱怨课程负担太重。选这门课程的人需要懂 Python,还要有很多其他知识储备。另外,由于授课者都是活跃在学界的顶级研究者,课程会直接延伸到当前的研究前沿。

教师寄语:做好准备,迎接挑战!(brace yourselves!)

原文发布于微信公众号 - 机器之心(almosthuman2014)

原文发表时间:2018-11-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

8张图看苹果公开的第一篇 AI 论文

【新智元导读】 苹果终于发表了AI方面的第一篇论文。12月22日,苹果题为《Learning from Simulated and Unsupervised I...

44660
来自专栏新智元

自然语言处理终极方向:深度学习用于自然语言处理的5大优势

【新智元导读】在自然语言处理领域,深度学习的承诺是:给新模型带来更好的性能,这些新模型可能需要更多数据,但不再需要那么多的语言学专业知识。 在自然语言处理领域,...

39460
来自专栏人工智能头条

深度学习:实际问题解决指南

30060
来自专栏PPV课数据科学社区

机器学习和统计模型的差异

在各种各样的数据科学论坛上这样一个问题经常被问到——机器学习和统计模型的差别是什么? 这确实是一个难以回答的问题。考虑到机器学习和统计模型解决问题的相似性,两者...

33860
来自专栏大数据文摘

我从吴恩达深度学习课程中学到的21个心得:加拿大银行首席分析师“学霸“笔记分享

17830
来自专栏大数据文摘

让你上瘾的网易云音乐推荐算法,用Word2vec就可以实现

15140
来自专栏原创

AI技术说:人工智能相关概念与发展简史

作为近几年的一大热词,人工智能一直是科技圈不可忽视的一大风口。随着智能硬件的迭代,智能家居产品逐步走进千家万户,语音识别、图像识别等AI相关技术也经历了阶梯式发...

49860
来自专栏PPV课数据科学社区

学习攻略 | 机器学习和深度学习技能树、面试宝典

人工智能的浪潮正在席卷全球,这些得益于数据量的上涨、运算力的提升和机器学习新算法(深度学习)的出现。机器学习是一种实现人工智能的方法,深度学习是一种实现机器学习...

43850
来自专栏量子位

OpenAI新研究:通过非监督学习提升NLP任务表现

今天,OpenAI在其官方博客上发布了一篇题为《用非监督学习来提升语言理解》的文章,介绍了他们最近的一项研究:Improving Language Unders...

11010
来自专栏书山有路勤为径

机器学习策略(1)

假设你在做一个猫的分类器,训练准确度达到了90%,现在还想继续提高,你可能会有以下的想法:

9420

扫码关注云+社区

领取腾讯云代金券