【新加坡国立大学张戎】深度学习与强化学习(附slide下载)

来源:

https://cloud.tencent.com/developer/article/1006637

随着 DeepMind 公司的崛起,深度学习和强化学习已经成为了人工智能领域的热门研究方向。除了众所周知的 AlphaGo 之外,DeepMind 之前已经使用深度学习与强化学习的算法构造了能够自动玩 Atari 游戏的 AI,并且在即时战略游戏 StarCraft II 的游戏 AI 构建上做出了自己的贡献。虽然目前还没有成功地使用 AI 来战胜 StarCraft II 的顶尖职业玩家,但是 AI 却能够带给大家无穷的想象力和期待。

本篇 PPT 将会从强化学习的一些简单概念开始,逐步介绍值函数与动作值函数,以及 Q-Learning 算法。然后介绍深度学习中卷积神经网络的大致结构框架。最后将会介绍卷积神经网络是如何和强化学习有效地结合在一起,来实现一些简单的游戏 AI。

之前也写过一份PPT《当强化学习遇见泛函分析》,两份 PPT 有一些重复的地方,读者选择一些看即可。之前文章从强化学习的定义出发,一步一步地给读者介绍强化学习的简单概念和基本性质,并且会介绍经典的 Q-Learning 算法。文章的最后一节会介绍泛函分析的一些基本概念,并且使用泛函分析的经典定理 Banach Fixed Point Theorem 来证明强化学习中 Value Iteration 等算法的收敛性。

末尾附slide下载。

▌特别提示-深度学习与强化学习slide下载:

请关注专知公众号

  • 后台回复“TDLRL” 就可以获取报告pdf下载链接

原文发布于微信公众号 - 专知(Quan_Zhuanzhi)

原文发表时间:2017-12-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

【ICML+NIPS过去12年数据】机器学习被引次数最高作者Top 20

【新智元导读】为了研究AI研究领域的最新趋势,Kakao AI 研究小组对2005年至2016年期间ICML和NIPS发表的6163篇科学论文进行了分析,从累积...

503140
来自专栏SIGAI学习与实践平台

理解计算:从√2到AlphaGo ——第1季 从√2谈起

计算的概念看似简单却又十分宽泛,它实际上是计算机学科永远不变的核心内容,就算现在所谓的人工智能,在我看来也不过是一种计算或计算结果的应用。本文将从简单的例子出发...

10930
来自专栏数据派THU

收藏 | 最新知识图谱论文清单(附解读、下载)

精选 6 篇来自 EMNLP 2018、COLING 2018、ISWC 2018 和 IJCAI 2018 的知识图谱相关工作,带你快速了解知识图谱领域最新研...

24930
来自专栏CreateAMind

深度抽象强化学习-提高抽象学习能力-论文解读

Deep reinforcement learning (DRL) brings the power of deep neural networks to be...

15320
来自专栏ATYUN订阅号

7分钟了解Facebook新AI的音乐风格迁移

想象一下:你的朋友为了听一首歌纠缠了你好几个星期,即使你告诉他们你不喜欢艾德·希兰(Ed Sheeran),神烦!他们一直纠缠你,声称“旋律使它伟大”。要是你能...

40430
来自专栏专知

【AAAI2018】预测你的下一步-动态网络节点表示学习,浙江大学和南加州大学团队工作,代码已开源

【导读】以往的网络表示学习模型只会为固定的网络节点学习表示向量,而实际上,网络节点会根据时间的变化通过节点间的交互呈现出不同的网络结构特性。浙江大学和南加州大学...

50580
来自专栏黄成甲

数据分析之描述性分析

1.描述性分析主要是对所收集的数据进行分析,得出反映客观现象的各种数量特征的一种分析方法,它包括数据的集中趋势分析、数据离散程度分析、数据的频数分布分析等,描述...

56020
来自专栏PPV课数据科学社区

空间数据挖掘常用的17种方法

PPV课大数据学习社区如果你对大数据感兴趣;如果你想转行做大数据;如果你想了解大数据是怎么改变我们生活,请点标题下蓝字关注PPV课大数据 ? 问题1:空间数据挖...

39590
来自专栏机器之心

教程 | 深度学习初学者必读:张量究竟是什么?

选自Kdnuggets 作者:Ted Dunning 机器之心编译 参与:晏奇、吴攀 今天很多现有的深度学习系统都是基于张量代数(tensor algebra...

35350
来自专栏PaddlePaddle

【AI核心技术】课程四:多层感知机网络模型

UAI与PaddlePaddle联合推出的【AI核心技术掌握】系列课程持续更新中!

9410

扫码关注云+社区

领取腾讯云代金券