专栏首页专知【新加坡国立大学张戎】深度学习与强化学习(附slide下载)

【新加坡国立大学张戎】深度学习与强化学习(附slide下载)

来源:

https://cloud.tencent.com/developer/article/1006637

随着 DeepMind 公司的崛起,深度学习和强化学习已经成为了人工智能领域的热门研究方向。除了众所周知的 AlphaGo 之外,DeepMind 之前已经使用深度学习与强化学习的算法构造了能够自动玩 Atari 游戏的 AI,并且在即时战略游戏 StarCraft II 的游戏 AI 构建上做出了自己的贡献。虽然目前还没有成功地使用 AI 来战胜 StarCraft II 的顶尖职业玩家,但是 AI 却能够带给大家无穷的想象力和期待。

本篇 PPT 将会从强化学习的一些简单概念开始,逐步介绍值函数与动作值函数,以及 Q-Learning 算法。然后介绍深度学习中卷积神经网络的大致结构框架。最后将会介绍卷积神经网络是如何和强化学习有效地结合在一起,来实现一些简单的游戏 AI。

之前也写过一份PPT《当强化学习遇见泛函分析》,两份 PPT 有一些重复的地方,读者选择一些看即可。之前文章从强化学习的定义出发,一步一步地给读者介绍强化学习的简单概念和基本性质,并且会介绍经典的 Q-Learning 算法。文章的最后一节会介绍泛函分析的一些基本概念,并且使用泛函分析的经典定理 Banach Fixed Point Theorem 来证明强化学习中 Value Iteration 等算法的收敛性。

末尾附slide下载。

▌特别提示-深度学习与强化学习slide下载:

请关注专知公众号

  • 后台回复“TDLRL” 就可以获取报告pdf下载链接

本文分享自微信公众号 - 专知(Quan_Zhuanzhi),作者:张戎

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-12-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【下载】面向Open AI, TensorFlow, Keras的强化学习书籍《Reinforcement Learning》

    【导读】IT资深工程师和人工智能技术专家Abhishek Nandy和Manisha Biswas撰写的Open AI, TensorFlow, Keras强化...

    WZEARW
  • 【深度学习】一文教你如何确定好的“学习率”

    【导读】近日,数据科学家Hafidz Zulkifli发布一篇文章,主要讲解了深度学习中的“学习率”,以及如何利用学习率来提高深度学习模型的性能并减少训练时间。...

    WZEARW
  • 春节充电系列:李宏毅2017机器学习课程学习笔记31之深度强化学习(deep reinforcement learning)

    【导读】我们在上一节的内容中已经为大家介绍了台大李宏毅老师的机器学习课程的ensemble。这一节将主要针对讨论deep reinforcement learn...

    WZEARW
  • 专栏 | 田渊栋:第一届FLAIR感想

    机器之心
  • 资料 |《深度学习500问》,川大优秀毕业生的诚意之作

    今天,给大家推荐一本还未完成的深度学习书籍——《深度学习500问》。为什么要推荐一本未完成的书?

    zenRRan
  • 《深度学习500问》,川大优秀毕业生的诚意之作

    今天,营长要给大家推荐一本还未完成的深度学习书籍——《深度学习500问》。为什么要推荐一本未完成的书?

    AI科技大本营
  • 如何利用强化学习设计出更好的火箭发动机

    如何将强化学习用于火箭发动机引擎研发的创新解决方案中。本文作者Bird公司的数据科学家Edward Mehr,将分享他是如何同各领域专家合作,以及介绍机器学习技...

    大数据文摘
  • 吴恩达给我们的ML生涯规划,赞!

    作为曾在多个著名企业和学术机构担任实验室负责人的“老司机”,吴恩达可谓经验丰富,他就以上问题给出了出色的建议,带你稳步上车。

    Sam Gor
  • 什么是人工智能?

    人工智能(英语:Artificial Intelligence,缩写为AI,指由人制造出来的机器所表现出来的智能。通常人工智能是指通过普通计算机程序来呈现人类智...

    分母为零
  • 【重磅】Bengio最新演讲:Representations中的深度监督学习(49ppt下载)

    【新智元导读】7月4日,Yoshua Bengio参加 Idiap 举办的深度学习研讨会,发表题为《Representations中的深度监督学习》的演讲。他首...

    新智元

扫码关注云+社区

领取腾讯云代金券