深度学习与强化学习

深度学习与强化学习

随着 DeepMind 公司的崛起,深度学习和强化学习已经成为了人工智能领域的热门研究方向。除了众所周知的 AlphaGo 之外,DeepMind 之前已经使用深度学习与强化学习的算法构造了能够自动玩 Atari 游戏的 AI,并且在即时战略游戏 StarCraft II 的游戏 AI 构建上做出了自己的贡献。虽然目前还没有成功地使用 AI 来战胜 StarCraft II 的顶尖职业玩家,但是 AI 却能够带给大家无穷的想象力和期待。

本篇 PPT 将会从强化学习的一些简单概念开始,逐步介绍值函数与动作值函数,以及 Q-Learning 算法。然后介绍深度学习中卷积神经网络的大致结构框架。最后将会介绍卷积神经网络是如何和强化学习有效地结合在一起,来实现一些简单的游戏 AI。

之前也写过一份PPT《当强化学习遇见泛函分析》,两份 PPT 有一些重复的地方,读者选择一些看即可。之前文章从强化学习的定义出发,一步一步地给读者介绍强化学习的简单概念和基本性质,并且会介绍经典的 Q-Learning 算法。文章的最后一节会介绍泛函分析的一些基本概念,并且使用泛函分析的经典定理 Banach Fixed Point Theorem 来证明强化学习中 Value Iteration 等算法的收敛性。

原创声明,本文系作者授权云+社区-专栏发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

学界 | OpenAI竞争性自我对抗训练:简单环境下获得复杂的智能体

机器之心编译 选自:OpenAI 参与:蒋思源、刘晓坤 OpenAI 近日表示通过自我对抗训练的竞争性多智能体可以产生比环境本身复杂得多的行为。该研究基于 Do...

3265
来自专栏机器之心

业界 | 用于机器阅读理解的迁移学习:微软提出通用型SynNet网络

选自Microsoft Research Blog 作者:Xiaodong He 机器之心编译 参与:Smith、路雪 不是每个人都会下围棋,但大多数人都会阅读...

2626
来自专栏镁客网

MIT神经科学家推翻15年前相关成果,找出大脑对于环境的全新记忆机制 | 黑科技

840
来自专栏程序人生 阅读快乐

[O'Reilly:学习OpenCV(中文版)]

《学习OpenCV》将你置身于迅速发展的计算机视觉领域。《学习OpenCV》作者是免费开源0penCV的发起人,《学习OpenCV》为你介绍了计算机视觉,例证了...

561
来自专栏ATYUN订阅号

NVIDIA新研究:AI只通过噪点图像的训练就可以修复照片

如果在低光照下拍摄的照片,噪音和伪影可以自动消除,那将会如何;如果你的照片库中有颗粒状或像素化的图像呢,你会想要修复它们吗?现在一种基于深度学习的方法已经学会...

933
来自专栏ATYUN订阅号

fast.ai推出全新的7周实用深度学习课程

深度学习入门课程第1部分,为编码人员提供实用的深度学习入门课程,由Jeremy Howard (Enlitic创始人)授课。深度学习入门课程不需要研究生水平的数...

774
来自专栏新智元

9月机器学习文章Top10:星际2、Dota2皆入选,ML教程居榜首

【新智元导读】Mybridge AI(www.mybridge.co)基于文章的内容质量和热议程度对 9 月份和机器学习相关的论文进行了排名,从近 1400 篇...

3458
来自专栏大数据文摘

非得从零开始学习?扒一扒强化学习的致命缺陷

Deepmind在Alphago上的成就把强化学习这一方法带入了人工智能的主流学习领域,【从零开始学习】也似乎成为了抛弃人类先验经验、获取新的技能并在各类游戏击...

780
来自专栏AI科技评论

动态 | 还在用PS磨皮去皱?看看如何用神经网络高度还原你的年轻容貌!

用机器学习合成人像照片,使照片中的人看起来更年轻或年老的方法已经屡见不鲜。不过据雷锋网消息,近日,来自法国Orange实验室的Enter Grigory Ant...

2846
来自专栏新智元

视频 | 谷歌最新研究曝光: 合作式增强学习让机器人掌握通用技能

【新智元导读】谷歌大脑、DeepMind和 Google X 的研究员正在设计一种新的实验,探讨使用多个机器人共同学习通用技能的三种可行的方法:直接从经验中学习...

3357

扫码关注云+社区