https://cloud.tencent.com/developer/article/1006637

随着 DeepMind 公司的崛起，深度学习和强化学习已经成为了人工智能领域的热门研究方向。除了众所周知的 AlphaGo 之外，DeepMind 之前已经使用深度学习与强化学习的算法构造了能够自动玩 Atari 游戏的 AI，并且在即时战略游戏 StarCraft II 的游戏 AI 构建上做出了自己的贡献。虽然目前还没有成功地使用 AI 来战胜 StarCraft II 的顶尖职业玩家，但是 AI 却能够带给大家无穷的想象力和期待。

本篇 PPT 将会从强化学习的一些简单概念开始，逐步介绍值函数与动作值函数，以及 Q－Learning 算法。然后介绍深度学习中卷积神经网络的大致结构框架。最后将会介绍卷积神经网络是如何和强化学习有效地结合在一起，来实现一些简单的游戏 AI。

之前也写过一份PPT《当强化学习遇见泛函分析》，两份 PPT 有一些重复的地方，读者选择一些看即可。之前文章从强化学习的定义出发，一步一步地给读者介绍强化学习的简单概念和基本性质，并且会介绍经典的 Q-Learning 算法。文章的最后一节会介绍泛函分析的一些基本概念，并且使用泛函分析的经典定理 Banach Fixed Point Theorem 来证明强化学习中 Value Iteration 等算法的收敛性。

▌特别提示-深度学习与强化学习slide下载：

后台回复“TDLRL” 就可以获取报告pdf下载链接

【新加坡国立大学张戎】深度学习与强化学习（附slide下载）。除了众所周知的 AlphaGo 之外，DeepMind 之前已经使用深度学习与强化学习的算法构造了能够自动玩 Atari 游戏的 AI，并且在即时战略游戏 StarCraft II 的游戏 AI 构建上做出了自己的贡献。之前文章从强化学习的定义出发，一步一步地给读者介绍强化学习的简单概念和基本性质，并且会介绍经典的 Q-Learning 算法。后台回复“TDLRL” 就可以获取报告pdf下载链接

来源：
https://cloud.tencent.com/developer/article/1006637
随着 DeepMind 公司的崛起，深度学习和强化学习已经成为了人工智能领域的热门研究方向。除了众所周知的 AlphaGo 之外，DeepMind 之前已经使用深度学习与强化学习的算法构造了能够自动玩 Atari 游戏的 AI，并且在即时战略游戏 StarCraft II 的游戏 AI 构建上做出了自己的贡献。虽然目前还没有成功地使用 AI 来战胜 StarCraft II 的顶尖职业玩家，但是 

【新加坡国立大学张戎】深度学习与强化学习（附slide下载）

人工智能

深度学习和强化学习是AI领域热门方向，DeepMind在游戏AI领域取得突破。本文介绍强化学习基础概念、Q-Learning算法及卷积神经网络结构，探讨二者结合实现游戏AI的方法。包含值函数、动作值函数等核心内容，适合AI研究者学习参考。

卷积神经网络

深度学习

强化学习

文章

问答

视频

教程

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云智能顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

EdgeOne AI 安全实战专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋

腾讯云代码助手

云原生构建

TAPD 敏捷项目管理

Cloud Studio

SDK中心

API中心

命令行工具

涵盖代码开发、场景应用、自动测试全流程，助你从零构建专属AI助手

一站式MCP教程库，解锁AI应用新玩法

聚焦“写作效率、视觉美观与运行性能”三方面进行全面升级，为您提供更高效、稳定的创作环境

社区富文本&Markdown编辑器全新改版上线，欢迎大家体验!

诚挚邀请您参与本次调研，分享您的真实使用感受与建议。您的反馈至关重要，感谢您的支持与参与！

【新加坡国立大学张戎】深度学习与强化学习（附slide下载）

【新加坡国立大学张戎】深度学习与强化学习（附slide下载）

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐