腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

深度强化学习实验室

专栏作者

90

文章

149623

阅读量

43

订阅数

【万字专栏总结】离线强化学习(OfflineRL)总结(原理、数据集、算法、复杂性分析、超参数调优等）

编程算法强化学习深度学习监督学习

强化学习发展的特别早，但一直不温不火，其中Sutton老爷子早在1998年就写了强化学习领域的圣经书籍：An Introduction : Reinforcement Learning ，但也并未开启强化学习发展的新局面。直到2012年，深度学习广泛兴起，大规模的神经网络被成功用于解决自然语言处理，计算机视觉等领域，人工智能的各个方向才开始快速发展，强化学习领域最典型的就是2013年DeepMind公司的Volodymyr Mnih发表Playing Atari with Deep Reinforcement Learning（DQN技术），可以说开启了深度强化学习技术发展的新高潮，2015年该论文的加强版Human-level control through deep reinforcement learning 登上Nature, 以及2016年Nature上的AlphaGo: Mastering the game of Go with deep neural networks and tree search 充分证明了深度强化学习技术的发展潜力。

深度强化学习实验室

2022-09-23

5.2K0

【实验室顾问】俞扬教授（CCF-IEEE CS青年科学家奖获得者）

编程算法强化学习监督学习游戏机器学习

摘要：CCF与IEEE CS决定授予俞扬博士2020年CCF-IEEE CS青年科学家奖，以表彰他在演化学习理论与开放环境强化学习方法方面所做出的突出贡献。

深度强化学习实验室

2021-01-29

6550

【综述翻译】Deep Learning for Video Game Playing

游戏学习方法监督学习无监督学习迁移学习

原文来源：https://arxiv.org/pdf/1708.07902.pdf

深度强化学习实验室

2020-12-16

9400

【干货总结】分层强化学习(HRL)全面总结

编程算法强化学习监督学习学习方法

来源：https://zhuanlan.zhihu.com/p/267524544

深度强化学习实验室

2020-12-01

3.1K0

83篇文献-万字总结 || 强化学习之路

编程算法 .net 监督学习迁移学习

深度强化学习是深度学习与强化学习相结合的产物，它集成了深度学习在视觉等感知问题上强大的理解能力，以及强化学习的决策能力，实现了端到端学习。深度强化学习的出现使得强化学习技术真正走向实用，得以解决现实场景中的复杂问题。从2013年DQN（深度Q网络，deep Q network）出现到目前为止，深度强化学习领域出现了大量的算法，以及解决实际应用问题的论文，本文将阐述深度强化学习的发展现状，并对未来进行展望。

深度强化学习实验室

2020-02-25

1.3K0

笔记 || AlphaStar学习笔记总结

强化学习深度学习监督学习游戏

AlphaStar是RL处理复杂决策问题的又一大新闻了。从War3到SC2，RTS一直是我的业余最爱，最近读了一下paper，也share一下里面使用的一些比较有趣的技术。@田渊栋老师和 @张楚珩。

深度强化学习实验室

2020-02-25

1.6K0

没有更多了

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态