腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
深度强化学习实验室
专栏作者
举报
90
文章
149623
阅读量
43
订阅数
订阅专栏
申请加入专栏
全部文章(90)
强化学习(55)
编程算法(45)
https(28)
网络安全(24)
深度学习(20)
神经网络(19)
机器学习(17)
人工智能(12)
游戏(12)
github(11)
开源(8)
linux(6)
http(6)
监督学习(6)
python(5)
git(4)
api(4)
tensorflow(3)
腾讯云测试服务(3)
分布式(3)
迁移学习(3)
学习方法(3)
算法(3)
自动驾驶(2)
go(2)
html(2)
批量计算(2)
无人驾驶(2)
unity(2)
机器人(2)
技巧(2)
论文(2)
模型(2)
系统(2)
性能(2)
渠道代理(1)
NLP 服务(1)
c++(1)
.net(1)
scala(1)
bootstrap(1)
node.js(1)
ajax(1)
sqlalchemy(1)
ide(1)
金融(1)
自动化(1)
numpy(1)
keras(1)
无监督学习(1)
云计算(1)
google(1)
gradient(1)
model(1)
pdf(1)
policy(1)
split(1)
编码(1)
测试(1)
代理(1)
翻译(1)
工作(1)
框架(1)
排序(1)
排序算法(1)
数据(1)
网络(1)
优化(1)
原理(1)
搜索文章
搜索
搜索
关闭
【万字专栏总结】离线强化学习(OfflineRL)总结(原理、数据集、算法、复杂性分析、超参数调优等)
编程算法
强化学习
深度学习
监督学习
强化学习发展的特别早,但一直不温不火,其中Sutton老爷子早在1998年就写了强化学习领域的圣经书籍:An Introduction : Reinforcement Learning ,但也并未开启强化学习发展的新局面。直到2012年,深度学习广泛兴起,大规模的神经网络被成功用于解决自然语言处理,计算机视觉等领域,人工智能的各个方向才开始快速发展,强化学习领域最典型的就是2013年DeepMind公司的Volodymyr Mnih发表Playing Atari with Deep Reinforcement Learning(DQN技术),可以说开启了深度强化学习技术发展的新高潮,2015年该论文的加强版Human-level control through deep reinforcement learning 登上Nature, 以及2016年Nature上的AlphaGo: Mastering the game of Go with deep neural networks and tree search 充分证明了深度强化学习技术的发展潜力。
深度强化学习实验室
2022-09-23
5.2K
0
【实验室顾问】俞扬教授 (CCF-IEEE CS青年科学家奖获得者)
编程算法
强化学习
监督学习
游戏
机器学习
摘要:CCF与IEEE CS决定授予俞扬博士2020年CCF-IEEE CS青年科学家奖,以表彰他在演化学习理论与开放环境强化学习方法方面所做出的突出贡献。
深度强化学习实验室
2021-01-29
655
0
【综述翻译】Deep Learning for Video Game Playing
游戏
学习方法
监督学习
无监督学习
迁移学习
原文来源:https://arxiv.org/pdf/1708.07902.pdf
深度强化学习实验室
2020-12-16
940
0
【干货总结】分层强化学习(HRL)全面总结
编程算法
强化学习
监督学习
学习方法
来源:https://zhuanlan.zhihu.com/p/267524544
深度强化学习实验室
2020-12-01
3.1K
0
83篇文献-万字总结 || 强化学习之路
编程算法
.net
监督学习
迁移学习
深度强化学习是深度学习与强化学习相结合的产物,它集成了深度学习在视觉等感知问题上强大的理解能力,以及强化学习的决策能力,实现了端到端学习。深度强化学习的出现使得强化学习技术真正走向实用,得以解决现实场景中的复杂问题。从2013年DQN(深度Q网络,deep Q network)出现到目前为止,深度强化学习领域出现了大量的算法,以及解决实际应用问题的论文,本文将阐述深度强化学习的发展现状,并对未来进行展望。
深度强化学习实验室
2020-02-25
1.3K
0
笔记 || AlphaStar学习笔记总结
强化学习
深度学习
监督学习
游戏
AlphaStar是RL处理复杂决策问题的又一大新闻了。从War3到SC2,RTS一直是我的业余最爱,最近读了一下paper,也share一下里面使用的一些比较有趣的技术。@田渊栋 老师和 @张楚珩。
深度强化学习实验室
2020-02-25
1.6K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档