首页
学习
活动
专区
工具
TVP
发布

深度强化学习实验室

专栏成员
91
文章
170224
阅读量
44
订阅数
【论文分享】ICLR2022 HyperDQN: A Randomized Exploration for Deep RL
Ziniu Li, Yingru Li, Yushun Zhang, Tong Zhang, and Zhi-Quan Luo. HyperDQN: A Randomized Exploration Method for Deep Reinforcement Learning. In Proceedings of 10th International Conference on Learning Representations, 2022.
深度强化学习实验室
2022-09-23
5860
【实验室顾问】俞扬教授 (CCF-IEEE CS青年科学家奖获得者)
摘要:CCF与IEEE CS决定授予俞扬博士2020年CCF-IEEE CS青年科学家奖,以表彰他在演化学习理论与开放环境强化学习方法方面所做出的突出贡献。
深度强化学习实验室
2021-01-29
6950
【论文复现】Top-K Off-Policy Correction for a REINFORCE RS论文复现
来源:https://zhuanlan.zhihu.com/p/329810387
深度强化学习实验室
2020-12-16
8920
强化学习《奖励函数设计: Reward Shaping》详细解读
这是Sutton在《Reinforcement learning: An introduction》中的一段话,清晰地展现了智能体是如何通过奖励信号沟通智能体与我们的目标。而奖励设计实际上是MDP中的一个关键元素
深度强化学习实验室
2020-09-08
12.9K1
博士万字总结 || 多智能体强化学习(MARL)大总结与论文详细解读
来源: ©PaperWeekly 原创 @李文浩-华东师范大学博士生 编辑:DeepRL 最近由于写论文的原因,梳理了一下近几年的多智能体强化学习(MARL)算法,在这里做一个总结。下面遵循综述 Is
深度强化学习实验室
2020-04-22
26.8K0
1万美金助学金 || 微软研究院全球项目开放申请:强化学习开放源代码节(RL Open Source Fest)
强化学习开放源代码节( RL Open Source Fest)是一项全球性在线计划,旨在与学生,数据科学家和Microsoft Research NYC真实世界强化学习小组的工程师一起,向学生介绍开源强化学习程序和软件开发。大学毕业后(2020年5月至2020年8月),学生将进行为期四个月的研究编程项目。被录取的学生将获得10,000美元的助学金。
深度强化学习实验室
2020-02-27
5270
Call For Papers# IJCNN2020 Special Session: Method of DRL to AS
Autonomous systems are an important driver of benefit to many companies and organizations. Advances in autonomous technologies affect every part of life, business, industry and education. A class of machine learning methods, namely reinforcement learning (RL), are the backbone of many autonomous systems. Recent developments in deep learning have been integrated into conventional RL, known as deep RL, for building more capable and robust autonomous systems. These autonomous technologies are transforming many industries, most notable is the car industry where autonomous driving systems will lead to huge transformation in the near future. Other businesses have also applied autonomous technologies to stimulate transformation and growth, from the defense and security industries through to the highly-competitive retail sector, supply chains, manufacturing, medical diagnosis systems, remote aged-care and health-care systems, autonomous surgery, cancer treatment planning, in-house robotics, disaster management and smart-grid control.
深度强化学习实验室
2020-02-11
8940
方法 || 深度强化学习解决交通控制问题
作者在现有研究方法的基础上提出了使用深度强化学习解决交通控制的方法,整体结构图如下:
深度强化学习实验室
2020-01-14
1.4K0
重磅综述: 迁移学习在强化学习中的应用及最新进展
机器学习技术在许多领域取得了重大成功,但是,许多机器学习方法只有在训练数据和测试数据在相同的特征空间中或具有相同分布的假设下才能很好地发挥作用。当分布发生变化时,大多数统计模型需要使用新收集的训练数据重建模型。在许多实际应用中,重新收集所需的训练数据并重建模型的代价是非常昂贵的,在这种情况下,我们需要在任务域之间进行知识迁移 (Knowledge Transfer) 或迁移学习 (Transfer Learning),避免高代价的数据标注工作。
深度强化学习实验室
2019-11-21
2.8K0
通过深度强化学习实现通用量子控制
地址:https://www.nature.com/articles/s41534-019-0141-3.pdf
深度强化学习实验室
2019-11-21
7650
解读72篇DeepMind深度强化学习论文
来源:王小惟的知乎https://zhuanlan.zhihu.com/p/70127847
深度强化学习实验室
2019-11-21
1.8K0
真的像Google的WANN不需要调权重了吗? 《AutoML》:一份自动化调参的指导
为了寻找具备强归纳偏置的神经网络架构,研究者提出通过降低权重重要性的方式来搜索架构。具体步骤为:
深度强化学习实验室
2019-11-21
5200
ICML2019-深度强化学习文章汇总
强化学习是一种通用的学习、预测和决策范式。RL为顺序决策问题提供了解决方法,并将其转化为顺序决策问题。RL与优化、统计学、博弈论、因果推理、序贯实验等有着深刻的联系,与近似动态规划和最优控制有着很大的重叠,在科学、工程和艺术领域有着广泛的应用。
深度强化学习实验室
2019-11-21
8760
一份人工智能领域知识脑图汇总
作为每一位深度强化学习者,掌握神经网络、python等基础知识是至关重要的一项技能,本文参考博客,将目前常用的知识进行了一一列举。
深度强化学习实验室
2019-11-21
8000
这是一份你必须学习的强化学习算法清单
强化学习算法可以分为三大类:value based, policy based 和 actor critic。常见的是以DQN为代表的value based算法,这种算法中只有一个值函数网络,没有policy网络,以及以DDPG,TRPO为代表的actor-critic算法,这种算法中既有值函数网络,又有policy网络。
深度强化学习实验室
2019-11-21
9430
“超参数”与“网络结构”自动化设置方法---DeepHyper
可以说这两个问题一直困扰每一个学习者,为了解决这些问题,谷歌公司开源了AutoML(貌似收费)。此外还有Keras(后期详解),本篇文章介绍一个自动化学习包: DeepHyper
深度强化学习实验室
2019-11-20
1.1K0
AI领域:如何做优秀研究并写高水平论文?
本文来源于博主知乎:https://zhuanlan.zhihu.com/p/82659139
深度强化学习实验室
2019-09-17
4710
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档