深度强化学习实验室

LV0
发表了文章

【Mava】一个分布式多智能体强化学习研究框架

Mava 是一个用于构建多智能体强化学习 (MARL) 系统的库。Mava 为 MARL 提供了有用的组件、抽象、实用程序和工具,并允许对多进程系统训练和执行进...

深度强化学习实验室
发表了文章

【最新】如何降低深度强化学习研究的计算成本(Reducing the Computational Cost of DeepRL)

人们普遍认为,将传统强化学习与深度神经网络相结合的深度强化学习研究的巨大增长始于开创性的DQN算法的发表。这篇论文展示了这种组合的潜力,表明它可以产生可以非常有...

深度强化学习实验室
发表了文章

强化学习 | 基于Novelty-Pursuit的高效探索方法

Li, Ziniu, and Xiong-Hui Chen. “Efficient Exploration by Novelty-Pursuit.” Inter...

深度强化学习实验室
发表了文章

【重磅推荐】哥大开源“FinRL”: 一个用于量化金融自动交易的深度强化学习库

目前,深度强化学习(DRL)技术在游戏等领域已经取得了巨大的成功,同时在量化投资中的也取得了突破性进展,为了训练一个实用的DRL 交易agent,决定在哪里交易...

深度强化学习实验室
发表了文章

【Nature重磅】OpenAI科学家提出全新强化学习算法,推动AI向智能体进化

近年来,人工智能(AI)在强化学习算法的加持下,取得了令人瞩目的成就。比如在围棋、星际争霸 II 和 Dota 2 等诸多策略、竞技类游戏中,AI 都有着世界冠...

深度强化学习实验室
发表了文章

【DeepMind】首发并开源Alchemy,一种元强化学习(meta-RL)基准环境。

元学习作为一种增加强化学习的灵活性和样本效率的方法,科研学者对此的关注兴趣迅速增长。然而,该研究领域中的一个问题是缺乏足够的基准测试任务。通常,过去基准的基础结...

深度强化学习实验室
发表了文章

NeoRL: 接近真实世界的离线强化学习基准

众所周知,强化学习(RL)在游戏界的成功已经在 AI 界产生了轰动 ,不管是玩出历史高分的微软AI,还是继围棋之后,人工智能又攻克的德州扑克,亦或是利用“左右互...

深度强化学习实验室
发表了文章

【干货】全面总结(值函数与优势函数)的估计方法

大部分强化学习算法中需要用到值函数(状态值函数或者动作值函数),估计值函数的方法主要有时序差分(Temporal-difference, TD)算法和蒙特卡罗(...

深度强化学习实验室
发表了文章

【喜报】"深度强化学习实验室"与"南栖仙策"达成战略合作

为进一步推动下一代认知决策智能的发展,促进国内强化学习技术的理论探索、应用落地和人才培养,"深度强化学习实验室"与"南栖仙策(南京)科技有限公司"达成...

深度强化学习实验室
发表了文章

【实验室顾问】俞扬教授 (CCF-IEEE CS青年科学家奖获得者)

摘要:CCF与IEEE CS决定授予俞扬博士2020年CCF-IEEE CS青年科学家奖,以表彰他在演化学习理论与开放环境强化学习方法方面所做出的突出贡献。

深度强化学习实验室
发表了文章

【书籍推荐】历时3年,清华大学iDLab实验室打造Reinforcement Learning and Control课程及讲义

The Intelligent Driving Laboratory (iDLAB) is a part of the School of Vehicle an...

深度强化学习实验室
发表了文章

【论文深度研读报告】MuZero算法过程详解

这篇文章的研究内容为:具有规划能力的智能体(agents with planning capabilities)。

深度强化学习实验室
发表了文章

【论文复现】一步步详解用TD3算法通关BipedalWalkerHardcore-v2环境

熟悉强化学习Gym环境的小伙伴应该对 (BWH-v2环境) BipedalWalkerHardcore-v2(如图1)并不陌生。在这个环境里,这个Agent需...

深度强化学习实验室
发表了文章

【论文复现】Top-K Off-Policy Correction for a REINFORCE RS论文复现

来源:https://zhuanlan.zhihu.com/p/329810387

深度强化学习实验室
发表了文章

【综述翻译】Deep Learning for Video Game Playing

原文来源:https://arxiv.org/pdf/1708.07902.pdf

深度强化学习实验室
发表了文章

【干货总结】分层强化学习(HRL)全面总结

来源:https://zhuanlan.zhihu.com/p/267524544

深度强化学习实验室
发表了文章

【重磅整理】提前看287篇ICLR-2021 "深度强化学习"领域论文得分汇总列表

[1]. What Matters for On-Policy Deep Actor-Critic Methods? A Large-Scale Study

深度强化学习实验室
发表了文章

强化学习《奖励函数设计: Reward Shaping》详细解读

这是Sutton在《Reinforcement learning: An introduction》中的一段话,清晰地展现了智能体是如何通过奖励信号沟通智能体与...

深度强化学习实验室
发表了文章

探索(Exploration)还是利用(Exploitation)?强化学习如何tradeoff?

探索 VS 利用,这是强化学习中至关重要的话题。我们希望强化学习中的智能体尽快找到最佳策略。然而,在没有充分探索的情况下就盲目地选择某个策略会带来一定的问题,因...

深度强化学习实验室
发表了文章

【RLChina2020公开课课件】 Lecture-4.pdf

https://rlchina.org/lectures/lecture0.pdf

深度强化学习实验室

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券