学习
实践
活动
专区
工具
TVP
写文章

深度强化学习实验室

LV0
举报
发表了文章

【最全总结】离线强化学习(Offline RL)数据集、Benchmarks、经典算法、软件、竞赛、落地应用、核心算法解读汇总

Supported by: Nanjing University and Polixir

深度强化学习实验室
ScalaHTML编程算法
发表了文章

【重磅最新】ICLR2023顶会376篇深度强化学习论文得分出炉(376/4753,占比8%)

声明:本文整理自顶会ICLR-2023官方,强化学习相关文章大约共计376篇(376/4753), 占比8%,整理难免有不足之处,还望交流指正。

深度强化学习实验室
编程算法
发表了文章

【前沿最新】主动离线策略选择算法(Active offline policy selection)(附开源代码)

https://www.deepmind.com/publications/active-offline-policy-selection

深度强化学习实验室
机器人https网络安全GitHub
发表了文章

【论文笔记】Automating DBSCAN via Deep Reinforcement Learning

作为一种经典的基于密度的聚类方法,DBSCAN由于简单而且实用,被广泛的运用到许多科学和工程领域中。然而,由于它对聚类距离(

深度强化学习实验室
聚类算法编程算法强化学习
发表了文章

【新书推荐】《强化学习的数学原理》-高效透彻地理解强化学习算法

强化学习是数学和应用的优美结合。如果我们从数学的角度去看待很多问题,能够更加透彻的理解强化学习中的很多问题。不过目前许多学习资料都尽可能避免介绍其中的数学原理,...

深度强化学习实验室
强化学习https网络安全编程算法
发表了文章

【DeepNash智能体】DeepMind-34位作者联名发表“无模型多智能体强化学习战略游戏”新基准

我们介绍了 DeepNash,一种能够从零开始学习玩不完美信息游戏 Stratego1 的自主智能体,直至达到人类专家的水平。Stratego 是人工智能 (A...

深度强化学习实验室
游戏Node.jsPython
发表了文章

【万字专栏总结】离线强化学习(OfflineRL)总结(原理、数据集、算法、复杂性分析、超参数调优等)

强化学习发展的特别早,但一直不温不火,其中Sutton老爷子早在1998年就写了强化学习领域的圣经书籍:An Introduction : Reinforcem...

深度强化学习实验室
编程算法强化学习深度学习监督学习
发表了文章

【经验】深度强化学习训练与调参技巧

来源:知乎(https://zhuanlan.zhihu.com/p/482656367)

深度强化学习实验室
编程算法强化学习腾讯云测试服务网络安全
发表了文章

【论文分享】ICLR2022 HyperDQN: A Randomized Exploration for Deep RL

Ziniu Li, Yingru Li, Yushun Zhang, Tong Zhang, and Zhi-Quan Luo. HyperDQN: A Ran...

深度强化学习实验室
机器学习神经网络深度学习人工智能
发表了文章

【Richard S. Sutton】谈 The Bitter Lesson(AI 研究中痛苦的教训)

从 70 年的 AI 研究中可以读出的最大教训是,利用计算的一般方法最终是最有效的,而且幅度很大。造成这种情况的最终原因是摩尔定律,或者更确切地说是它对每单位计...

深度强化学习实验室
深度学习Linux
发表了文章

【47页综述】牛津大学联合7家单位发布AutoRL综述,还在手动调参吗?你已经落后了

强化学习 (RL) 与深度学习的结合带来了一系列令人印象深刻的壮举,许多人认为(深度)强化学习提供了通向通用智能体的途径。然而,RL 智能体的成功通常对训练过程...

深度强化学习实验室
强化学习HTTP
发表了文章

【重磅】Gym发布 8 年后,迎来第一个完整环境文档,强化学习入门更加简单化!

OpenAI Gym是一款用于研发和比较强化学习算法的环境工具包,它支持训练智能体(agent)做任何事——从行走到玩Pong或围棋之类的游戏都在范围中。 它与...

深度强化学习实验室
API强化学习编程算法
发表了文章

重磅推荐【Pettingzoo】类似gym的多Agent强化学习的环境(61类环境),史上最全!

http://deeprl.neurondance.com/d/465-pettingzoogymagent

深度强化学习实验室
HTTPAPI
发表了文章

【总结】为什么对累积奖励减去baseline项能起到减小方差的作用?

很多论文的工作都专注于减少policy gradient的方差,以得到更加优质且稳定的policy。其中一项最经典的工作就是对policy gradient的累...

深度强化学习实验室
发表了文章

【模仿学习】南京大学&港中文联合总结: 29页中文详述模仿学习完整过程

模仿学习,是一种从专家示例中进行学习的方法。这里专家示例指的是由最优(或者次优)策略采集到的状态-动作序列,智能体便是通过模仿专家示例来学习策略。模仿学习主要包...

深度强化学习实验室
编程算法HTTPhttps网络安全
发表了文章

【Mava】一个分布式多智能体强化学习研究框架

Mava 是一个用于构建多智能体强化学习 (MARL) 系统的库。Mava 为 MARL 提供了有用的组件、抽象、实用程序和工具,并允许对多进程系统训练和执行进...

深度强化学习实验室
Python强化学习分布式HTTP
发表了文章

【最新】如何降低深度强化学习研究的计算成本(Reducing the Computational Cost of DeepRL)

人们普遍认为,将传统强化学习与深度神经网络相结合的深度强化学习研究的巨大增长始于开创性的DQN算法的发表。这篇论文展示了这种组合的潜力,表明它可以产生可以非常有...

深度强化学习实验室
编程算法游戏强化学习https网络安全
发表了文章

强化学习 | 基于Novelty-Pursuit的高效探索方法

Li, Ziniu, and Xiong-Hui Chen. “Efficient Exploration by Novelty-Pursuit.” Inter...

深度强化学习实验室
强化学习编程算法
发表了文章

【重磅推荐】哥大开源“FinRL”: 一个用于量化金融自动交易的深度强化学习库

目前,深度强化学习(DRL)技术在游戏等领域已经取得了巨大的成功,同时在量化投资中的也取得了突破性进展,为了训练一个实用的DRL 交易agent,决定在哪里交易...

深度强化学习实验室
强化学习编程算法https网络安全GitHub
发表了文章

【Nature重磅】OpenAI科学家提出全新强化学习算法,推动AI向智能体进化

近年来,人工智能(AI)在强化学习算法的加持下,取得了令人瞩目的成就。比如在围棋、星际争霸 II 和 Dota 2 等诸多策略、竞技类游戏中,AI 都有着世界冠...

深度强化学习实验室
Go编程算法游戏强化学习机器人

个人简介

个人成就

扫码关注腾讯云开发者

领取腾讯云代金券