腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

相约机器人

专栏作者

664

文章

1033304

阅读量

52

订阅数

加州大学伯克利分校研究人员推出无监督强化学习基准 (URLB)

编程算法强化学习 https 网络安全 php

强化学习 (RL) 是一种强大的人工智能范式，用于处理各种问题，包括自动驾驶汽车控制、数字助理和资源分配等。然而即使是当今最好的 RL 代理也很窄。目前大部分 RL 算法只能解决他们所训练的单一工作，没有跨任务或跨域泛化能力。

代码医生工作室

2021-12-29

3640

Facebook AI 推出“SaLinA”：一个用于实现包括强化学习算法在内的顺序决策模型的轻量级库

强化学习深度学习 https 网络安全编程算法

深度学习库非常适合促进复杂可微函数的实现。这些函数通常具有 f(x) → y 之类的形状，其中 x 是一组输入张量，y 是通过对这些输入执行多次计算而产生的输出张量。为了实现一个新的 f 函数并创建一个新的原型，需要通过组合运算符组装各种块（或模块）。尽管过程简单，但这种方法无法处理顺序决策方法的实现。经典平台非常适合以有效的方式管理信息的获取、处理和转换。

代码医生工作室

2021-10-21

4720

DeepMind的新强化学习系统是迈向通用AI的下一步吗？

游戏强化学习机器学习深度学习人工智能

对于精通围棋、星际争霸 2 以及其他游戏的深度强化学习模型而言，关键的挑战之一是它们无法将其能力泛化到训练领域之外。这种限制使得将这些系统应用到现实世界中变得非常困难，在现实世界中，情况比训练 AI 模型的环境复杂得多且不可预测。

代码医生工作室

2021-09-30

3550

加州大学伯克利分校研究人员开源RAD来改进强化学习算法

编程算法强化学习腾讯云测试服务 php 命令行工具

作者 | Michael Laskin、Kimin Lee、Adam Stooke、Lerrel Pinto、Pieter Abbeel、

代码医生工作室

2020-06-16

8130

深度学习相关精选422

https 网络安全强化学习深度学习机器学习

这一年，机器学习领域该关注什么？这部分以看到的两个 Quora 回答，最近读的一些东西来进行讨论。 What Are The Most Promising Areas Of Machine Lear

代码医生工作室

2020-05-09

3710

谷歌、DeepMind强强联手再发布Dreamer：性能远超“前辈”PlaNet，数据效率再创新高

强化学习学习方法

去年，谷歌、DeepMind联手推出基于模型的强化学习智能体PlaNet，能解决各种基于图像的控制任务，性能可媲美当时最先进的无模型智能体，并且在数据效率上提升50倍，为强化学习带来了新的突破。

代码医生工作室

2020-03-24

5150

强化学习的三种范例（Three Paradigms of Reinforcement Learning）

神经网络强化学习编程算法

“基于模型的方法比没有模型的方法更具样本效率。”近年来，这种经常重复的格言在几乎所有基于模型的RL论文（包括Jacob论文）中都引起关注。如此常识，没有人甚至不介意在旁边加上引文，陈述的真实性是不言而喻的。很明显，但是这是错误的。实际上，在很多情况下，两种方法的采样效率是相同的。

代码医生工作室

2019-10-31

6730

DeepMind 一次性开源 3 个新框架

强化学习游戏 https 网络安全 c++

深度强化学习（Deep Reinforcement Learning，DRL）一直是近年来人工智能的一些重大突破的核心。然而，尽管 DRL 有了很大的进步，但由于缺乏工具和库，DRL 方法在主流解决方案中仍然难以应用。因此，DRL 仍然主要是以研究形式存在，并没有在现实世界看到许多采用机器学习的应用方案；而解决这个问题就需要更好的工具和框架。

代码医生工作室

2019-09-25

8400

17种深度强化学习算法用Pytorch实现

编程算法强化学习游戏 python pytorch

深度强化学习已经在许多领域取得了瞩目的成就，并且仍是各大领域受热捧的方向之一。本文推荐一个包含了 17 种深度强化学习算法实现的 PyTorch 代码库。

代码医生工作室

2019-09-17

2.1K0

三四行代码打造元学习核心，PyTorch元学习库L2L现已开源

api pytorch 编程算法强化学习 http

learn2learn 是一个用于实现元学习的 Pytorch 库，我们只需要加几行高层 API，就能为一般的机器学习流程添加元学习能力。例如在元学习 MNIST 案例中，我们可以用 PyTorch 构建整个流程，但只要加上三行 L2L 代码就能打造元学习模型。这三行代码只干三件事：获取元数据集、生成元学习任务、定义元学习模型。

代码医生工作室

2019-09-16

1.5K0

GitHub万星资源：强化学习算法实现，教程代码样样全，还有详细学习规划

强化学习编程算法 http

自从有了强化学习（RL），AI上能星际争霸，下能雅达利称王，让内行人沉醉，让外行人惊奇。

代码医生工作室

2019-08-15

5040

腾讯AI制霸王者荣耀，世界杯5V5 「绝悟」绝杀职业玩家，1天训练强度超人类440年

游戏强化学习

昨日，腾讯AI Lab研发的智能体「绝悟」在王者荣耀世界冠军杯半决赛特设环节，与职业选手职业选手赛区联队的5v5对决中获胜！

代码医生工作室

2019-08-06

6980

没有更多了

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态