首页
学习
活动
专区
工具
TVP
发布

相约机器人

专栏作者
664
文章
1033304
阅读量
52
订阅数
加州大学伯克利分校研究人员推出无监督强化学习基准 (URLB)
强化学习 (RL) 是一种强大的人工智能范式,用于处理各种问题,包括自动驾驶汽车控制、数字助理和资源分配等。然而即使是当今最好的 RL 代理也很窄。目前大部分 RL 算法只能解决他们所训练的单一工作,没有跨任务或跨域泛化能力。
代码医生工作室
2021-12-29
3640
Facebook AI 推出“SaLinA”:一个用于实现包括强化学习算法在内的顺序决策模型的轻量级库
深度学习库非常适合促进复杂可微函数的实现。这些函数通常具有 f(x) → y 之类的形状,其中 x 是一组输入张量,y 是通过对这些输入执行多次计算而产生的输出张量。为了实现一个新的 f 函数并创建一个新的原型,需要通过组合运算符组装各种块(或模块)。尽管过程简单,但这种方法无法处理顺序决策方法的实现。经典平台非常适合以有效的方式管理信息的获取、处理和转换。
代码医生工作室
2021-10-21
4720
DeepMind的新强化学习系统是迈向通用AI的下一步吗?
对于精通围棋、星际争霸 2 以及其他游戏的深度强化学习模型而言,关键的挑战之一是它们无法将其能力泛化到训练领域之外。这种限制使得将这些系统应用到现实世界中变得非常困难,在现实世界中,情况比训练 AI 模型的环境复杂得多且不可预测。
代码医生工作室
2021-09-30
3550
加州大学伯克利分校研究人员开源RAD来改进强化学习算法
作者 | Michael Laskin、Kimin Lee、Adam Stooke、Lerrel Pinto、Pieter Abbeel、
代码医生工作室
2020-06-16
8130
深度学习相关精选422
这一年,机器学习领域该关注什么? 这部分以看到的两个 Quora 回答,最近读的一些东西来进行讨论。 What Are The Most Promising Areas Of Machine Lear
代码医生工作室
2020-05-09
3710
谷歌、DeepMind强强联手再发布Dreamer:性能远超“前辈”PlaNet,数据效率再创新高
去年,谷歌、DeepMind联手推出基于模型的强化学习智能体PlaNet,能解决各种基于图像的控制任务,性能可媲美当时最先进的无模型智能体,并且在数据效率上提升50倍,为强化学习带来了新的突破。
代码医生工作室
2020-03-24
5150
强化学习的三种范例(Three Paradigms of Reinforcement Learning)
“基于模型的方法比没有模型的方法更具样本效率。”近年来,这种经常重复的格言在几乎所有基于模型的RL论文(包括Jacob论文)中都引起关注。如此常识,没有人甚至不介意在旁边加上引文,陈述的真实性是不言而喻的。很明显,但是这是错误的。实际上,在很多情况下,两种方法的采样效率是相同的。
代码医生工作室
2019-10-31
6730
DeepMind 一次性开源 3 个新框架
深度强化学习(Deep Reinforcement Learning,DRL)一直是近年来人工智能的一些重大突破的核心。然而,尽管 DRL 有了很大的进步,但由于缺乏工具和库,DRL 方法在主流解决方案中仍然难以应用。因此,DRL 仍然主要是以研究形式存在,并没有在现实世界看到许多采用机器学习的应用方案;而解决这个问题就需要更好的工具和框架。
代码医生工作室
2019-09-25
8400
17种深度强化学习算法用Pytorch实现
深度强化学习已经在许多领域取得了瞩目的成就,并且仍是各大领域受热捧的方向之一。本文推荐一个包含了 17 种深度强化学习算法实现的 PyTorch 代码库。
代码医生工作室
2019-09-17
2.1K0
三四行代码打造元学习核心,PyTorch元学习库L2L现已开源
learn2learn 是一个用于实现元学习的 Pytorch 库,我们只需要加几行高层 API,就能为一般的机器学习流程添加元学习能力。例如在元学习 MNIST 案例中,我们可以用 PyTorch 构建整个流程,但只要加上三行 L2L 代码就能打造元学习模型。这三行代码只干三件事:获取元数据集、生成元学习任务、定义元学习模型。
代码医生工作室
2019-09-16
1.5K0
GitHub万星资源:强化学习算法实现,教程代码样样全,还有详细学习规划
自从有了强化学习(RL),AI上能星际争霸,下能雅达利称王,让内行人沉醉,让外行人惊奇。
代码医生工作室
2019-08-15
5040
腾讯AI制霸王者荣耀,世界杯5V5 「绝悟」绝杀职业玩家,1天训练强度超人类440年
昨日,腾讯AI Lab研发的智能体「绝悟」在王者荣耀世界冠军杯半决赛特设环节,与职业选手职业选手赛区联队的5v5对决中获胜!
代码医生工作室
2019-08-06
6980
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档