腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
相约机器人
专栏作者
举报
664
文章
1033304
阅读量
52
订阅数
订阅专栏
申请加入专栏
全部文章
https
网络安全
神经网络
深度学习
机器学习
编程算法
人工智能
github
python
git
开源
pytorch
NLP 服务
tensorflow
图像处理
api
http
图像识别
numpy
腾讯云测试服务
keras
分布式
强化学习
机器人
游戏
javascript
html
数据库
matlab
迁移学习
数据分析
windows
文件存储
卷积神经网络
监督学习
人脸识别
自动驾驶
bash
sql
ide
知识图谱
网站
无人驾驶
推荐系统
大数据
c++
批量计算
决策树
tcp/ip
数据结构
语音识别
flask
缓存
数据处理
其他
java
css
json
arm
渲染
shell
spark
opencv
scikit-learn
数据可视化
php
linux
文字识别
DevOps 解决方案
存储
面向对象编程
线性回归
kernel
安全
腾讯云开发者社区
学习方法
费用中心
数据挖掘
ios
go
node.js
android
硬件开发
打包
搜索引擎
容器镜像服务
mapreduce
访问管理
全站加速网络
医疗
svg
容器
serverless
黑客
flash
无监督学习
特征工程
性能测试
汽车
adobe
height
xcode
c 语言
actionscript
scala
r 语言
react
highcharts
单片机
symfony
svn
中文分词
apache
bash 指令
spring
黑石物理服务器
命令行工具
TDSQL MySQL 版
图片标签
语音合成
机器翻译
腾讯专有云 PaaS 平台
企业
生物基因
智能硬件
redux
rxjs
爬虫
jvm
grep
单元测试
markdown
anaconda
openapi
webgl
敏感数据处理
云计算
聚类算法
jupyter notebook
腾讯云图数据可视化
隐私计算
algorithm
backbone
center
detection
effects
filter
form
google
gpt
key
live
max
medium
mocha
model
nas
nvidia
padding
pixel
root
scale
self
spatial
tensor
tm
vector
width
word
工程化
行业
互联网
视频
搜索
音频
搜索文章
搜索
搜索
关闭
加州大学伯克利分校研究人员推出无监督强化学习基准 (URLB)
编程算法
强化学习
https
网络安全
php
强化学习 (RL) 是一种强大的人工智能范式,用于处理各种问题,包括自动驾驶汽车控制、数字助理和资源分配等。然而即使是当今最好的 RL 代理也很窄。目前大部分 RL 算法只能解决他们所训练的单一工作,没有跨任务或跨域泛化能力。
代码医生工作室
2021-12-29
364
0
Facebook AI 推出“SaLinA”:一个用于实现包括强化学习算法在内的顺序决策模型的轻量级库
强化学习
深度学习
https
网络安全
编程算法
深度学习库非常适合促进复杂可微函数的实现。这些函数通常具有 f(x) → y 之类的形状,其中 x 是一组输入张量,y 是通过对这些输入执行多次计算而产生的输出张量。为了实现一个新的 f 函数并创建一个新的原型,需要通过组合运算符组装各种块(或模块)。尽管过程简单,但这种方法无法处理顺序决策方法的实现。经典平台非常适合以有效的方式管理信息的获取、处理和转换。
代码医生工作室
2021-10-21
472
0
DeepMind的新强化学习系统是迈向通用AI的下一步吗?
游戏
强化学习
机器学习
深度学习
人工智能
对于精通围棋、星际争霸 2 以及其他游戏的深度强化学习模型而言,关键的挑战之一是它们无法将其能力泛化到训练领域之外。这种限制使得将这些系统应用到现实世界中变得非常困难,在现实世界中,情况比训练 AI 模型的环境复杂得多且不可预测。
代码医生工作室
2021-09-30
355
0
加州大学伯克利分校研究人员开源RAD来改进强化学习算法
编程算法
强化学习
腾讯云测试服务
php
命令行工具
作者 | Michael Laskin、Kimin Lee、Adam Stooke、Lerrel Pinto、Pieter Abbeel、
代码医生工作室
2020-06-16
813
0
深度学习相关精选422
https
网络安全
强化学习
深度学习
机器学习
这一年,机器学习领域该关注什么? 这部分以看到的两个 Quora 回答,最近读的一些东西来进行讨论。 What Are The Most Promising Areas Of Machine Lear
代码医生工作室
2020-05-09
371
0
谷歌、DeepMind强强联手再发布Dreamer:性能远超“前辈”PlaNet,数据效率再创新高
强化学习
学习方法
去年,谷歌、DeepMind联手推出基于模型的强化学习智能体PlaNet,能解决各种基于图像的控制任务,性能可媲美当时最先进的无模型智能体,并且在数据效率上提升50倍,为强化学习带来了新的突破。
代码医生工作室
2020-03-24
515
0
强化学习的三种范例(Three Paradigms of Reinforcement Learning)
神经网络
强化学习
编程算法
“基于模型的方法比没有模型的方法更具样本效率。”近年来,这种经常重复的格言在几乎所有基于模型的RL论文(包括Jacob论文)中都引起关注。如此常识,没有人甚至不介意在旁边加上引文,陈述的真实性是不言而喻的。很明显,但是这是错误的。实际上,在很多情况下,两种方法的采样效率是相同的。
代码医生工作室
2019-10-31
673
0
DeepMind 一次性开源 3 个新框架
强化学习
游戏
https
网络安全
c++
深度强化学习(Deep Reinforcement Learning,DRL)一直是近年来人工智能的一些重大突破的核心。然而,尽管 DRL 有了很大的进步,但由于缺乏工具和库,DRL 方法在主流解决方案中仍然难以应用。因此,DRL 仍然主要是以研究形式存在,并没有在现实世界看到许多采用机器学习的应用方案;而解决这个问题就需要更好的工具和框架。
代码医生工作室
2019-09-25
840
0
17种深度强化学习算法用Pytorch实现
编程算法
强化学习
游戏
python
pytorch
深度强化学习已经在许多领域取得了瞩目的成就,并且仍是各大领域受热捧的方向之一。本文推荐一个包含了 17 种深度强化学习算法实现的 PyTorch 代码库。
代码医生工作室
2019-09-17
2.1K
0
三四行代码打造元学习核心,PyTorch元学习库L2L现已开源
api
pytorch
编程算法
强化学习
http
learn2learn 是一个用于实现元学习的 Pytorch 库,我们只需要加几行高层 API,就能为一般的机器学习流程添加元学习能力。例如在元学习 MNIST 案例中,我们可以用 PyTorch 构建整个流程,但只要加上三行 L2L 代码就能打造元学习模型。这三行代码只干三件事:获取元数据集、生成元学习任务、定义元学习模型。
代码医生工作室
2019-09-16
1.5K
0
GitHub万星资源:强化学习算法实现,教程代码样样全,还有详细学习规划
强化学习
编程算法
http
自从有了强化学习(RL),AI上能星际争霸,下能雅达利称王,让内行人沉醉,让外行人惊奇。
代码医生工作室
2019-08-15
504
0
腾讯AI制霸王者荣耀,世界杯5V5 「绝悟」绝杀职业玩家,1天训练强度超人类440年
游戏
强化学习
昨日,腾讯AI Lab研发的智能体「绝悟」在王者荣耀世界冠军杯半决赛特设环节,与职业选手职业选手赛区联队的5v5对决中获胜!
代码医生工作室
2019-08-06
698
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档