腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
新智元
专栏成员
举报
8495
文章
6224629
阅读量
207
订阅数
订阅专栏
申请加入专栏
全部文章(999+)
人工智能(999+)
深度学习(999+)
神经网络(999+)
https(999+)
网络安全(999+)
模型(999+)
机器学习(999+)
其他(864)
编程算法(709)
数据(656)
开源(475)
机器人(429)
NLP 服务(350)
硬件开发(345)
论文(330)
gpt(305)
自动驾驶(300)
性能(285)
工作(270)
游戏(263)
图像处理(252)
系统(249)
测试(222)
无人驾驶(205)
安全(202)
html(195)
视频(186)
openai(182)
chatgpt(179)
强化学习(175)
github(173)
设计(138)
大数据(126)
工具(126)
python(120)
产品(119)
芯片(118)
企业(117)
ios(110)
git(108)
tensorflow(107)
监督学习(107)
腾讯云测试服务(106)
iphone(103)
算法(103)
云计算(98)
开发(98)
数学(95)
科技(92)
LLM(91)
人脸识别(88)
汽车(84)
基础(82)
数据库(79)
架构(79)
网站(78)
网络(78)
数据分析(77)
行业(77)
自动化(76)
苹果(72)
api(69)
meta(67)
框架(67)
图像识别(66)
存储(63)
http(62)
tcp/ip(62)
pytorch(61)
开发者(61)
搜索(57)
渲染(55)
语音识别(53)
ide(53)
搜索引擎(53)
优化(53)
计算机(51)
区块链(50)
物联网(50)
卷积神经网络(49)
linux(48)
机器翻译(46)
sql(45)
编码(45)
函数(45)
服务(44)
arm(43)
语音(43)
医疗(41)
计算机科学(41)
黑客(40)
5g(40)
go(39)
腾讯云开发者社区(39)
gpu(38)
android(37)
效率(37)
token(36)
研发(36)
工程师(34)
事件(34)
音频(34)
facebook(33)
微信(32)
教育(32)
对象(32)
解决方案(32)
windows(31)
学习方法(31)
连接(31)
软件(31)
硬件(31)
程序员(30)
手机(30)
nat(29)
动画(29)
java(28)
翻译(28)
内存(28)
数据挖掘(27)
分布式(27)
编程(27)
元宇宙(27)
keras(25)
数据结构(25)
创业(25)
访问管理(24)
互联网(23)
javascript(22)
c++(21)
打包(21)
云直播(21)
高性能计算(21)
缓存(21)
google(21)
无监督学习(20)
原理(20)
迁移学习(19)
插件(19)
fpga(18)
amd(18)
vr(18)
短视频(17)
prompt(17)
twitter(17)
程序(17)
管理(17)
批量计算(16)
知识图谱(16)
数据处理(16)
服务器(16)
集群(16)
统计(16)
Midjourney(16)
mac os(15)
文件存储(15)
金融(15)
推荐系统(15)
部署(15)
代理(15)
可视化(15)
比特币(14)
计算机视觉(14)
量子计算(14)
软件工程(14)
语音合成(13)
agent(13)
博客(13)
量化(13)
排序(13)
数据中心(13)
.net(12)
apache(12)
虚拟化(12)
百度(12)
华为(12)
漏洞(12)
oracle(11)
容器(11)
浏览器(11)
DevOps 解决方案(10)
电商(10)
模式识别(10)
迁移(10)
变量(10)
布局(10)
地图(10)
内核(10)
摄像头(10)
压缩(10)
异常(10)
隐私(10)
数字货币(9)
php(9)
嵌入式(9)
决策树(9)
小程序(9)
com(9)
it(9)
nlp(9)
教程(9)
数据科学(9)
对象存储(8)
智能硬件(8)
爬虫(8)
unity(8)
rust(8)
app(8)
bug(8)
code(8)
cpu(8)
操作系统(8)
供应链(8)
c 语言(7)
node.js(7)
系统架构(7)
架构设计(7)
acm(7)
aigc(7)
gan(7)
video(7)
编程语言(7)
工作流(7)
集合(7)
技巧(7)
脚本(7)
流量(7)
面试(7)
协议(7)
虚拟现实(7)
脑机接口(7)
费用中心(6)
数据万象(6)
swift(6)
css(6)
unix(6)
spring(6)
SSL 证书(6)
文字识别(6)
gui(6)
numpy(6)
安全漏洞(6)
sdk(6)
max(6)
model(6)
pdf(6)
ps(6)
reddit(6)
编译(6)
表格(6)
登录(6)
接口(6)
配置(6)
通信(6)
access(5)
matlab(5)
数据加密服务(5)
shell(5)
线性回归(5)
智能客服机器人(5)
acl(5)
adobe(5)
chat(5)
mac(5)
zero(5)
软件开发(5)
实践(5)
索引(5)
腾讯(5)
图表(5)
原型(5)
云服务(5)
重构(5)
AI生图(5)
云点播(4)
perl(4)
r 语言(4)
typescript(4)
汇编语言(4)
日志服务(4)
内容理解(4)
express(4)
互联网医疗(4)
spark(4)
html5(4)
正则表达式(4)
asp(4)
单元测试(4)
kernel(4)
智能教育(4)
云游戏(4)
智能制造(4)
智能家居(4)
cs(4)
epoch(4)
key(4)
nvidia(4)
office(4)
text(4)
ui(4)
阿里巴巴(4)
反射(4)
加密(4)
监控(4)
字符串(4)
云镜(主机安全)(3)
创业扶持(3)
ruby(3)
bash(3)
jquery(3)
json(3)
opengl(3)
单片机(3)
maven(3)
ubuntu(3)
容器镜像服务(3)
腾讯git代码托管(工蜂)(3)
人脸融合(3)
mongodb(3)
出行(3)
数据安全(3)
erp(3)
opencv(3)
npm(3)
seo(3)
kotlin(3)
uml(3)
数据可视化(3)
canvas(3)
processing(3)
信息流(3)
视频分析(3)
ascii(3)
apple(3)
character(3)
cto(3)
cuda(3)
image(3)
intel(3)
kaggle(3)
linkedin(3)
microsoft(3)
na(3)
next(3)
overflow(3)
pascal(3)
project(3)
self(3)
stack(3)
web(3)
web3(3)
youtube(3)
笔记(3)
编译器(3)
播客(3)
产品经理(3)
低代码(3)
客户端(3)
排序算法(3)
线程(3)
游戏开发(3)
游戏引擎(3)
云数据库 Redis(2)
postgresql(2)
jar(2)
windows server(2)
bash 指令(2)
delphi(2)
GPU 云服务器(2)
NAT 网关(2)
短信(2)
混合云解决方案(2)
kubernetes(2)
devops(2)
运维(2)
面向对象编程(2)
二叉树(2)
cdn(2)
markdown(2)
rpc(2)
hbase(2)
nest(2)
聚类算法(2)
验证码(2)
联邦学习(2)
图像标签(2)
视频理解(2)
智慧交通(2)
ada(2)
auto(2)
cell(2)
el(2)
embedding(2)
gps(2)
highlight(2)
hugo(2)
instagram(2)
interpreter(2)
io(2)
jpeg(2)
latex(2)
lstm(2)
mask(2)
math(2)
paypal(2)
physics(2)
space(2)
status(2)
store(2)
transactions(2)
uber(2)
z3(2)
编辑器(2)
边缘计算(2)
递归(2)
二进制(2)
二维码(2)
高性能(2)
后端(2)
计算机图形学(2)
交换机(2)
镜像(2)
跨域(2)
路由(2)
树莓派(2)
调试(2)
同步(2)
推荐算法(2)
虚拟机(2)
移动端(2)
语法(2)
远程办公(2)
远程工作(2)
增强现实(2)
终端(2)
主机(2)
解释器(2)
LoRa(2)
云服务器(1)
内容分发网络 CDN(1)
云 API(1)
维纳斯(1)
(1)
认证考试(1)
objective-c(1)
xcode(1)
lua(1)
bootstrap(1)
regex(1)
angularjs(1)
vue.js(1)
react(1)
jquery ui(1)
ajax(1)
symfony(1)
memcached(1)
mvc(1)
django(1)
web.py(1)
ruby on rails(1)
vba(1)
中文分词(1)
全文检索(1)
apt-get(1)
mapreduce(1)
FPGA 云服务器(1)
黑石物理服务器(1)
云数据迁移(1)
命令行工具(1)
云数据库 MongoDB(1)
TDSQL MySQL 版(1)
海外加速(1)
全站加速网络(1)
检测工具(1)
cci 持续集成(1)
腾讯云小微(1)
腾讯移动分析(1)
云推荐引擎(1)
双螺旋(1)
通用视频解决方案(1)
数据备份(1)
日志数据(1)
金融风控(1)
在线旅游(1)
智慧物流(1)
生物基因(1)
智慧零售(1)
智能交通(1)
工业物联(1)
electron(1)
redux(1)
rxjs(1)
移动开发(1)
互联网金融(1)
数据迁移(1)
hadoop(1)
jvm(1)
ssh(1)
wordpress(1)
dns(1)
grep(1)
flash(1)
ddos(1)
敏捷开发(1)
jenkins(1)
ntp(1)
sas(1)
haskell(1)
企业组织(1)
kafka(1)
机器学习平台(1)
密钥管理服务(1)
jupyter notebook(1)
分类算法(1)
unicode(1)
腾讯会议(1)
dart(1)
性能测试(1)
模型测试(1)
实时监控(1)
内容识别(1)
应用安全开发(1)
Elasticsearch Service(1)
数据集成(1)
智能推荐平台(1)
图像分析(1)
代码签名证书(1)
数据湖(1)
手机行业(1)
声音定制(1)
腾讯云(1)
absolute(1)
ads(1)
airbnb(1)
alexa(1)
alignment(1)
alpha(1)
analysis(1)
analytics(1)
apollo(1)
app开发(1)
arcgis(1)
automation(1)
aws(1)
bayesian(1)
blender(1)
break(1)
build(1)
byte(1)
cad(1)
cascade(1)
case(1)
cat(1)
charles(1)
chrome(1)
commit(1)
communication(1)
confluence(1)
connect(1)
connection(1)
cs50(1)
csh(1)
csv(1)
data(1)
ddl(1)
debug(1)
decoding(1)
delay(1)
dojo(1)
double(1)
emoji(1)
enterprise(1)
excel(1)
feed(1)
ffmpeg(1)
figure(1)
form(1)
frame(1)
frequency(1)
fuchsia(1)
gif(1)
gis(1)
glm(1)
global(1)
graph(1)
handle(1)
harmonyos(1)
hololens(1)
identity(1)
instance(1)
ip(1)
ipad(1)
jetbrains(1)
kinect(1)
lex(1)
live(1)
lm(1)
md5(1)
medium(1)
minecraft(1)
mobile(1)
models(1)
mq(1)
nebula(1)
nft(1)
nose(1)
object(1)
ocr(1)
patch(1)
pic(1)
pivot(1)
pixel(1)
poi(1)
point(1)
postscript(1)
powerpoint(1)
ram(1)
resolution(1)
robotics(1)
salesforce(1)
sandbox(1)
scaling(1)
server(1)
sf(1)
size(1)
slack(1)
spatial(1)
ssl(1)
sso(1)
super(1)
surface(1)
tensor(1)
theory(1)
torch(1)
usb(1)
uwp(1)
vector(1)
verification(1)
vim(1)
whatsapp(1)
wireless(1)
word(1)
wwdc(1)
x86(1)
百度地图(1)
遍历(1)
表单(1)
程序设计(1)
代码质量(1)
多线程(1)
分页(1)
工程化(1)
工具类(1)
公众号(1)
后台(1)
架构师(1)
兼容性(1)
进程(1)
开发环境(1)
开源框架(1)
跨平台(1)
快捷键(1)
快应用(1)
流媒体(1)
乱码(1)
密码学(1)
敏捷(1)
命令行(1)
内存管理(1)
逆向工程(1)
年终总结(1)
前端(1)
求职(1)
全栈(1)
日志(1)
上传图片(1)
设计模式(1)
数据存储(1)
数组(1)
特效(1)
图形学(1)
推送(1)
拖拽(1)
网络爬虫(1)
文件上传(1)
小游戏(1)
异步(1)
以太坊(1)
用户体验(1)
云平台(1)
状态机(1)
最佳实践(1)
世界机器人大赛(1)
自然语言处理(1)
时序预测(1)
数字孪生(1)
语音助手(1)
人机交互(1)
游戏AI(1)
向量数据库(1)
3D建模(1)
代码生成工具(1)
图像理解(1)
搜索文章
搜索
搜索
关闭
LeCun新作:分层世界模型,数据驱动的人型机器人控制
强化学习
机器人
模型
数据
算法
不过,要想像人类一样思考和行动,对于机器人,特别是人型机器人来说,仍是个艰巨的工程问题。
新智元
2024-06-05
135
0
Science Robotics封面!DeepMind强化学习打造超一流机器人球员
robotics
代理
游戏
强化学习
机器人
AI和机器人专家的长远目标,是创造出具有一般具身智能的代理,它们能够像动物或人类一样,在物理世界中灵活、巧妙地行动。
新智元
2024-04-13
190
0
「大模型+强化学习」最新综述!港中文深圳130余篇论文:详解四条主流技术路线
代理
函数
论文
模型
强化学习
虽然RL在允许大量试错的复杂电子游戏环境中实现了超越人类的决策能力(例如王者荣耀,Dota 2等),但很难在包含大量自然语言和视觉图像的现实复杂应用中落地,原因包括但不限于:数据获取困难、样本利用率低、多任务学习能力差、泛化性差、稀疏奖励等。
新智元
2024-04-12
1.3K
0
刷榜「代码生成」任务!复旦等发布StepCoder框架:从编译器反馈信号中强化学习
模型
优化
强化学习
编译器
框架
大型语言模型(LLMs)的发展极大地推动了代码生成领域的发展,之前有工作将强化学习(RL)与编译器的反馈信号集成在一起,用于探索LLMs的输出空间,以提高代码生成质量。
新智元
2024-03-25
200
0
可控核聚变新里程碑!AI成功预测等离子体撕裂登Nature,清洁能源「圣杯」更近一步
神经网络
强化学习
模型
数据
算法
而最近,普林斯顿团队用AI提前300毫秒预测了核聚变等离子不稳定态,这个时间,就足够约束磁场调整应对等离子体的逃逸!
新智元
2024-02-26
179
0
OpenAI神秘Q*项目解密!诞生30+年「Q学习」算法引全球网友终极猜想
人工智能
强化学习
openai
数据
算法
刚刚过去的一天,OpenAI被爆出惊天内幕:一个名为Q*(Q-Star)的项目已现AGI雏形。
新智元
2023-11-24
1.4K
0
北大全新「机械手」算法:辅助花式抓杯子,GTX 1650实现150fps推断|NeurIPS 2023
强化学习
论文
模型
数据
算法
北京大学董豪团队通过将扩散模型和强化学习结合,使机械手能根据人手腕部的移动轨迹,自适应的抓取物体的不同部位,满足人类多样化的抓取需求,目前该工作已被NeurIPS 2023接收。
新智元
2023-11-19
196
0
机器人瓦力来了!迪士尼亮出新机器人,用RL学习走路,还能进行社交互动
强化学习
机器人
动画
开发
系统
这个可爱的小机器人由迪士尼研究团队开发,在底特律举行的2023年IEEE/RSJ智能机器人和系统国际会议(IROS)上被展示。
新智元
2023-10-20
254
0
RLHF再也不需要人类了!谷歌团队研究证明,AI标注已达人类水平
人工智能
强化学习
论文
模型
数据
谷歌团队的最新研究提出了,用大模型替代人类,进行偏好标注,也就是AI反馈强化学习(RLAIF)。
新智元
2023-09-09
354
0
用多模态世界模型预测未来!UC伯克利全新AI智能体,精确理解人类语言,刷新SOTA
人工智能
强化学习
架构
模型
数据
但人类大部分时间的语言表达,却远远超出了指令的范围。比如:「我们好像没有牛奶了」......
新智元
2023-09-09
234
0
无需人类反馈即可对齐!田渊栋团队新作RLCD:无害型、有益性、大纲写作全面超越基线模型
强化学习
模型
设计
数据
性能
随着大模型的能力越来越强,如何低成本地让模型的输出更符合人类的偏好以及社会的公共价值观,就显得尤为重要。
新智元
2023-09-09
217
0
「人造太阳」精准放电!DeepMind实现AI可控核聚变新突破
强化学习
迁移学习
函数
网络
性能
秘密研发3年,DeepMind去年宣称,首次成功用AI控制「托卡马克」内部等离子体。其重磅成果登上Nature。
新智元
2023-08-07
283
0
2023 ICML大会来了!一文速览谷歌DeepMind的最新研究
机器学习
人工智能
强化学习
论文
模型
2023年的国际机器学习大会(International Conferenceon Machine Learning,简称ICML)在夏威夷檀香山举办。
新智元
2023-08-07
327
0
一文看尽系列:分层强化学习(HRL)经典论文全面总结
强化学习
变量
函数
论文
状态机
---- 新智元报道 来源:深度强化学习实验室 编辑:SF 【新智元导读】在解决一个复杂问题时,我们往往会将其分解为若干个容易解决的子问题,分而治之,分层的思想正是来源于此。 分层强化算是强化学习领域比较流行的研究方向,每年顶会论文中都有一定比例的分层论文。分层主要解决的是稀疏reward的问题,实际的强化问题往往reward很稀疏,再加上庞大的状态空间和动作空间组合,导致直接硬训往往训不出来,遇到头铁的agent更是如此。 个人理解目前分层的解决手段大体分两种,一种是基于目标的(goal-re
新智元
2023-05-22
1.5K
0
丘成桐拉来又一菲尔茨奖得主全职加盟清华!年轻数学家40岁获奖,或带领军班、英才班本科生
强化学习
https
论文
模型
数学
---- 新智元报道 来源:清华大学、知乎 编辑:小匀 【新智元导读】重磅消息,2018年菲尔兹奖得主、英国剑桥大学Caucher Birkar教授已成为清华大学丘成桐数学科学中心的一名教授。其个人主页已显示:正在清华大学执教。这也是继丘成桐之后,清华大学迎来的第二位菲尔茨奖得主。 菲尔兹奖得主加盟清华大学,还是全职的那种! 是谁是谁? 近日,根据著名数学家、2018年菲尔兹奖得主Caucher Birkar的主页,他已加盟清华大学。 剑桥大学 Caucher Birkar教授个人主页 据悉,他
新智元
2023-05-22
615
0
DeepMind大神Silver联手Sutton论证无限猴子原理:用强化学习就能搞定通用人工智能!
人工智能
强化学习
代理
论文
原理
---- 新智元报道 来源:sciencedirect 编辑:Emil 好困 【新智元导读】DeepMind最近研究了一下大自然,于是决定把「达尔文主义」应用在AI上面。首先给AI设定一个奖励,等AI学会如何把奖励做到最大化,它就是个出色的人工智能代理了。 人工智能发展了这么久,终于产生了包括卷积,注意力,全连接等各种机制。 有趣的是,最近的研究反而搞起了「这些机制我们都不需要」的创新。 例如苹果发表的一篇论文表示Transformer不需要注意力机制。 在这个方面,DeepMind也不甘落后,发
新智元
2023-05-22
264
0
2022 QS世界大学排名发布!MIT霸榜,清北冲上全球前20
医疗
强化学习
论文
模型
苹果
---- 新智元报道 来源:QS 编辑:小匀、亚新 【新智元导读】全球知名排名机构QS发布《2022 QS世界大学排名》。新晋榜单中,排名前十的高校分别来自美国、英国和瑞士。MIT连续十年蝉联世界第一;TOP100榜单中共有6所内地高校上榜,清华大学依旧领先,世界第17名;北大位列第18名,这是其在2006年后,首次进入世界前20名。 最新2022 QS世界大学排名来了! 今年的排名共有1300所院校上榜,是QS有史以来规模最大的一次世界大学排名。 在此次排名中,首次有2所中国大陆大学跻身世界TO
新智元
2023-05-22
349
0
图灵奖得主Bengio又出新论文,用强化学习提升模型泛化性,Reddit崩溃:idea撞车了!
强化学习
reddit
工作
论文
模型
---- 新智元报道 来源:reddit 编辑:LRS 【新智元导读】Bengio又发论文啦,这次瞄准机器学习的泛化性,用强化学习的方法平衡训练数据和测试数据之间的分布差异!Reddit小哥哭诉idea撞车? 机器学习的一个重要研究就是提升模型的泛化性,并且在训练模型的时候一个假设,即训练集数据的分布和测试集相同。 然而,模型面对的输入数据来自于真实世界,也就是不稳定的、会进化的、数据分布会随环境发生变化。 虽然对人类来说,这个问题十分好解决,例如网络用语层出不穷,但每个人都能很快地接受,并熟练地
新智元
2023-05-22
169
0
师从俞扬教授,中国团队再次夺冠!3个月登顶这个最难顶级决策类算法竞赛
人工智能
强化学习
设计
算法
系统
---- 新智元报道 编辑:QQ、好困 【新智元导读】L2RPN-ICAPS放榜啦!法国电网公司、美国电力研究学会、美国西北太平洋国家实验室等国际能源机构和著名学术机构联合举办,国内外数十支队伍参赛,多家研究机构参与,最终且看冠军花落谁家! 随着全球能源危机的持续加剧,电力系统安全稳定问题日益突出,电网调控面临前所未有的挑战,如何借助人工智能新技术解决调控困境成为电网优化调度领域亟需解决的问题,为此全球顶级决策类竞赛L2RPN-ICAPS应运而生。 2021年是该系列竞赛的第四届,前三届参赛冠军依
新智元
2023-05-22
528
0
强化学习AI能带你1打5吗?MIT新研究:AI并不是人类的最佳队友
人工智能
游戏
强化学习
机器人
算法
---- 新智元报道 编辑:LRS 【新智元导读】强化学习的AI在对抗游戏中表现十分强力,但被虐的只有人类玩家。如果这么强的AI做了队友又该怎么样?MIT最近研究表明,AI和人类玩家之间的配合可以说是没有配合了,根本看不懂队友给的各种暗示信息! 强化学习的AI在围棋、星际争霸、王者荣耀等游戏以绝对的优势碾压了人类玩家,也证明了思维能力可以通过模拟来得到。 但如果这么强的AI成为了你的队友,能被带飞吗? MIT林肯实验室的研究人员最近的在纸牌游戏Hanabi(花火)中人类和AI agenet之间的合
新智元
2023-05-22
255
0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档