腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
机器之心
专栏成员
举报
9145
文章
6891210
阅读量
281
订阅数
订阅专栏
申请加入专栏
全部文章(999+)
人工智能(999+)
模型(999+)
深度学习(999+)
神经网络(999+)
机器学习(999+)
https(999+)
数据(999+)
其他(999+)
网络安全(999+)
编程算法(963)
论文(709)
开源(633)
NLP 服务(538)
性能(419)
机器人(417)
系统(352)
视频(326)
强化学习(321)
图像处理(307)
工作(304)
算法(300)
python(281)
github(259)
测试(233)
自动驾驶(228)
游戏(224)
设计(222)
网络(219)
gpt(218)
框架(210)
优化(207)
安全(202)
科技(194)
架构(190)
硬件开发(187)
chatgpt(181)
pytorch(177)
tensorflow(174)
产品(154)
监督学习(149)
工具(142)
git(140)
函数(140)
基础(138)
图像识别(133)
开发(129)
卷积神经网络(128)
开发者(126)
芯片(126)
企业(124)
数学(122)
腾讯云测试服务(120)
行业(117)
无人驾驶(116)
openai(116)
语音识别(111)
api(110)
搜索(108)
汽车(107)
分布式(96)
数据库(92)
服务(90)
内存(90)
数据分析(88)
渲染(85)
linux(84)
http(84)
大数据(82)
ide(78)
tcp/ip(78)
声纹识别(76)
网站(75)
效率(75)
存储(72)
自动化(70)
云计算(70)
学习方法(68)
编码(68)
html(66)
研发(65)
sql(64)
keras(64)
人脸识别(63)
数据结构(63)
语音(61)
迁移学习(60)
苹果(60)
计算机(59)
腾讯(57)
隐私计算(56)
手机(55)
机器翻译(54)
缓存(51)
gpu(51)
meta(51)
计算机科学(51)
无监督学习(49)
token(49)
文件存储(48)
对象(48)
LLM(48)
nat(47)
编程(47)
华为(47)
音频(47)
推荐系统(45)
解决方案(44)
工程师(43)
搜索引擎(42)
知识图谱(42)
css(41)
软件(41)
部署(40)
百度(38)
压缩(38)
java(37)
打包(37)
连接(37)
医疗(36)
windows(36)
量化(36)
javascript(35)
公众号(35)
计算机视觉(35)
硬件(35)
数据挖掘(34)
微信(34)
c++(33)
腾讯云开发者社区(33)
迁移(33)
翻译(33)
ios(32)
黑客(31)
创业(31)
arm(30)
批量计算(29)
联邦学习(29)
iphone(28)
numpy(28)
go(27)
云直播(27)
变量(27)
事件(25)
决策树(24)
数据处理(24)
教育(24)
实践(24)
程序(23)
区块链(22)
短视频(22)
nlp(22)
动画(22)
服务器(22)
物联网(21)
fpga(21)
com(21)
编程语言(21)
统计(21)
原理(21)
apache(19)
prompt(19)
插件(19)
语音合成(18)
kernel(18)
5g(18)
互联网(18)
可视化(18)
隐私(18)
程序员(17)
内核(17)
文字识别(16)
markdown(16)
aigc(16)
管理(16)
接口(16)
摄像头(16)
mac os(15)
嵌入式(15)
金融(15)
acl(15)
gan(15)
集合(15)
量子计算(15)
排序(15)
图表(15)
重构(15)
android(14)
opencv(14)
数据可视化(14)
cpu(14)
表格(14)
通信(14)
博客(13)
漏洞(13)
.net(12)
高性能计算(12)
电商(12)
数据安全(12)
爬虫(12)
架构设计(12)
app(12)
编译(12)
地图(12)
数据中心(12)
bash(11)
matlab(11)
访问管理(11)
gui(11)
agent(11)
facebook(11)
脚本(11)
原型(11)
r 语言(10)
node.js(10)
ajax(10)
容器(10)
运维(10)
面向对象编程(10)
线性回归(10)
flash(10)
code(10)
工作流(10)
技巧(10)
教程(10)
面试(10)
配置(10)
数据科学(10)
单片机(9)
容器镜像服务(9)
模式识别(9)
系统架构(9)
lstm(9)
video(9)
操作系统(9)
代理(9)
阿里巴巴(9)
高性能(9)
模块化(9)
索引(9)
协议(9)
异常(9)
元宇宙(9)
php(8)
spring(8)
正则表达式(8)
小程序(8)
腾讯云(8)
acm(8)
bug(8)
scaling(8)
编译器(8)
布局(8)
反射(8)
集群(8)
开源框架(8)
浏览器(8)
入门(8)
软件工程(8)
树莓派(8)
特效(8)
erp(7)
scikit-learn(7)
processing(7)
虚拟化(7)
jupyter notebook(7)
智能创作(7)
adobe(7)
bit(7)
image(7)
ocr(7)
vr(7)
供应链(7)
同步(7)
终端(7)
LoRa(7)
Midjourney(7)
swift(6)
c 语言(6)
json(6)
bash 指令(6)
单元测试(6)
智能客服机器人(6)
graph(6)
patch(6)
pdf(6)
客户端(6)
路由(6)
密码学(6)
日志(6)
移动端(6)
语法(6)
oracle(5)
中文分词(5)
SSL 证书(5)
人脸核身(5)
内容理解(5)
视频处理(5)
express(5)
serverless(5)
devops(5)
spark(5)
ssh(5)
unity(5)
安全漏洞(5)
视频分析(5)
cuda(5)
google(5)
max(5)
models(5)
office(5)
ps(5)
text(5)
递归(5)
后端(5)
计算机图形学(5)
进程(5)
逆向工程(5)
软件开发(5)
图形学(5)
音视频(5)
字符串(5)
脑机接口(5)
比特币(4)
xcode(4)
scala(4)
ubuntu(4)
全站加速网络(4)
DevOps 解决方案(4)
智慧物流(4)
二叉树(4)
rpc(4)
特征工程(4)
sdk(4)
rust(4)
模型测试(4)
视频理解(4)
智慧交通(4)
智能制造(4)
cto(4)
debug(4)
macbook(4)
self(4)
youtube(4)
笔记(4)
二维码(4)
加密(4)
兼容性(4)
流量(4)
拖拽(4)
解释器(4)
费用中心(3)
云服务器(3)
数据万象(3)
数字货币(3)
ruby(3)
access(3)
unix(3)
nginx(3)
apt-get(3)
mapreduce(3)
日志服务(3)
TDSQL MySQL 版(3)
NAT 网关(3)
腾讯云小微(3)
kubernetes(3)
shell(3)
dns(3)
asp(3)
cdn(3)
微服务(3)
canvas(3)
机器学习平台(3)
性能测试(3)
腾讯广告算法大赛(3)
云游戏(3)
流计算 Oceanus(3)
alpha(3)
amd(3)
cs(3)
detection(3)
epoch(3)
excel(3)
glm(3)
instance(3)
intel(3)
interpreter(3)
it(3)
jupyter(3)
keynote(3)
layer(3)
map(3)
mask(3)
mobile(3)
nvidia(3)
object(3)
overflow(3)
pipeline(3)
reddit(3)
robotics(3)
ssm(3)
uber(3)
登录(3)
二进制(3)
跨域(3)
敏捷(3)
排序算法(3)
前端(3)
全栈(3)
调试(3)
异步(3)
云服务(3)
智慧城市(3)
对象存储(2)
perl(2)
c#(2)
lua(2)
react(2)
jquery ui(2)
xml(2)
jquery(2)
qt(2)
云数据库 Redis(2)
django(2)
windows server(2)
黑石物理服务器(2)
命令行工具(2)
检测工具(2)
短信(2)
双螺旋(2)
生物基因(2)
智能交通(2)
出行(2)
智能硬件(2)
svg(2)
互联网金融(2)
html5(2)
hadoop(2)
jvm(2)
yum(2)
selenium(2)
聚类算法(2)
angel(2)
腾讯会议(2)
dart(2)
raft(2)
内容识别(2)
智能推荐平台(2)
手势识别(2)
智能音乐(2)
adapter(2)
bi(2)
block(2)
class(2)
dataset(2)
dsl(2)
e2e(2)
el(2)
embedding(2)
eval(2)
free(2)
gaussian(2)
gif(2)
ipa(2)
kaggle(2)
key(2)
knn(2)
latex(2)
local(2)
mesh(2)
midi(2)
min(2)
module(2)
na(2)
nas(2)
network(2)
next(2)
null(2)
pascal(2)
point(2)
powerpoint(2)
ram(2)
rpa(2)
salesforce(2)
set(2)
similarity(2)
size(2)
stack(2)
state(2)
system(2)
ui(2)
vi(2)
wifi(2)
word(2)
word2vec(2)
yolo(2)
zero(2)
百度飞桨(2)
编辑器(2)
边缘计算(2)
并发(2)
产品经理(2)
动态规划(2)
公有云(2)
黑客马拉松(2)
后台(2)
继承(2)
开源软件(2)
命令行(2)
设计模式(2)
视频编码(2)
数组(2)
图数据库(2)
推荐算法(2)
线程(2)
虚拟机(2)
虚拟现实(2)
用户体验(2)
游戏开发(2)
游戏引擎(2)
远程办公(2)
增强现实(2)
最佳实践(2)
自然语言处理(2)
深度学习框架(2)
向量数据库(2)
云+校园(1)
云点播(1)
云镜(主机安全)(1)
官方文档(1)
认证考试(1)
objective-c(1)
cocoa(1)
actionscript(1)
bootstrap(1)
regex(1)
vue.js(1)
typescript(1)
ecmascript(1)
opengl(1)
汇编语言(1)
composer(1)
云数据库 SQL Server(1)
postgresql(1)
flask(1)
vba(1)
jar(1)
maven(1)
全文检索(1)
云数据迁移(1)
实时音视频(1)
音视频点播加速(1)
智能鉴黄(1)
es 2(1)
专有云(1)
金融风控(1)
智慧零售(1)
工业物联(1)
electron(1)
云联网(1)
babel.js(1)
压力测试(1)
wordpress(1)
hive(1)
sql server(1)
spring boot(1)
npm(1)
seo(1)
kotlin(1)
敏捷开发(1)
socket编程(1)
uml(1)
lamp(1)
ntp(1)
anaconda(1)
sas(1)
haskell(1)
nest(1)
智能外呼机器人(1)
信息流(1)
mqtt(1)
flutter(1)
对话机器人(1)
ddos 攻击(1)
内容安全(1)
云开发(1)
分类算法(1)
接口测试(1)
测试策略(1)
etcd(1)
flink(1)
ghost(1)
媒体处理(1)
智能编辑(1)
数据脱敏(1)
验证码(1)
视频内容安全(1)
应用安全开发(1)
Elasticsearch Service(1)
数据集成(1)
图像标签(1)
图像分析(1)
测试服务(1)
数据湖(1)
自由视角(1)
设计云(1)
腾讯天籁 inside(1)
智慧停车(1)
基础教育(1)
智能家居(1)
小程序·云开发(1)
代码托管(1)
action(1)
ada(1)
alexa(1)
amp(1)
animation(1)
apollo(1)
apple(1)
assertion(1)
atomic(1)
automation(1)
aws(1)
backbone(1)
background(1)
bat(1)
cad(1)
cell(1)
chat(1)
classification(1)
composition(1)
config(1)
connect(1)
container(1)
controller(1)
cookies(1)
copy(1)
cut(1)
data(1)
database(1)
db(1)
diff(1)
difference(1)
direct3d(1)
distance(1)
distribution(1)
drawing(1)
element(1)
email(1)
embed(1)
encoding(1)
entity(1)
equation(1)
error(1)
extract(1)
factory(1)
feed(1)
figure(1)
final(1)
focus(1)
formula(1)
frame(1)
fs(1)
gin(1)
global(1)
gps(1)
gradient(1)
gzip(1)
hierarchy(1)
history(1)
hugo(1)
identifier(1)
ipad(1)
jpeg(1)
julia(1)
label(1)
lambda(1)
list(1)
lm(1)
logic(1)
ls(1)
mac(1)
match(1)
matching(1)
math(1)
matplotlib(1)
matrix(1)
mean(1)
media(1)
medium(1)
memory(1)
microsoft(1)
mips(1)
mnist(1)
modeling(1)
mvp(1)
nft(1)
nio(1)
oceanbase(1)
ode(1)
offline(1)
offset(1)
optimization(1)
output(1)
owl(1)
photo(1)
photoshop(1)
physics(1)
pixel(1)
position(1)
prediction(1)
presto(1)
project(1)
publish(1)
pyramid(1)
random(1)
reduce(1)
reference(1)
relation(1)
rest(1)
rgb(1)
rss(1)
scale(1)
sensors(1)
sh(1)
shift(1)
signature(1)
sketch(1)
slice(1)
slide(1)
smoothing(1)
space(1)
split(1)
src(1)
ssl(1)
store(1)
sum(1)
summary(1)
svm(1)
t4(1)
target(1)
time(1)
tm(1)
torch(1)
tree(1)
twitter(1)
var(1)
verification(1)
vim(1)
web(1)
web3(1)
webp(1)
wix(1)
worker(1)
workspace(1)
z3(1)
zip(1)
备份(1)
遍历(1)
表单(1)
播客(1)
产品设计(1)
队列(1)
多线程(1)
工具类(1)
规范化(1)
混合云(1)
架构师(1)
监控(1)
交换机(1)
局域网(1)
开发工具(1)
开发环境(1)
快捷键(1)
路由器(1)
乱码(1)
求职(1)
权限(1)
上传图片(1)
生命周期(1)
数据采集(1)
数据存储(1)
数据管理(1)
系统设计(1)
小游戏(1)
性能优化(1)
远程工作(1)
云平台(1)
指针(1)
重定向(1)
主机(1)
城市交通(1)
时序预测(1)
梯度下降算法(1)
量子算法(1)
混合现实(1)
深度强化学习(1)
图像分割(1)
3D建模(1)
腾讯混元大模型(1)
幻兽帕鲁(1)
搜索文章
搜索
搜索
关闭
字节打造大模型TTS:不仅能高保真合成,而且支持调整编辑
数据
系统
语音
强化学习
模型
你猜的没错,这段有声书并非来自某个专业制作团队,而是一个 AI 模型 Seed-TTS,而这个模型则是来自字节跳动的 Seed Team。
机器之心
2024-06-27
172
0
这就是OpenAI神秘的Q*?斯坦福:语言模型就是Q函数
openai
函数
模型
搜索
强化学习
还记得去年 11 月底爆出来的 Q* 项目吗?这是传说中 OpenAI 正在秘密开展、或将带来颠覆性变革的 AI 项目。如果你想回忆一下,可参看机器之心当时的报道《全网大讨论:引爆 OpenAI 全员乱斗的 Q * 到底是什么?》简而言之,Q* 很可能是 Q 强化学习和 A* 搜索这两种 AI 方法的结合。
机器之心
2024-04-26
140
0
扩散模型如何构建新一代决策智能体?超越自回归,同时生成长序列规划轨迹
机器人
函数
模型
数据
强化学习
设想一下,当你站在房间内,准备向门口走去,你是通过自回归的方式逐步规划路径吗?实际上,你的路径是一次性整体生成的。
机器之心
2024-03-18
356
0
20分钟学会装配电路板!开源SERL框架精密操控成功率100%,速度三倍于人类
开源
强化学习
机器人
计算机科学
框架
近年来,机器人强化学习技术领域取得显著的进展,例如四足行走,抓取,灵巧操控等,但大多数局限于实验室展示阶段。将机器人强化学习技术广泛应用到实际生产环境仍面临众多挑战,这在一定程度上限制了其在真实场景的应用范围。强化学习技术在实际应用的过程中,任需克服包括奖励机制设定、环境重置、样本效率提升及动作安全性保障等多重复杂的问题。业内专家强调,解决强化学习技术实际落地的诸多难题,与算法本身的持续创新同等重要。
机器之心
2024-02-26
149
0
性能提升、成本降低,这是分布式强化学习算法最新研究进展
分布式
强化学习
量化
算法
性能
深度强化学习(Deep Reinforcement Learning,DRL)是一种公认的解决连续决策问题的有效技术。为了应对 DRL 的数据低效(data inefficiency)问题,受到分布式机器学习技术的启发,分布式深度强化学习 (distributed deep reinforcement learning,DDRL) 已提出并成功应用于计算机视觉和自然语言处理领域。有观点认为,分布式强化学习是深度强化学习走向大规模应用、解决复杂决策空间和长期规划问题的必经之路。
机器之心
2024-02-26
345
0
谷歌提出全新RLHF方法:消除奖励模型,且无需对抗性训练
强化学习
函数
论文
模型
优化
大型语言模型(LLM)的成功离不开「基于人类反馈的强化学习(RLHF)」。RLHF 可以大致可以分为两个阶段,首先,给定一对偏好和不偏好的行为,训练一个奖励模型,通过分类目标为前者分配更高的分数。然后通过某种强化学习算法优化这个奖励函数。然而,奖励模型的关键要素可能会产生一些不良影响。
机器之心
2024-02-26
279
0
普林斯顿博士生高天宇指令微调进展速览:数据、算法和评估
模型
数据
算法
开源
强化学习
图源:https://twitter.com/gaotianyu1350/status/1731651192026247435
机器之心
2024-01-23
212
0
大模型+机器人,详尽的综述报告来了,多位华人学者参与
强化学习
机器人
基础
模型
数据
大模型的出色能力有目共睹,而如果将它们整合进机器人,则有望让机器人拥有一个更加智能的大脑,为机器人领域带来新的可能性,比如自动驾驶、家用机器人、工业机器人、辅助机器人、医疗机器人、现场机器人和多机器人系统。
机器之心
2023-12-28
536
0
NeurIPS 2023 Spotlight | 腾讯AI Lab绝悟新突破:在星际2灵活策略应对职业选手
游戏
强化学习
测试
算法
腾讯
实时策略游戏(RTS)以其复杂的游戏环境更贴近现实世界,一直是 AI 研究的焦点和挑战所在。《星际争霸 2》作为其中极具代表性的游戏,因其对资源收集、战术规划和对手分析的高实时要求,已成为业内广泛用于训练和验证 AI 决策能力的理想平台。早在 2018 年,腾讯 AI Lab 研发的 AI 就已击败游戏内最高难度的 AI。
机器之心
2023-12-20
277
0
能总结经验、持续进化,上交把智能体优化参数的成本打下来了
强化学习
模型
设计
性能
优化
大模型的出现引发了智能体设计的革命性变革,在 ChatGPT 及其插件系统问世后,对大模型智能体的设计和开发吸引了极大的关注。帮助完成预订、下单等任务,协助编写文案,自主从网络上搜索最新的知识与新闻等等,这种通用、强大的智能助理,让大模型强大的语义理解、推理能力将之变成了可能。
机器之心
2023-11-24
191
0
斯坦福提出对比偏好学习:无需强化学习即可从人类反馈中学习
强化学习
函数
模型
数据
优化
在模型与人类意图对齐方面,根据人类反馈的强化学习(RLHF)已经成为一大流行范式。通常来说,RLHF 算法的工作过程分为两个阶段:一、使用人类偏好学习一个奖励函数;二、通过使用强化学习优化所学习的奖励来对齐模型。
机器之心
2023-11-13
365
0
让大模型自主探索开放世界,北大&智源提出训练框架LLaMA-Rider
强化学习
框架
模型
数据
LLM
大语言模型因其强大而通用的语言生成、理解能力,展现出了成为通用智能体的潜力。与此同时,在开放式的环境中探索、学习则是通用智能体的重要能力之一。因此,大语言模型如何适配开放世界是一个重要的研究问题。
机器之心
2023-11-07
303
0
狂揽4k star,AI通过强化学习玩宝可梦,两万场后成功拿下
游戏
强化学习
函数
视频
数据
「口袋妖怪」是「宝可梦」的非官方译名。从 1996 年至今,它可以被分为数个世代,成为很多玩家心中的经典之作。游戏画风简单,但是身为策略游戏,其中包含的角色、属性、战术、体系等让这个游戏入门容易精通难。
机器之心
2023-10-24
353
0
让人恐惧的是,机器狗已经能做这种事了
神经网络
强化学习
机器人
论文
设计
跑酷是一项极限运动,需要参与者以高度动态的方式跨越障碍,对于大多数时候「笨手笨脚」的机器人来说,这似乎是件遥不可及的事,不过最近在机器人控制领域里出现了一些技术突破的趋势。几周前,机器之心曾报道过一个使用强化学习方法让机器狗实现跑酷的研究,实现了不错的效果。
机器之心
2023-10-04
239
0
Transformer+强化学习,谷歌DeepMind让大模型成为机器人感知世界的大脑
强化学习
机器人
函数
模型
数据
在开发机器人学习方法时,如果能整合大型多样化数据集,再组合使用强大的富有表现力的模型(如 Transformer),那么就有望开发出具备泛化能力且广泛适用的策略,从而让机器人能学会很好地处理各种不同的任务。比如说,这些策略可让机器人遵从自然语言指令,执行多阶段行为,适应各种不同环境和目标,甚至适用于不同的机器人形态。
机器之心
2023-09-21
730
0
AI海洋中的海妖之歌:腾讯AI Lab大模型幻觉问题综述
强化学习
工作
模型
数据
腾讯
大规模语言模型在众多下游任务中展现了惊人的能力,但它们在使用中仍然暴露了一些问题。其中,幻觉是目前影响大模型落地的重要问题之一。ChatGPT 的发布使学术界和工业界关注大模型实际落地的潜能,大量关于幻觉的工作也开始涌现。
机器之心
2023-09-19
954
0
攀爬、跳跃、过窄缝,开源强化学习策略让机器狗能跑酷了
开源
强化学习
机器人
论文
视频
跑酷是一项极限运动,对机器人特别是四足机器狗来说,更是一项巨大的挑战,需要在复杂的环境中快速克服各种障碍。一些研究尝试使用参考动物数据或复杂的奖励,但这些方法生成的「跑酷」技能要么多样但盲目,要么基于视觉但特定于场景。然而,自主跑酷需要机器人学习基于视觉且多样化的通用技能,以感知各种场景并迅速做出反应。
机器之心
2023-09-19
503
0
RLHF vs RL「AI」F,谷歌实证:大模型训练中人类反馈可被AI替代
人工智能
强化学习
模型
数据
原理
根据人类反馈的强化学习(RLHF)是一种对齐语言模型与人类偏好的有效技术,而且其被认为是 ChatGPT 和 Bard 等现代对话语言模型的成功的关键驱动因素之一。通过使用强化学习(RL)进行训练,语言模型可以优化用于复杂的序列级目标 —— 使用传统的监督式微调时,这些目标不是轻易可微的。
机器之心
2023-09-08
540
0
刺激,无人机竞速超越顶级人类玩家,强化学习再登Nature封面
swift
强化学习
模型
系统
优化
这架自主控制无人机是由来自苏黎世大学的研究团队设计研发的 Swift 系统,研究成果登上了最新一期的《Nature》杂志封面。
机器之心
2023-09-08
189
0
DeepMind新研究:ReST让大模型与人类偏好对齐,比在线RLHF更有效
强化学习
rest
模型
数据
算法
这几个月以来,我们已经见证了大型语言模型(LLM)在生成高质量文本和解决众多语言任务方面出色的能力。然而,LLM 又面临这样一个困境,即产生的输出很大程度上与人类偏好并不一致。如果没有适当的对齐,语言模型可能输出不安全的内容。此外,对齐 LLM 还有助于改善下游任务。
机器之心
2023-09-08
320
0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档