腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

量子位

专栏作者

8591

文章

4916498

阅读量

138

订阅数

与人类贴身热舞！人形机器人进阶到街头耍宝，6华人组团出品

机器人框架论文数据强化学习

好啦，这不是惊悚恐怖片，而是来自UCSD（加州大学圣地亚哥分校）全华人团队的最新研究成果。

2024-02-29

700

机器狗界变形金刚来了：“人”狗之间灵活切换，可用前肢开门取物，瑞士团队出品

工作性能强化学习机器人部署

瑞士苏黎世联邦理工学院（ETH）推出了一款全新研制的机器狗，自称是“机器狗界的变形金刚”。

2024-02-22

930

无需额外训练提升模型30%性能！DeepMind科学家点赞MIT博士生实习成果

存储强化学习模型数据性能

只需对Transformer的特定层进行一种非常简单的修剪，即可在缩小模型规模的同时显著提高模型性能。

2024-01-04

1640

OpenAI神秘新模型Q*曝光，太强大让董事会警惕，或是奥特曼被开除导火索

强化学习 openai 模型数据数学

路透社曝光，在奥特曼被解雇之前，几位研究人员给董事会写的警告信可能是整个事件导火索：

2023-11-24

2270

Nature：大模型只会搞角色扮演，并不真正具有自我意识

游戏强化学习测试论文模型

现在，一篇发表Nature上的文章，直接否决了这个观点——所有大模型，都不过是在玩角色扮演而已！

2023-11-19

1700

迪士尼玩起强化学习，新机器人有星球大战那味了

强化学习机器人动画设计系统

就在刚举行完的国际机器人顶会IROS上，迪士尼研究所研究科学家Moritz Bächer带领团队展示的这个新机器人，可谓萌翻全场。

2023-10-10

1950

强化学习之父入局AGI创业！联手传奇程序员卡马克，放话不依赖大模型

游戏强化学习程序员创业模型

传奇程序员卡马克（John Carmack），与强化学习之父萨顿（Richard Sutton）强强联手了，All in AGI。

2023-10-08

1950

大模型RLHF不必非得靠人，谷歌：AI反馈效果一样好

强化学习测试论文模型数据

RLHF，即基于人类反馈的强化学习，无论是ChatGPT还是开源的LLaMA都离不开它。

2023-09-08

2630

ChatGPT最强竞品重磅升级，免费可用！第一手实测在此，网友：有个性

容器强化学习 chatgpt 程序模型

在OpenAI祭出GPT-4的API和“最强插件”代码解释器后，竞争对手显然坐不住了。

2023-08-05

1290

中国AI麻将打出新高度！战胜真人职业选手，鹅厂「绝艺」刷新战绩

自动驾驶游戏强化学习腾讯效率

腾讯最新消息，旗下棋牌类AI“绝艺”LuckyJ在日本麻将平台“天凤”上，刷新AI在麻将领域最好成绩。

2023-08-05

3380

最新RLHF拯救语言模型「胡说八道」！微调效果比ChatGPT更好，两名华人共同一作

强化学习 chatgpt 测试框架模型

它只会判断生成文本的整体效果，不会仔细判断细节是否存在事实性错误、信息不完整和相关度等问题。

2023-08-03

2210

清华商汤最新AI，征服了《我的世界》

游戏强化学习程序科技模型

不卖关子，全都是这个小东西干的，它的名字叫Ghost in the Minecraft（GITM）。

2023-08-03

2330

AI设计蛋白质新方法登Science！利用强化学习，直接根据预想优化结构

强化学习程序模型设计原理

明敏发自凹非寺量子位 | 公众号 QbitAI 现在，强化学习不仅能下围棋，还能设计蛋白质了！ RoseTTAFold团队独创性方法，利用强化学习、自上而下设计蛋白质复合物结构，登上最新一期Science。利用该方法，团队设计出了上百个蛋白质结构。经电子显微镜等观测证实，这些结构大部分都能在实验室中合成。而且预期纳米结构和实际纳米结构之间的平均偏差小于单个原子直径，即实现了精确原子级设计。在实际应用上，由该方法设计出的蛋白质能有效在小鼠体内产生有用抗体，并为未来开发出更有效的疫苗和药物创造可

2023-05-06

1000

物理学家狂喜的AI工具开源了！靠实验数据直接发现物理公式，笔记本就能跑

github 强化学习

梦晨发自凹非寺量子位 | 公众号 QbitAI 一个让物理学家狂喜的AI工具，在GitHub上开源了！它名叫Φ-SO ，能直接从数据中找到隐藏的规律，而且一步到位，直接给出对应公式。整个过程也不需要动用超算，一台笔记本大概4个小时就能搞定爱因斯坦的质能方程。这项成果来自德国斯特拉斯堡大学与澳大利亚联邦科学与工业研究组织Data61部门，据论文一作透露，研究用了1.5年时间，受到学术界广泛关注。代码一经开源，涨星也是飞快。除了物理学者直呼Amazing之外，还有其他学科研究者赶来探讨，

2023-03-15

5120

传奇大神何恺明被曝回归学界，网友：要成全MIT引用最高的人了

图像处理 https 网络安全深度学习强化学习

梦晨 Alex 发自凹非寺量子位 | 公众号 QbitAI AI大牛何恺明有了最新动向，而且是回归学术界。 MIT CSAIL实验室发布公告，3月13日下周一，何恺明将到MIT做学术演讲。此事引起AI圈广泛关注。在相关知乎问题下，MIT博士@Charles指出，何恺明参加的这个研讨会全是Job Talks（求职演讲）。杜克大学教授陈怡然也表示，一直听说何恺明在寻找教职，现在终于能确认了。求职演讲是学术界一大传统，指申请博士或教职者到校做学术报告，内容是他们自己的研究成果，通常正是在每年三四月份

2023-03-13

3310

两位清华校友闪耀NeurIPS2020！各9篇入选，华人之最，“不意外，哪个顶会近就投哪个”

机器学习神经网络人工智能编程算法强化学习

杨净发自凹非寺量子位报道 | 公众号 QbitAI NeurIPS 2020即将开幕。两位训练有素的年轻一代AI科学家，如何评价他们的有备而来？杨林和汪昭然，两位清华毕业生，都以9篇之数，成为今年NeurIPS入选论文最多的华人学者。但对于这样的成绩，两位表示并不意外，其中一位还说：「只是看哪个顶会比较近，就投哪个。」嗯，所以其他科研萌新也能不能「哪个近投哪个」嘞？他们也分享了一些过来人经验。 NeurIPS2020 从整体接收情况上看，今年共有9454篇论文提交，1900篇总接收，录

2023-03-10

5420

王者荣耀「绝悟」完全体上线：解禁全英雄，在线约你来战

强化学习监督学习开发者实验室神经网络游戏

木易发自凹非寺量子位报道 | 公众号 QbitAI 腾讯AI Lab与王者荣耀联合研发的策略协作型 AI「绝悟」，全英雄池解禁，升级成「完全体」了。 11月28日到30日，将限时开放三天公众体验。这次的升级，带来了新算法，除了突破了可用英雄限制，还优化了禁选英雄博弈策略。而与此次升级相关的研究，也在近期被NeurIPS 2020和TNNLS分别收录。在这两篇研究中，分别介绍了「绝悟」进行强化训练和监督训练具体细节。那么，「完全体绝悟」是如何训练出来的呢？就让我们顺着这次的论文，好好来了

2023-03-10

2530

MIT用19个神经元实现自动驾驶控制，灵感来自秀丽隐杆线虫

自动驾驶无人驾驶 https 网络安全强化学习

晓查发自凹非寺量子位报道 | 公众号 QbitAI 打造一个自动驾驶控制系统需要多少个神经元？ MIT的科学家告诉你，最少只要19个！方法是向线虫这种初等生物学习。最近，来自MIT CSAIL、维也纳工业大学、奥地利科技学院的团队已经开发了一种基于线虫大脑的新型AI系统。研究成果登上了最近的《自然·机器智能》杂志。他们发现，具有19个控制神经元的单个算法，通过253个突触将32个封装的输入特征连接到输出，可以学习把高维输入映射到操纵命令。这种新的AI系统用少量人工神经元控制车辆转向。而基于

2023-03-10

2660

这才是最好的程序语言，不服来辩

开源小程序微信编程算法强化学习

娅宁发自凹非寺量子位报道 | 公众号 QbitAI 毫不夸张，这是我听过「最动听」的程序员故事。今天，1024，程序员节。一个小程序悄然上线，然后迅速在圈内引起波澜，大家争相上传自己的代码，看看一行行敲下的字符，究竟有多优雅。口罩检测是明快的，失物找回有固定明确的击打节奏，疲劳提醒雄浑之中透着温暖，行程分享更像是冬日暖阳拍打在你背上…… 算了，或许这只是我的感觉，因为虽然是同一段代码，但一千个观众有一千个莫扎特。程序是理性的，但没想到，有程序员实现了「解码」。现在每一段代码，都是感性十

2023-03-10

4980

「我要出轨了」！伯克利的这个AI，可以预测机器人何时将脱离

机器人神经网络强化学习自动驾驶无人驾驶

金磊发自凹非寺量子位报道 | 公众号 QbitAI 「脱离」（disengagement），在自动驾驶系统中是一个重要的指标。是指当自动驾驶汽车遇到故障，脱离自动驾驶模式，改为人类驾驶员接管车辆的情况。很多人认为「脱离」次数越少，就能说明一个自动驾驶系统能力越强。因此，以往的研究都会把「脱离」当作是故障来排除掉。但最近，UC伯克利的研究人员却「以毒攻毒」，直接用这样的数据来训练机器人，预测未来何时将发生脱离事件。研究人员称它为LaND——从「脱离」中学会导航。研究人员表示，通过这样

2023-03-10

1740

点击加载更多

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态