首页
学习
活动
专区
工具
TVP
发布
首页标签强化学习

#强化学习

强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。

扩散模型如何构建新一代决策智能体?超越自回归,同时生成长序列规划轨迹

机器之心

设想一下,当你站在房间内,准备向门口走去,你是通过自回归的方式逐步规划路径吗?实际上,你的路径是一次性整体生成的。

2400

机器学习分类

@小森

强化学习不像无监督学习那样完全没有学习目标,又不像监督学习那样有非常明确的目标(即label),强化学习的目标一般是变化的、不明确的,甚至可能不存在绝对正确的标...

7710

情绪的机制分析

用户1908973

Deeply felt affect- the emergence of valence in deep active inference

4510

机器学习:解析未来的数据世界

人不走空

机器学习的基本概念主要涉及监督学习、无监督学习和强化学习。让我们更详细地了解它们:

17110

南大俞扬教授:什么是world models/世界模型?

zenRRan

Jurgen的这篇论文属于强化学习领域。那么,强化学习里不是有很多model-based RL吗,其中的model跟world model有什么区别?答案是没有...

8010

2024年2月深度学习的论文推荐

deephub

Searchformer是一个基于Transformer架构的人工智能模型,经过训练可以模拟A星寻路算法,在复杂的规划任务中实现更高的效率。它在Sokoban谜...

12910

与人类贴身热舞!人形机器人进阶到街头耍宝,6华人组团出品

量子位

通过在强化学习框架中进行全身控制的大规模训练,机器人就可以在现实世界中进行动作的泛化了。

6110

Sora为什么不是世界模型?

算法进阶

Jurgen的这篇论文属于强化学习领域。那么,强化学习里不是有很多model-based RL吗,其中的model跟world model有什么区别?答案是没有...

11710

LLM 的幻觉到底是什么,有什么办法解决?

NewBeeNLP

LLM 时常会出现一些神奇的现象—— 幻觉 Hallucination ,在 AI 领域,幻觉是指模型生成的信息可能 不真实 或 不准确 ,这是一个常见的问题,...

23910

可控核聚变新里程碑!AI成功预测等离子体撕裂登Nature,清洁能源「圣杯」更近一步

新智元

而最近,普林斯顿团队用AI提前300毫秒预测了核聚变等离子不稳定态,这个时间,就足够约束磁场调整应对等离子体的逃逸!

8910

20分钟学会装配电路板!开源SERL框架精密操控成功率100%,速度三倍于人类

机器之心

近年来,机器人强化学习技术领域取得显著的进展,例如四足行走,抓取,灵巧操控等,但大多数局限于实验室展示阶段。将机器人强化学习技术广泛应用到实际生产环境仍面临众多...

8810

性能提升、成本降低,这是分布式强化学习算法最新研究进展

机器之心

深度强化学习(Deep Reinforcement Learning,DRL)是一种公认的解决连续决策问题的有效技术。为了应对 DRL 的数据低效(data i...

13610

谷歌提出全新RLHF方法:消除奖励模型,且无需对抗性训练

机器之心

大型语言模型(LLM)的成功离不开「基于人类反馈的强化学习(RLHF)」。RLHF 可以大致可以分为两个阶段,首先,给定一对偏好和不偏好的行为,训练一个奖励模型...

12610

榕树集--使用强化学习自上而下的进行蛋白质结构设计

DrugSci

天然的蛋白质通常具有形状互补性来生成适合功能的体系结构,这是进化选择的结果,目前的设计方法无法实现。在本文中,作者描述了一种Top-down的强化学习方法:在整...

6210

AI技术大揭秘:探索人工智能的核心领域与必备技能

xcbeyond

随着人工智能的不断进步,AI技术在各个领域都发挥着越来越关键的作用。想要成为AI领域的从业者,不仅需要对整体格局有清晰认识,更要掌握关键技术和必备技能。本文将深...

13710

机器狗界变形金刚来了:“人”狗之间灵活切换,可用前肢开门取物,瑞士团队出品

量子位

而为了让机器狗能够站立并完成开门等动作,团队通过一种名为“好奇心驱动”的强化学习方法对它进行了训练。

7810

Richard Sutton ||智能决策器通用模型的探索

深度强化学习实验室

强化学习和决策多学科的前提是随着时间的推移,多个学科对目标导向的决策有着共同的兴趣。本文的想法是通过提出一种关于决策者的观点来强化和深化这一前提,这种观点在心理...

6210

OpenAI Gym高级教程——解决实际问题与研究探索

人类群星闪耀时

OpenAI Gym是一个强化学习的标准工具包,可用于解决各种实际问题和进行研究探索。本教程将深入探讨如何利用OpenAI Gym解决实际问题,并进行相关研究。...

8010

OpenAI Gym高级教程——领域自适应强化学习

人类群星闪耀时

OpenAI Gym是一个为强化学习任务提供统一接口的开源平台,它允许研究人员和开发者使用标准化的环境进行实验和开发。本教程将介绍OpenAI Gym的高级用法...

8710

OpenAI Gym 高级教程——可解释性和可视化

人类群星闪耀时

在本篇博客中,我们将深入探讨 OpenAI Gym 高级教程,聚焦于强化学习模型的可解释性和可视化。我们将使用解释性工具和数据可视化方法,以便更好地理解模型的决...

11610
领券