发布

一点人工一点智能

专栏成员
301
文章
332555
阅读量
36
订阅数
HOVER:人形机器人的多功能神经网络全身控制器
论文《HOVER: Versatile Neural Whole-Body Controller for Humanoid Robots》提出了一种新型的多模态神经网络控制器HOVER,旨在解决人形机器人全身控制中不同任务模式(如导航、操作、桌面操控等)的兼容性问题。现有方法通常为每个控制模式单独训练策略,导致控制器缺乏通用性。HOVER通过引入运动模仿和策略蒸馏技术,将多个控制模式整合到一个统一策略中,实现了跨模式的技能共享与无缝切换。实验表明,HOVER不仅在单一模式上超越专家策略,还能在仿真和真实硬件中实现鲁棒的多模态控制。
一点人工一点智能
2025-03-07
580
基于视觉的仿人机器人灵巧操作:从模拟到现实的强化学习
本文聚焦于通过**Sim-to-Real强化学习(RL)**实现仿人机器人基于视觉的灵巧操作任务。灵巧操作(如抓取、搬运、双手交接)是机器人领域长期以来的技术难点,传统方法依赖人工编程或示教,难以适应复杂多变的物体属性和动态环境。论文提出一种系统化方法,通过解决环境建模、奖励设计、策略学习与感知迁移四大挑战,构建了一个可扩展的Sim-to-Real框架。其核心目标是通过模拟环境中的高效训练,将策略无缝迁移至真实硬件,实现对多样化物体的鲁棒操作。
一点人工一点智能
2025-03-07
820
ChatVLA:基于视觉-语言-动作模型的统一多模态理解与机器人控制
该部分系统性地阐述了当前视觉-语言-动作模型(VLA)存在的关键问题:虚假遗忘(Spurious Forgetting)和任务干扰(Task Interference)。前者指在机器人控制任务训练过程中,原有视觉-语言对齐关系被覆盖,导致多模态理解能力退化;后者指控制与理解任务因共享参数空间而相互抑制。
一点人工一点智能
2025-03-04
1050
AnyDexGrasp: 通用灵巧抓取方法的创新与应用
论文地址:https://graspnet.net/anydexgrasp/assets/files/AnyDexGrasp.pdf
一点人工一点智能
2025-03-03
650
Harmon | 从语言描述中生成人形机器人的全身动作
项目地址:https://ut-austin-rpl.github.io/Harmon/
一点人工一点智能
2025-02-26
840
FLARES:基于LiDAR多范围语义分割的快速准确方法深度解析
LiDAR作为自动驾驶感知系统的核心传感器,其点云数据的语义分割是实现3D场景理解的关键。然而,LiDAR点云的不规则性、稀疏性,以及大规模数据处理的实时性需求,使得高效且准确的语义分割成为技术难点。
一点人工一点智能
2025-02-25
1031
Dream to Drive:基于解析世界模型的自动驾驶车辆控制
本文提出了一种基于可微分仿真器的自动驾驶车辆控制方法,首次将可微分仿真应用于世界模型(World Model)的训练。通过引入解析世界模型(Analytic World Models, AWMs),作者设计了三种新任务——相对里程计预测、最优状态规划和逆最优状态估计,旨在解决传统基于策略的模型(如APG)在规划能力与可解释性上的不足。
一点人工一点智能
2025-02-25
690
VR-Robo:视觉机器人导航和运动的Real-Sim-Real框架
本文介绍了一种名为VR-Robo的框架,该框架能够为视觉导航和机器人运动学习提供真实感强、物理交互性强的数字孪生仿真环境。该方法利用多视图图像进行基于3DGS的场景重建,并将这些环境整合到支持自我中心视觉感知和网格基物理交互的模拟器中。
一点人工一点智能
2025-02-18
520
MapFusion:一种新的多模态BEV特征融合方法
本文介绍了一种名为MapFusion的新方法,用于多模态地图构建任务中的特征融合。该方法采用鸟瞰视角(Bird's-Eye View,BEV)特征作为输入,并通过引入交叉模态交互和双动态融合模块来解决不同传感器之间的语义不匹配问题。实验结果表明,与现有方法相比,MapFusion在高清地图建设和BEV地图分割任务中分别取得了3.6%和6.2%的绝对提升,证明了其优越性。
一点人工一点智能
2025-02-18
1040
VR-Robo:视觉机器人导航和运动的Real-Sim-Real框架
地址:https://mp.weixin.qq.com/s/Mlik8mEHYSb2XmJXqXlKNQ
一点人工一点智能
2025-02-17
900
CogACT:一种新的VLA模型架构
论文地址:https://cogact.github.io/CogACT_paper.pdf
一点人工一点智能
2025-01-20
1030
强化学习中的可解释性问题
本文主要探讨了强化学习中的可解释性问题,并提出了一个新的方法——时间策略分解(TPD),用于解释个体动作的预期未来结果。
一点人工一点智能
2025-01-16
1010
DeeR-VLA:用于高效机器人执行的多模态大语言模型的动态推理
项目地址:https://github.com/yueyang130/DeeR-VLA
一点人工一点智能
2025-01-09
670
HGSFusion:用于3D目标检测的雷达-相机融合网络
项目地址:https://github.com/garfield-cpp/HGSFusion
一点人工一点智能
2025-01-08
1290
港大&上海AI实验室 | GPT4Scene:使用视觉语言模型理解视频中的3D场景
本文介绍了一种名为GPT4Scene的新方法,用于训练和推理视觉语言模型(VLM),以帮助其理解三维空间中的场景。传统的VLM在处理三维空间知识时存在局限性,主要原因是缺乏全局局部对应关系。
一点人工一点智能
2025-01-07
1890
如何高效地从任意一张图像中创建高质量、广泛视角的3D场景?
项目地址:https://snap-research.github.io/wonderland/
一点人工一点智能
2025-01-07
1150
CoCap:多机器人协同运动捕捉法
本文介绍了一种名为CoCap的多机器人协同运动捕捉方法,用于在户外环境中捕捉多个演员的动作。传统的运动捕捉方法往往无法应对复杂的环境和遮挡等问题,而CoCap通过协调相机规划来确保多视角推理,并且在高遮挡率和障碍物密集的情况下表现出色。此外,CoCap还提供了一种单个机器人的实时搜索方法,适用于密集环境下的应用。该方法的成功应用为计算机动画、虚拟现实、生物信息学和人形训练等领域的运动捕捉提供了新的思路和技术支持。
一点人工一点智能
2025-01-03
780
WalkVLM:如何通过VLM来辅助盲人行走?
这篇论文主要研究了如何利用视觉语言模型(Vision-Language Models,简称VLMs)来帮助视障人士行走。目前全球有大约两亿人患有不同程度的视力障碍,因此开发AI技术提供行走辅助变得尤为重要。
一点人工一点智能
2025-01-03
1020
大模型引导的深度强化学习在自动驾驶决策中的应用
项目地址:https://bitmobility.github.io/LGDRL/
一点人工一点智能
2024-12-31
1990
DrivingGPT:使用多模态自回归Transformers统一驾驶世界建模和规划
项目地址:https://rogerchern.github.io/DrivingGPT/
一点人工一点智能
2024-12-27
1580
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档