暂无搜索历史
人形机器人在工业、家庭、医疗和搜救等领域具有广泛的应用前景,然而其双足运动在不同环境中的稳定性和动态控制仍面临挑战。状态估计在这一过程中扮演关键角色,它为运动控...
项目地址:https://emprise.cs.cornell.edu/robo-care/
摘要:论文聚焦于人形机器人在极端平衡任务中的控制问题。人类在执行单脚站立、高抬腿等动作时展现出卓越的平衡能力,而将其转化为机器人控制仍面临诸多挑战。
摘要:本文聚焦于视觉-语言模型在机器人场景中的空间推理能力评估问题。作者指出,现有的VLM评估大多局限于单视角设定,忽视了多视角信息融合的能力,而多摄像头配置在...
模块化机器人技术为太空探索提供了新的可能性,其具备可靠性高、易于维修和适应性强等特点,适合在月球等极端环境中执行多样化任务。本文基于日本科学技术振兴机构的“Mo...
导读:全文围绕机器人学中仿真与现实之间的差异(即“现实鸿沟”)展开,系统性地分析了其成因、评估方法与应对策略,并展望了未来研究方向。
摘要:论文提出了一种新型的世界建模方法,旨在通过语义预测而非像素级重建来支持机器人控制中的规划任务。传统世界模型通常通过预测未来帧的像素来模拟环境动态,然而,高...
摘要:本文提出了一种名为SemNav的新型视觉语义导航方法,其核心思想是利用语义分割作为环境感知的主要输入形式,以提升智能体在未知环境中的导航能力。传统VSN模...
横跨2012–2025年,把计算机视觉(CV)、自然语言处理(NLP)、强化学习(RL)、大语言/多模态模型(LLMs/MLLMs)以及世界模型(WMs)五条技...
摘要:文章提出了一种高效的灵巧抓取合成流程,旨在解决机器人抓取中一个长期存在的挑战:如何为任意抓取类型、任意物体和任意多指手合成具有丰富接触、无穿透且物理合理的...
摘要:NaVILA(Navigation Vision-Language-Action)是一种面向足式机器人(如四足机器狗或人形机器人)的视觉-语言导航系统。该...
摘要:本文提出了一种名为 T-araVLN 的方法,旨在提升农业机器人在视觉与语言导航(VLN)任务中的性能。该方法通过引入一个指令翻译模块,将原始指令中存在的...
摘要:本论文提出了一种名为KLEIYN的新型四足机器人,其具备主动腰部关节,能够在复杂地形中进行运动并实现垂直墙面的攀爬。研究背景源于当前四足机器人在动态运动和...
摘要:本文提出了一种基于学习的视觉导航方法,使无人机能够在果园行间实现自主飞行。该方法采用基于变分自编码器(VAE)的控制器,通过干预式学习框架进行训练,使无人...
导读:深度学习作为人工智能的核心技术之一,已经在多个领域取得了突破性进展。TensorFlow和PyTorch作为当前最主流的深度学习框架,各自具有独特的设计理...
导读:视觉-语言-动作(Vision-Language-Action, VLA)模型已成为机器人操作策略学习中的重要范式,能够根据语言指令执行任务并泛化至新场景...
导读:H-RDT(Human to Robotics Diffusion Transformer)是一项旨在利用大规模人类操作数据提升机器人操作能力的研究工作。...
摘要:本文提出了一种名为“对抗性运动与运动模仿”(Adversarial Locomotion and Motion Imitation, ALMI)的新型框架...
导读:模仿学习已成为机器人操作中的重要范式,通过模仿人类专家的演示行为,机器人能够在多种操作任务中表现出卓越的性能。然而,现有的模仿学习方法在面对新物体、新背景...
摘要:论文提出了一种名为VLMGineer的新型框架,旨在通过视觉语言模型(VLMs)与进化搜索相结合的方式,自动协同设计机器人工具及其操作策略。该研究立足于工...
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市