以下文章来源于CyberRobo,作者CyberRobo
CyberRobo,是CyberDaily 人形机器人专栏
您可以成为CyberRobo Pro会员解锁更多专业内容
立即订阅
人形机器人在工厂、仓库乃至家庭等多样化场景中,开始展现出巨大的应用潜力。要胜任这些复杂任务,人形机器人不仅需要理解环境的几何形状,还需洞察物体的语义背景。波士顿动力公司的Atlas机器人,为了实现敏捷和自适应的操作,其研发团队构建了一套先进的感知系统。那么Atlas如何通过其视觉系统感知世界,并实现与环境的智能交互?
第一步:环境洞察 —— “看清”周围的世界
Atlas的感知旅程始于对周围环境的初步理解。这包括识别障碍物、定位关键物体以及察觉地面上的潜在危险。通过其2D对象检测系统,Atlas能够获取物体的身份信息、边界框和兴趣点(或称关键点)。
在具体的工厂应用中,这意味着Atlas能够探测到各种形状和尺寸的“夹具”(即存储汽车零部件的大型货架)。它不仅能识别夹具的类型,还能感知其占据的空间,以避免碰撞。更进一步,Atlas会精确感知夹具的角点等关键点。这些关键点分为外部(勾勒夹具整体轮廓)和内部(揭示货架和隔间的具体分布)。通过将这些观察到的关键点与内部存储的夹具模型对齐,Atlas为后续的精确定位和操作打下基础。为实现这一功能,Atlas采用了一种轻量级网络架构,在保证实时性的同时,兼顾了感知性能,这对其敏捷性至关重要。
第二步:空间定位 —— “明确”自身与环境的相对关系
仅仅“看清”物体是不够的,Atlas还需要精确了解这些物体相对于自身的位置。为此,它采用基于关键点的夹具定位模块,估算自身与附近所有夹具的相对位置和方向。
该系统融合了来自2D对象检测流程的内外关键点,并通过最小化重投影误差,将这些关键点与预存的夹具空间分布模型进行对齐。同时,它还整合了运动里程计(记录Atlas的移动量和方向)的数据,以在统一坐标系中融合夹具姿态估计,从而提高对关键点预测噪声的鲁棒性。
在实际操作中,频繁的遮挡和关键点移出视野是巨大挑战。例如,当Atlas靠近夹具时,部分外部关键点可能不可见;倾斜视角也会导致远处关键点信息失真。Atlas通过感知夹具内部更多与物品存取直接相关的关键点(如隔断之间的角点)来应对。这引出了2D关键点与3D角点之间的关联挑战,Atlas首先利用外部关键点进行初步关联,再结合内外关键点获得更可靠的夹具及其所有插槽的姿态估计。对于外观相似的夹具类别,Atlas则结合时间连贯性及夹具间相对位置的先验知识(如A夹具在B夹具右侧半米处)来区分。这些能力的结合,使得Atlas即使在夹具被移动等动态变化下,也能迅速调整认知,重新规划行为。
第三步:精准交互 —— “操控”目标物体
Atlas强大的物体操控能力依赖于精确、实时的以物体为中心的感知。其物体姿态追踪系统“SuperTracker”融合了机器人运动学、视觉信息,必要时还包括力觉信息。
首先,通过关节编码器提供的运动学信息,Atlas能确定其夹持器在空间中的位置。当它识别到已抓取物体时,这些信息为物体在运动过程中的位置提供了强有力的先验判断,即使物体被视觉遮挡或移出摄像头视野,系统也能持续追踪。
当物体在视野内时,Atlas采用基于单目图像的物体姿态估计模型。该模型通过“渲染与比较”方法,利用大规模合成数据进行训练,并能在给定CAD模型的情况下,零样本泛化到新物体。它可以基于3D姿态先验进行迭代优化,或从2D感兴趣区域(如物体掩码)生成一系列姿态假设,再由评分模型选出最佳假设并细化。该系统已成功应用于数百种内部建模和纹理化的工厂资产。
SuperTracker接收视觉姿态估计作为3D先验。为应对实际操作中因遮挡、部分可见性和光照变化导致的视觉模糊性,系统采用一系列滤波器验证姿态估计:包括基于最大团共识算法的自洽性验证(确保多个扰动初始化收敛到同一预测姿态)和运动学一致性验证(拒绝导致异常大的手指-物体距离的预测姿态)。运动学和摄像头输入通过固定滞后平滑器进行异步处理,结合高频的关节编码器数据和低频的视觉姿态估计,最终确定最佳的六自由度物体运动轨迹。
第四步:持续校准 —— “确保”所见即所得
在执行如部件安装等精确操作任务时,精确可靠的手眼协调至关重要。这意味着Atlas所“看到”的与其如何“行动”之间必须有精确映射。
Atlas内部身体模型与其摄像头实时画面的高度重合(手臂、腿部、躯干位置与其认知完全一致)背后,是一套精心设计的摄像头和运动学校准程序。这些程序补偿了机器人本体在制造和组装过程中产生的微小误差,以及因温度变化或重复物理冲击等外部因素导致的长期物理变化。经验表明,精确的手眼校准是实现高性能操控和感知驱动自主性的关键因素。
未来展望:迈向整合的“运动智能”
Atlas的感知系统研发并未止步。敏捷性和适应性仍是核心目标,这日益需要机器人理解关于世界运动的几何、语义和物理学基本规律。团队正致力于为Atlas构建一个统一的基础模型。未来的方向是超越单纯的感知,实现感知与行动的深度融合,从“空间AI”迈向“运动智能”(Athletic Intelligence),使感知成为智能体动态行为的有机组成部分。
以上收录到CyberRobo人形机器人wiki
如果您想进入该行业或基础了解人形机器人产业
成为CyberRobo Base会员
(前50名,99元/年)
深入则订阅Pro会员(339元/年)
接下来Pro会员专项
苹果的人形机器人迈出了第一步,从皮克斯家用机器人开始|CyberRobo Pro
近期,多家新进人形机器人零部件厂商,研发、送样、小批量 |CyberRoboPro
成为CyberRobo会员
Base会员
限时99元/年
(原价119元/年)
全球人形机器人wik
可视化分析看板
产业链分析AI
畅想交流群
立即订阅
Pro会员
339元/年
所有Base会员服务
每周Robo Insight
590+独家市场洞察分析
商业化解读与分享
Pro会员群
市场研究智库
加入解锁更多
立即订阅
Business
品牌/产品宣传
海外社媒推广
品牌开发与建设
按需定制
欢迎加微详谈
详细:CyberRobo3.0:会员计划2025
CyberDaily
领取专属 10元无门槛券
私享最新 技术干货