MIT突破:自我监督系统DON,机器人可在检查随机物体后理解它们并拾取

编译:chux

出品:ATYUN订阅号

几十年来,装配线等受控环境中的机器人能够一次又一次地拾取同一物体。最近,计算机视觉的突破使机器人能够在物体之间进行基本区分。尽管如此,系统并没有真正理解物体的形状,因此机器人在快速拾取后几乎没什么用了。

麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究人员在一篇新论文中说,他们已经在这个工作领域做了一个重要的发展:一个允许机器人检查随机物体,并在视觉上理解它们,以完成具体的系统,而不需要以前见过任务物体。

???

该系统称为Dense Object Nets(DON),它将对象视为点集合,用作视觉路线图。这种方法可以让机器人更好地理解和操纵物品,最重要的是,它们甚至可以让他们甚至在类似的混乱中拾取特定物品,这是亚马逊和沃尔玛等公司在其仓库中使用的各种机器的宝贵技能。

例如,有人可能会使用DON让机器人抓住物体上的特定位置,比如鞋舌头。从那以后,它可以看到它以前从未见过的鞋子,并成功抓住它的舌头。

“许多操纵方法无法识别物体可能遇到的多个方向的物体的特定部分,”博士生Lucas Manuelli说道,他与主要作者和博士生Pete Florence,Russ Tedrake教授一起撰写了一篇关于该系统的新论文,“例如,现有的算法无法通过手柄抓住一个杯子,特别是杯子是多个方向的,如直立,或侧面。”

该团队不仅在制造环境中,而且在家庭中都看到了该系统潜在的应用。想象一下,给系统一个整洁的房子的图像,让你在工作时清洁,或使用菜肴的图像,以便系统在你度假时把你的盘子放好。

还值得注意的是,没有一个数据实际上被人类标记过。相反,该系统是团队所谓的“自我监督”,不需要任何人类注释。

机器人抓取的两种常见方法涉及任务特定学习或创建一般抓取算法。这些技术都有障碍:特定于任务的方法难以推广到其他任务,并且一般的掌握不足以处理特定任务的细微差别,例如将对象放在特定位置。

然而,DON系统基本上在给定物体上创建一系列坐标,作为一种视觉路线图,使机器人更好地理解它需要掌握的内容,以及在哪里。

该团队训练系统将对象视为构成较大坐标系的一系列点。然后,它可以将不同的点映射到一起,以显示对象的3D形状,类似于从多张照片拼接全景照片的方式。在训练之后,如果一个人指定一个物体上的一个点,机器人可以拍摄该物体的照片,并识别和匹配点,然后能够在该指定点拾取物体。

这与UC-Berkeley的DexNet系统不同,后者可以掌握许多不同的项目,但不能满足特定的要求。想象一个18个月大的孩子,他不明白你想要它玩哪个玩具但仍然可以抓住很多物品,而一个4岁的孩子可以回应“抓住你的卡车红色的尾部”。

在软毛虫玩具上进行的一组测试中,由DON驱动的Kuka机器人手臂可以从一系列不同的配置中抓住玩具的右耳。这表明,除其他外,系统具有在对称物体上区分左右的能力。

当在不同棒球帽的箱子上进行测试时,DON可以选择特定的目标帽子,尽管所有的帽子都具有非常相似的设计,并且之前从未在训练数据中看过帽子的照片。

Florence表示,“在工厂中,机器人通常需要复杂的零件供料器才能可靠地工作,但是像这样能够理解物体方向的系统可以拍摄照片,并能够相应地掌握和调整物体。”

在未来,团队希望将系统改进到能够执行特定任务的地方,更深入地了解相应的对象,例如学习如何抓住对象并将其移动到最终目标,即清理桌面。

该团队将于下个月在瑞士苏黎世举行的机器人学习会议上发表论文。

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2018-09-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能LeadAI

如何准备机器学习工程师面试

人们用很多东西来比喻准备面试的过程。有人说这像准备一场战争,也有人说像邀请某人出去约会,还有人说像在高尔夫大师赛上打进最后一个洞。准备面试是一个令人兴奋,又或者...

3616
来自专栏人工智能头条

2015人工智能重大突破

1693
来自专栏新智元

【圣诞快乐】这是一首 AI 创作的圣诞歌

【新智元导读】 AI 能为人类做什么?平安夜,来听一首AI 创作的圣诞歌吧。(虽然有点跑调)祝读者朋友们圣诞快乐! “神经网络卡拉OK”程序能够产生任何形式的数...

3274
来自专栏数据观有话说

关于“数据可视化思考者”的8条军规

经常在网络上看到这样的问题:“从零开始学习数据可视化,需要怎么开始?”《Data at Work》一书的作者Jorge Camoes在一次演讲中,提出了“数据可...

2387
来自专栏AI科技评论

开发 | 入门深度学习,读对书很重要

AI科技评论按:本文作者为 Jeffries Consulting 创始人 Daniel Jeffries,他以自己的阅读体验,对当前含金量极高的几本深度学习书...

36011
来自专栏大数据挖掘DT机器学习

中文情感分析 (Sentiment Analysis) 的难点在哪?

作者:容哲 假设分析的对象是iphone5s的手机评论。从京东、亚马逊或者中关村都可以找到这款手机的评论。大致都如图所示。 ? 情感分析(Sentimen...

5646
来自专栏华章科技

机器学习进阶路上的五个境界

关于机器学习,这个话题最近实在太火了,甚至有些虚火了。有了虚火,就容易有泡沫。大浪淘沙,要想在数据科学这个行业生存下来,任何一个从业者都需要认清自己的位置,每上...

1023
来自专栏大数据文摘

AI大事件 | IBM和MIT成立联合人工智能研究实验室,谷歌大脑团队将在Reddit上举行AMA

1944
来自专栏PPV课数据科学社区

【学习】Spss 聚类分析案例—某移动公司客户细分模型

聚类分析在各行各业应用十分常见,而顾客细分是其最常见的分析需求,顾客细分总是和聚类分析挂在一起。 顾客细分,关键问题是找出顾客的特征,一般可从顾客自然特征和消费...

6779
来自专栏AI科技大本营的专栏

特朗普“模仿”奥巴马?进阶版换脸技术DeepFakes来了

DeepFakes,这种能够移花接木的技术,它能将图像或视频中把一张脸替换成另一张脸。

1732

扫码关注云+社区