前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >OpenAI开发的机械手不需要人类来教,可自主学习,模拟人类行为

OpenAI开发的机械手不需要人类来教,可自主学习,模拟人类行为

作者头像
程序你好
发布2018-08-01 09:28:30
5260
发布2018-08-01 09:28:30
举报
文章被收录于专栏:程序你好

当你还是个婴儿的时候,用手抓东西是你学会做的第一件事,但这绝不是一件简单的事情,它只会随着你的成长而变得更加复杂多变。这种复杂性使得机器很难自学,但是Elon Musk和Sam altman支持的OpenAI公司的研究人员已经创造了一个系统,它不仅像人类一样持有和操纵物体,而且还能自行开发出这些行为。

许多机器人和机械手已经精通某些握把或动作——在工厂里的机器人比人更灵巧地挥舞着枪杆枪。但是让机器人完成这项任务的软件很可能是手写的,而且非常具体。

例如,你不能给它一支铅笔,让它写。即使是在同一条生产线上,比如焊接,也需要一个全新的系统。

然而,对于一个人来说,拿起一个苹果和拿起一个杯子没什么区别。差异确实是存在的,但是我们的大脑会自动地填补空白,我们可以随机应变,安全地握一个不熟悉的物体等等。这是一个机器人严重落后于人类的情况。此外,你不能仅仅训练一个机器人做人类做的事——你必须提供数百万个例子来充分展示一个人用上千个给定的物体做什么。

OpenAI的研究人员认为,解决方案根本不是使用人类的训练数据。取而代之的是,他们让计算机在模拟中反复尝试和失败,慢慢地学习如何移动手指,以便它所掌握的对象能够按需要移动。

他们称之为Dactyl的系统,只提供了手指的位置和三种手持对象的摄像头视角——但要记住,在训练时,所有这些数据都是在虚拟环境中进行模拟的。在那里,计算机不需要实时工作——它可以尝试上千种不同的方法在几秒钟内抓住一个对象,分析结果并将数据转发到下一次尝试中。(这只手本身就是一只影子般灵巧的手,也比大多数机械手复杂。)

除了需要学习的不同物体和姿势之外,还有其他随机参数,比如指尖的摩擦力、场景的颜色和灯光等等。你不能模拟现实的每一个方面(现在),但是你可以确保你的系统不只是在一个蓝色的房间里工作,在带有特殊标记的立方体上工作。

他们在这个问题上投入了大量的精力:6144个cpu和8个gpu,“在50个小时内收集了大约100年的经验。”然后他们将这个系统首次应用到现实世界中——它展示出了一些令人惊诧的类人行为。

我们在不经意间用手做的事情,比如把一个苹果转过来看看有没有擦伤,或者把一杯咖啡递给朋友,用很多小技巧来稳定或移动物体。Dactyl重新创建了其中的几个,例如用一个拇指和一个手指握住物体,而用剩下的手指旋转到想要的方向。

这个系统的伟大之处在于它的运动的自然性,以及它们是通过反复试验而独立完成的,但它与任何特定的形状或物体类型无关。就像人类一样,的的确确可以控制和操纵你放在它手里的任何东西,当然是合理的。

这种灵活性被称为泛化,对于必须与现实世界交互的机器人来说,这一点很重要。对于世界上的每一个物体和情况,手工编码的行为是不可能的,但是一个机器人能够在依赖一套核心理解的前提下适应并填补这些空白。

与OpenAI的其他工作一样,描述结果的论文是免费的,他们用来创建和测试Dactyl的一些工具也是免费的。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-07-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 程序你好 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档