专栏首页HyperAI超神经三次元的世界里,机械臂的手活儿也无敌了

三次元的世界里,机械臂的手活儿也无敌了

By 超神经

对于叠叠乐( Jenga )这种积木游戏,想必很多人都深有体会,因为稍有不慎,辛辛苦苦堆起来的积木塔就毁于一旦。这样的事情,交给 AI 和机器人来做,会怎么样呢?

似乎研究人工智能的团队,总喜欢通过游戏找到突破口,麻省理工学院的团队研发出来的机械臂,也从三次元世界的游戏开始。

叠叠乐,一般是把积木条先将木块三根为一层,交错叠高成塔,然后从下部抽取积木,放到塔顶,创造一个更高的积木塔。

叠叠乐游戏是对耐心、平衡、力度等多方面的考验,对很多人来说,(尤其是容易手抖的同学)这个游戏实在是太难了。而 MIT 研制出的这个机器人,则通过探测、算法结合推拉、对齐等操作,轻松的攻克了这个任务。

它究竟是何方神圣?

人类总会说自己「手抖」,所以机械臂的研究就是为了完成一些精细化或者高危的操作。项目团队成员之一,MIT 机械工程系的助理教授 Alberto Rodriguez ,指出这个机器人的关键在于,它把视觉和触感完美的结合了起来。

这项技术不仅上了 Science Robotics 期刊 ,

还在今天上了中央台电视台的午间新闻

但从外观上看,这个机器人和一些常见的应用型机器类似,像一个普普通通的机械臂,但它配备了一个软齿状夹持器、一个力感应腕带和一个外部摄像头,这相当于给它赋予了手,触感和眼睛。

在工作时,夹持器用来操作积木,也能反馈触感;感应腕带用来控制操作积木的力度的力感;摄像头用来收集视觉图像。

除了拥有这些让机器人能够灵活移动积木的外形,它最关键的还是拥有和之前机器人不一样的「灵魂」——研究人员使用新的算法让它变得更擅长这项工作。

根据 MIT 研究人员的介绍,这款机器人没有使用传统的 AI 学习方法,而是创造性的使用了分层模型动态,去建立一个聚类学习模型。

这样做的好处是不再依赖大量的数据,而是能够根据反馈的数据,作出实时的分析,边接触探测,边预测移动下一块积木的方案。

它是怎样玩叠叠乐的?

事实上,机器人能够处理看起来复杂的叠叠乐游戏,关键用到了聚类学习。

传统的思路去解决这个游戏,就是把积木、机器人、积木塔之间会发生的所有关系都收集起来,从而计算出最好的方式。但这明显会带来海量的数据,而且计算难度也大大提升。

而这个研究中,选择了让机器人去模仿人类玩游戏的方式。首先是先通过尝试,对数据标注和聚类。然后通过和标记的数据对比判断新操作的可行性。

首先让机器人面对一个积木塔,随机的选择积木块并按一个比较小的力度推出,对于每次推出和抽积木的操作,计算机会记录下相应的视觉和力度数据,并和操作的结果一起标注出来。

这个研究中用了约 300 次尝试,就积累到了足够的数据,然后就就是对数据进行处理。这里用到了聚类处理,要把数据和结果类似的操作分为一组,表示特定的积木行为。

不同的组代表了不同的可操作程度,这也是了衡量每个操作的标准。比如一组数据代表机器人在难以移动的积木上的尝试,而另一组数据则代表一个比较容易移动的积木上的尝试。

而每一个不同的数据集,再相应的给出一个简单的模型,结合这些模型,机器人相当于学会了实时的学习。

最后,就可以进行实际演练,机械臂在推出积木块时,利用摄像头和腕带去接受视觉和触觉信息,然后把接收到的这个反馈和之前的数据作对比,如果数据对应到好的结果,就执行这个操作,如果会有倒塌的危险,就放弃此操作。

并不只是叠叠乐

MIT 的研究人员指出,虽然在研究中实现了机器人玩这个个游戏,但要是拿来和人类高手比赛,估计还需要一些改进。因为在这个研究中, AI 机器人重点解决的是物理交互问题,解决了这块积木能不能抽出来,摆上去之类的问题。但叠叠乐的游戏还需要一些策略,这就涉及到考虑和分析关联步骤。

但 MIT 的这个研究团队明显没有这个想法,或许对他们来说,制造出一个玩叠叠乐的高手并没有太多的价值。根据团队研究人员 Rodríguez 的说法,正在考虑把这项技术用在实际的工作环境中,比如应用在制造装配线的机器人等领域。

反正我们经常说自己手抖,那以后这些专业的事情就让专业的「人」去做吧,我们还是等着被过年的美食淹没着吧。

超神经小百科

聚类 Clustering

聚类是一种对数据分组的机器学习技术。一般就是将数据对象分组成为多个类或簇 ( Cluster ),使得在同一簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。

对于给定一组数据点,可以用聚类算法将每个数据点分到特定的组中。理论上,属于同一组的数据点应该有相似的属性和/或特征。聚类是属于无监督学习方法。

本文分享自微信公众号 - HyperAI超神经(HyperAI),作者:神经星星

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-02-02

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 关注度越来越高的行人重识别,有哪些热点?

    内容提要:行人重识别技术,广泛应用于智慧城市、自动驾驶等场景中,近年取得飞速发展。这也得益于训练数据规模的扩大、深度学习的发展。

    HyperAI超神经
  • 巴菲特弃用 20 美元的三星翻盖,换上了 iPhone

    内容提要:身价 825 亿美元的股神巴菲特,一直以来都在使用上市已有十年之久的三星翻盖手机。虽然是苹果的大股东,但他总是拒绝使用 iPhone。不过最近,他终于...

    HyperAI超神经
  • 全球首个 AI 发球机器人诞生,国球练出新高度

    场景描述:近日,全球首台智能乒乓球发球机器人诞生,这款机器人将进行乒乓球的辅助教学工作。除了发球外,它还具备运动轨迹与动作分析能力,让训练数据化、智能化。

    HyperAI超神经
  • 单细胞RNA-seq数据分析最佳实践(中)

    Luecken MD, Theis FJ. Current best practices in single-cell RNA-seq analysis: a ...

    生信技能树jimmy
  • 17个案例带你3分钟搞定Linux正则表达式

    正则表达式是一种字符模式,用于在查找过程中匹配制定的字符。 元字符通常在Linux中分为两类: Shell元字符,由Linux Shell进行解析; 正则表达式...

    小小科
  • 17个案例带你3分钟搞定Linux正则表达式

    来源:https://blog.ansheng.me/article/examples-of-linux-regular-expressions

    用户1634449
  • vue3.0 + ts 打包ui组件

    在使用微应用中, 通常子应用都是基于一套技术栈开发。其中就包括ui组件,很多二次封装组件需要在各个子应用中使用到。

    copy_left
  • 17个案例带你3分钟搞定Linux正则表达式

    正则表达式一般以文本行进行处理,在进行下面实例之前,先为grep命令设置--color参数:

    马哥linux运维
  • 【技术综述】人脸妆造迁移核心技术总结

    美颜和美妆是人脸中很常见的技术,在网络直播以及平常的社交生活中都有很多应用场景。常见的如磨皮,美白,塑形等美颜技术我们已经比较熟悉了,而本文重点介绍的是人脸妆造...

    用户1508658
  • 【案例】靠大数据赚钱的10个例子

      从 2012 年到 2015 年,大数据持续发威,IDC 市场调查机构预测 2017 年大数据市场将价值 324 亿,拥有这样“Big Data、Big D...

    小莹莹

扫码关注云+社区

领取腾讯云代金券