前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >MIT「迷你猎豹」秒速3.9米刷新四足机器人世界记录,但还是跑不过苏炳添

MIT「迷你猎豹」秒速3.9米刷新四足机器人世界记录,但还是跑不过苏炳添

作者头像
新智元
发布2022-03-21 10:41:07
5960
发布2022-03-21 10:41:07
举报
文章被收录于专栏:新智元新智元


新智元报道  

编辑:袁榭 时光

【新智元导读】步态欠潇洒不要紧,只要速度足够快!MIT四足机器人刷新世界记录,靠的是合成数据训练机器!

自2014年立项以来,MIT的机器猎豹项目在四足机器人界屡有突破和贡献。

刚刚,迷你猎豹(Mini Cheetah)又晒出了新成绩:创下了秒速3.9米的四足机器人行进速度世界记录。

MIT机器猎豹,四足机器人里跑得最快

当下,各种机器人公司和项目,为了刷存在感,同时也给投资人信心,最时兴让机器人玩杂耍。

比如,2019年中,既有波士顿动力的两足机器人耍后空翻,也有MIT的四足机器猎豹耍后空翻,堪称业界热点、一时瑜亮。

当然,后空翻的意义不止于好看,还在于展示控制系统与行进机制的稳健性,以及体现处理输入数据的速度。

然而,机器人项目绕不过的难题是——它除了「稳」,还要「快」!

现在,市面上的各路机器狗产品价格堪比上档次的汽车,速度却远远跟不上。

当下机器狗的老头慢遛速度,让各种搞钱广告的杂技展示都减色不少。比如以下这种足球运动,有哪种真实动物会慢成这样呢……

不过2022年3月份,MIT的四足机器猎豹,终于比不管是东方还是西方的竞品都跑得还快了。

按照研究团队的数据,现在MIT的四足机器猎豹室内运动速度上限是秒速3.9米。

室外运动上限是秒速3.4米。

室内原地旋转的角速度是每秒5.7弧度。

考虑到没练过的普通人类整体旋转的角速度也就是每秒6-9弧度(花样滑冰运动员能转出每秒40弧度以上),机器猎豹打转的敏捷度已经很值得称道了。

换算一下,MIT的机器猎豹现在室内速度接近9迈,室外速度接近8迈。

直观地说,虽然与汽车相比,这速度还不算挂一档。但如果这数字调在跑步机上的话,即使健身狂魔们也得出汗费力才能跟上了。

此前的MIT机器猎豹,只算得上是四脚爬爬,现在才能真算上「跑步前进」了。尽管比不得活猎豹,但「迷你猎豹」(Mini Cheetah)跑赢真人肥宅似乎不算难事。

而且考虑到机器猎豹在冰上能维持同等运动速度与灵活度,真人恐怕还做不到咧。

步态不潇洒?

如图所示,迷你猎豹的步态还有点笨拙,没有猎豹的矫健身姿,看起来倒像一只小狗在地板上抓来抓去。

这是因为,AI除了加速之外没有优化任何东西。

「强化学习能找到跑得快的解决方案,但由于其奖励功能不明确,它没有理由选择一种「看起来更自然」或「人类更喜欢的」步态。」研究者称。

当高速移动时,它可能不是最优雅的姿态。

诚如研究者所言,「这个模型当然可以被指导开发一种更流畅的运动形式,但此次大家努力的重点只是优化速度」。

业界趋势:合成数据训练机器狗

教四足机器人运动,此前无外乎是两种途径:

摄像头等传感器搜集现实数据,然后码农手动编程处理数据;

或码农将传感器搜集的现实数据作为数据训练集,训练AI控制四足机器人动作。

「投多少人工出多少智能」,这两种办法其实都是耗时费力。

码农手动编程的时间成本与资源耗费不消说,环境出个变化就得手工改程序。

拿现实世界数据使劲训练AI,现在也遇到瓶颈了。

现实世界的数据变量实在太丰富,各种雄心勃勃要搞全无人L4自动驾驶的大车厂们就因此在训练AI上吃了大瘪:

砾石地、沙地、雪地的路况不同,不同风速、湿度、颗粒物状态的空气能见度不同,路上各种从活人到井盖的物体运动状况不同。越要训练出能因应万象的AI司机,现实数据的搜集和处理成本就越大。

当然如果和马斯克一样跳脱,在车上装超级电脑来走数据跑AI。理论上也不是不可以,只是现实中人会说这种解决方案是神经病。

穷则思变,如果现实数据搞起来太累太麻烦,那么换合成数据,不是就跑通了么?

现在业界巨擘们纷纷搞模拟环境/合成数据。谷歌拿NeRF为Waymo的无人车训练渲染了个模拟旧金山出来。英伟达在猛砸资源做Omniverse Replicator。

斩牛刀可以用来杀鸡,合成数据连参数和变量大到吓人的无人车AI都可以用,两足/四足机器人要面临的环境变量少得多,自然也可以用。

2021年起,加州大学伯克利分校的研究团队就在用模拟环境训练两足机器人Cassie。据称Meta的AI团队也在用模拟环境训练四足机器人。

MIT团队训练机器猎豹:3小时合成逾百日数据量

四足机器人界的泰山北斗之一、MIT的机器猎豹项目,自不甘人后。

研究团队完全不用摄像头等传感器输入真实外界数据,完全在模拟环境中训练控制机器猎豹的AI。

不得不说,效果满好。

由MIT研究团队释出的实景对比图像可以看出:

人工预编程的控制软件,让机器猎豹的步态更好看,但砾石地上的复杂路况大大限制了行动速度与敏捷度。

而在模拟环境中、通过奖惩机制训练的强化学习AI模型,控制下的机器猎豹酷似野狗乱爬,但速度和敏捷度提升了不止一个档次。

MIT研究小组表示,他们的环境模拟器在3小时内生成了相当于过百天的各种地形、天气等环境变化数据,以此为训练集来用强化学习方法训练机器猎豹的控制AI。

如此训练出的步态控制模型,的确很可能无法判别机器猎豹足下的是冰地还是砾石地。但AI判断出形态不稳、步态受干扰、要倒的结果速度可是大大提升了。

因此机器猎豹步态与形体的因应方案虽然难看,但既能高速前冲、又不会同时仆街,这个成就在四足机器人界可是前所未有。

如下图所示,用合成数据训练的强化学习AI,让机器猎豹成功过坎,避免了此前的仆街状况。

落地前景

MIT计算机科学和人工智能实验室(CSAIL)的研究人员相信,他们的技术可以用于提高其它机器人系统能力,尤其适用工厂发货前的组装系统。

全球疫情加速了机器人在工业中的应用,根据《自动化世界》(Automation World)的一项调查,在组装和制造工厂中,已经有44.9%工厂将机器人视为不可或缺的一部分。

现在,MIT开发设计的「迷你猎豹」系统,可以通过模拟环境进行强化学习,加快了运行时间。这种管线操作模式能用来训练机器猎豹,就能用来训练流水线机器人。

而且合成数据+强化学习这种模式还有个好处,就是摆脱了传感器的关注局限、让AI更加高效流畅地得出结果。

机器猎豹在快跑冲刺时,所有机件都出于满负荷运载状态,这时AI不会管是因为地面太滑要倒、还是螺丝松了要倒,给出的姿态解决方案只要达到“不会倒”的结果就好。

同样的模式应用在流水线机器人上,那可真是为生产效率提了个大台阶。

参考资料:

https://venturebeat.com/2022/03/17/mit-researchers-use-simulation-to-train-a-robot-to-run-at-high-speeds/

https://www.theverge.com/2022/3/17/22982620/robot-run-speed-mit-mini-cheetah-ai-reinforcement-learning

https://gizmodo.com/mits-robotic-cheetah-taught-itself-how-to-run-sets-new-1848656968

https://futurism.com/the-byte/mits-robot-cheetah-run

https://sites.google.com/view/model-free-speed/

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-03-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 【新智元导读】步态欠潇洒不要紧,只要速度足够快!MIT四足机器人刷新世界记录,靠的是合成数据训练机器!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档