波士顿动力的机器狗,平衡感的确很强。
可再强也有摔倒的时候。而且,它们倒下之后需要人类扶起来。
这时候,就要隆重介绍ANYmal机器狗。
它摔倒之后只要蹬一蹬腿,就能重新站起来了:
但这并不表示它的平衡能力弱。
毕竟,这只狗对刁钻的地形毫不畏惧:
不论是踩着浪花,还是登高远眺,都如履平地;
下雪的时候也能走楼梯。
重要的是,ANYmal几乎不依赖人类灌输的知识。
初初来到这个世界,它不会站立不会走路:成熟的生存能力,是靠强化学习算法一点一点解锁的。
(相比之下,MIT科技评论说,波士顿动力机器人的动作,大多是人类手动编写的。)
ANYmal的大脑,是苏黎世联邦理工学院 (ETH Zurich) 和英特尔一同开发的,还登上了最新一期的Science Robotics。
就像刚才提到的那样,机器狗的每一个动作,都不是人工写的:
它是在模拟器里,用强化学习算法学会的。
为什么要用模拟器?
在模拟器里,2,000多只机器狗 (智能体) 可以一起学走路,一起应对各种刁难。
这样一来,可以轻而易举地获得大量的数据。
而有了强化学习算法,智能体可以在千万次试错中,找到技巧:
训练开始的时候,它像一只出生不久的小狗,可能是四肢的力量还弱,可能是还不懂得怎样用力。
经过1,500代的训练,运动策略已成熟稳健,机器狗可以从侧卧的状态毫不犹豫地正起身来。
它知道自己扑街的姿势是怎样的,就知道该用怎样的动作,让自己站起来:
更重要的是,模拟器里训练好的运动策略,不用做任何修改,就可以直接交给现实中的机器狗。
不论跌倒的时候,腿是如何被压在身下,最终都能顺利地站起来。
当然,摔倒之后再爬起来,并不是上策。
而保持平衡,避免跌倒,也是机器狗的一项关键技能。毕竟按照惯例,有好事者会在一旁踢腿:
不用怕,这也是在模拟器里学过的。
另外,强化学习算法还可以针对不同的奔跑速度,来训练策略。
训练之下,机器狗的秒速已经达到1.5米,比没用强化学习的时候快了25%。
而单单跑得快,也是不够的。前方的路并不平坦:
作为一只勇敢的机器狗,也该不惧路途中的任何障碍。
比如,越过障碍的同时,不要把自己摔下去:
比如,就算没有办法助跑,也要跨过“大型”障碍:
毕竟,ANYmal一向是在危险的环境里接受训练的。
不管火灾还是水灾,人类越难进入的空间,越是它工作的地方。
或许,ANYmal是波士顿动力当下最有力的对手了。
但这场比赛的节奏,也不一定要多么紧张。
机器人顶会IROS 2018的现场,ANYmal与波士顿动力的SpotMini相遇了。
两只身材相仿的机器狗,与其说向对方宣战,不如说见面便是一副恩爱的样子。
还有一只娇小的莱卡狗,在一旁静静地吃着狗粮。
你看,ANYmal俯下身去,SpotMini轻轻地吻了它的额头:
也许,在严酷的训练之外,加入清新自然的社交活动,能让机器狗更有活力地投入下一阶段的任务吧。
Science Robotics论文传送门:
Learning agile and dynamic motor skills for legged robots http://robotics.sciencemag.org/lookup/doi/10.1126/scirobotics.aau5872
作者系网易新闻·网易号“各有态度”签约作者
— 完 —