编者按:本文来自凤凰科技,编译:清辰,36氪经授权发布。
据科技网站Futurism.com北京时间1月2日报道,美国加州大学伯克利分校的一个研究小组发现,像我们人类一样,机器人也具备“预见”能力,借助于视频识别技术,机器人在移动物体之前预测到可能发生的情况。
众所周知,人类在采取行动之前一般先进行思考。例如,如果一个人想去踢球,他或她首先可能会考虑球会滚到哪里,以及怎样踢球才能令其滚到新位置。通常情况下,机器人不具备这种能力,因为它们内部的程序通常只能执行简单的任务,尤其是那些没有配备人工智能程序的机器人。
但是,加州大学伯克利分校的研究小组却发现,机器人也可以具备这种直觉。为了证明这一点,他们开发了一种新的机器人学习技术,让机器人可以提前进行思考,“以搞清楚如何操控之前从未遇到过的物体。”这个研究小组将这项技术称为“视觉预见”(visual foresight),尽管如此,这并不代表机器人可以预测未来——至少目前没有。
他们将这项技术应用到一台名为“Vestri”的机器人身上,令其可以预测自备摄像头几秒种以后才能看到的东西。得益于这种新技术,“Vestri”能够在不触碰周围障碍物的情况下,在桌子上移动小物体。最不可思议的地方是,该技术还能让“Vestri”在没有人类指导和监督,以及没有物理知识的情况下,完成这些小任务。
加州大学伯克利分校电气工程和计算机科学系助理教授谢尔盖·莱文(Sergey Levine)说,“我们能够想象我们的行动将如何移动所在环境中的物体,与我们人类一样,新方法也能让机器人对不同行为如何影响周围世界进行视觉化。这就能在复杂的现实环境中对高度灵活的技能进行智能规划。”视觉远见技术便是由该系开发的。
视觉预见技术是基于“卷积循环视频预测”或动态神经平流(DNA)开发的。据加州大学伯克利分校研究小组介绍,基于DNA的模型可以根据机器人的行为,预测图像中的像素如何从一帧跳入另外一帧。切尔西·菲恩(Chelsea Finn)是莱文实验室的博士生,还是初始DNA模型的发明人,正如他所说,Vestri之类的机器人现在可以“完全自主地学习一系列视觉对象操控能力”。
莱文实验室的另一位博士生弗雷德里克·艾伯特(Frederik Ebert)将整个项目的运作方式与人类在自己环境中与物体的互动方式做了对比。“得益于一生中与各种物体的数百万次互动,人类可以在没有老师的指导下学会操控物体的技巧。”艾伯特说,“我们的研究已证明,我们完全可以开发一套机器人系统,令其利用大量自动收集的数据来学习可得到广泛应用的操控能力,尤其是推动物体的能力。”
莱文指出,Vestri的能力仍然存在一定的局限性,但他们正在采取进一步措施来改进视觉预见技术。有朝一日,这种技术或许可以对道路上行驶的无人驾驶汽车起到辅助作用,令其更好地应对新环境和不熟悉的物体。但这项技术还需要更多的改进,才能实现这一目标。例如,改善视频预测能力,采取进一步措施来搜集更具体的视频数据。
经过这些改进,机器人或许可以借助类似技术完成更为复杂的任务,例如拿起和放置物体,或是处理衣服或绳子等柔软且容易变形的物体。也许有一天,我们根本不需要将洗过的衣服叠起来,因为机器人助理可以帮我们做。
领取专属 10元无门槛券
私享最新 技术干货