动态 | 如何让无人机灵活穿越满是障碍的房间?训练一个循环神经网络试试看

如今,深度学习已经在语音识别、计算机视觉等多个应用领域取得了重大突破。然而,要说到它在机器人领域的发展,那就要另当别论了——深度学习在机器人领域,不仅发展速度慢,甚至还遭到很多人的质疑。为什么呢?

究其原因,最重要的一点在于所需数据难以共享——将深度学习应用到机器人领域,涉及到许多具体物理系统的表达。这意味着,所需数据往往是机器人领域的特定数据集。因此,研究人员在收集数据时,就要耗费较多时间;而在处理和环境相交互的主动系统时,则会更加费时。

近日,来自鲁汶大学的两位研究人员Klaas Kelchtermans和Tinne Tuytelaars就为解决这一问题展开了研究,并将研究成果撰写成论文《How hard is it to cross the room ? - Training (Recurrent) Neural Networks to steer a UAV》,发布在了arXiv上。AI科技评论对论文进行了部分编译。

论文地址:https://arxiv.org/abs/1702.07600

摘要

我们研究了在无人机导航控制中采用循环神经网络(RNN)代替前馈神经网络(FNN),是否能增加其活动的灵活性。实验条件是:无人机在执行高级导航任务时,需要用前视摄像头收集信息。

为了让无人机通过模仿学习学会执行导航任务,我们建立了一个用来训练神经网络、可应用于空中和陆地两种交通工具的通用框架。实验中,我们把框架应用于在模拟环境中飞行的无人机中,让它学习如何穿越有多障碍物的房间。

到目前为止,无人机控制的训练过程中通常只使用前馈神经网络。为了处理更多高难度的任务,我们提出,引入循环神经网络代替前馈神经网络,并且训练一个长短期存储器( LSTM)来控制无人机。

通过视觉信息进行控制属于序列预测问题,并且需要高相关性的输入数据。这一高相关性就使得训练神经网络,尤其是循环神经网络,变得不容易进行。

为了克服这一问题,我们在训练网络时采用了WW-TBPTT法(window-wise truncated backpropagation through time)。另外,考虑到端对端训练所需的数据通常无法获得,我们将“只对全连接(FC)进行再训练的控制层”和“只对长短期存储器控制层(所需网络为端到端的训练)进行再训练的控制层”的表现进行了对比。

最后,通过让无人机穿越有障碍物房间这一相对简单的实验,我们已经能看出训练神经控制网络所具有的重要指导意义和其良好的实践效果。可视化的差异性有助于解释无人机学习到的行为。

注:此图为论文中的图12——平均模仿损失对比图

实验变量:已知和未知的房间、无人机用不同构架的神经网络和不同训练方法进行控制、是否有摄像头;

S-LSTM 用S-TBPTT训练、WW-LSTM用WW-TBPTT。

探讨和结论

此研究中,我们测试了在导航控制中,存储器(图12)能如何帮助深度神经网络更高效地运作。

结果表明,用WW-TBPTT去除训练数据的相关性,在训练如长短期存储器这样的循环神经网络时,极其有帮助。尽管使用WW-TBPTT 法会使实验方差增大,计算存储值的过程也使训练变慢(如图12最右边一组条形图),但它能通过时间长度有效避免滑动截断反向传播的顺序偏差(the sequential bias of sliding truncated back propagation)。

另外,实验结果表明,预先训练网络也非常有意义。在导航控制试验中,仅仅重训练最后一层卷积网络全连接层(如Inception),比训练端对端训练网络表现更好。训练端对端网络不仅需要更多数据,而且时间也更长。也正是上述这个原因,机器人(AI科技评论注:这里指无人机)在实际应用中才不够灵活。

我们将公开“穿过房间一”和“穿过房间二”两次实验的数据集(它们代表了实验所需数据的复杂程度),让其他研究人员能以此为参考标准,学习导航控制。

最后,我们还想强调,想要打开深度学习这个黑箱子,差异化评价法和可视化是非常有必要的。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-03-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能头条

我在机器学习踩过的坑,现在告诉你怎么跳过去

人工智能(其实本禅师认为目前看来翻译成人造智能可能更直白一点)毫无疑问,已经是科技趋势,却又是门槛相对较高、对学习者要求非常高的一门科学。

943
来自专栏AI科技大本营的专栏

利用3D打印构建衍射深度神经网络,可光速执行数字运算

通过识别手写数字构建的人工神经网络一直以来都是重要的研究课题,手写数字往往因书写风格差异、上下文无关及识别准确度高等要求导致识别难度大,因此针对手写数字的研究有...

682
来自专栏数据派THU

独家 | 一文读懂语音识别(附学习资源)

一、前言 6月27日,美国权威科技杂志《MIT科技评论》公布2017全球最聪明50家公司榜单。科大讯飞名列中国第一、全球第六。全世界排在科大讯飞前面企业分别是:...

2915
来自专栏机器之心

学界 | 完善强化学习安全性:UC Berkeley提出约束型策略优化新算法(附代码)

选自BAIR Blog 作者:Joshua Achiam 机器之心编译 参与:Smith、黄小天、邱陆陆 强化学习作为深度学习的一个强大分支成就卓然,在电子游戏...

3196
来自专栏AI科技评论

学界 | 关于模型可解释性的深入思考:从哪里来,到哪里去?

「学习出一个通用智能行动者的潜力和局限性,算法公平方面细微的以及可以被真正规范化的挑战,以及现在的热门话题:能向人类解释、能被人类理解对模型来说意味着什么?」

783
来自专栏机器学习算法与Python学习

深度学习(deep learning)发展史

源 | 小象 本文节选自人民邮电出版社最新出版的 AI 圣经《深度学习DEEP LEARNING[1]》。《深度学习DEEP LEARNING[2]》英文版由美...

3378
来自专栏AI科技评论

学界 | Michael I.Jordan:AI 时代变革,源于应用场景中的优化算法

AI 科技评论按:8 月 9 日,为期两周的 2018 国际数学家大会(ICM)在里约热内卢完美谢幕,来自全球一百多个国家的 3000 多位数学家出席了本次盛会...

781
来自专栏AI研习社

关于模型可解释性的深入思考:从哪里来,到哪里去?

AI 研习社:本文作者 Cody Marie Wild,不仅是一位机器学习领域的数据科学家(目前任职 phos 公司),在生活中还是名不折不扣的猫咪铲屎官,她钟...

1202
来自专栏企鹅号快讯

谷歌最新端到端语音识别系统:词错率降至5.6%,性能提升16%!

-免费加入AI技术专家社群>> 导读:谷歌大脑和Speech团队发布最新端到端自动语音识别(ASR)模型,词错率将至5.6%,相比传统的商用方法实现了16%的改...

2779
来自专栏量子位

机器学习5年大跃进,可能是个错觉

回想2012年,Hinton带着学生们以ImageNet上16.4%的错误率震惊计算机视觉研究界,似乎已经是远古时期的历史。

731

扫码关注云+社区