动态 | 如何让无人机灵活穿越满是障碍的房间?训练一个循环神经网络试试看

如今,深度学习已经在语音识别、计算机视觉等多个应用领域取得了重大突破。然而,要说到它在机器人领域的发展,那就要另当别论了——深度学习在机器人领域,不仅发展速度慢,甚至还遭到很多人的质疑。为什么呢?

究其原因,最重要的一点在于所需数据难以共享——将深度学习应用到机器人领域,涉及到许多具体物理系统的表达。这意味着,所需数据往往是机器人领域的特定数据集。因此,研究人员在收集数据时,就要耗费较多时间;而在处理和环境相交互的主动系统时,则会更加费时。

近日,来自鲁汶大学的两位研究人员Klaas Kelchtermans和Tinne Tuytelaars就为解决这一问题展开了研究,并将研究成果撰写成论文《How hard is it to cross the room ? - Training (Recurrent) Neural Networks to steer a UAV》,发布在了arXiv上。AI科技评论对论文进行了部分编译。

论文地址:https://arxiv.org/abs/1702.07600

摘要

我们研究了在无人机导航控制中采用循环神经网络(RNN)代替前馈神经网络(FNN),是否能增加其活动的灵活性。实验条件是:无人机在执行高级导航任务时,需要用前视摄像头收集信息。

为了让无人机通过模仿学习学会执行导航任务,我们建立了一个用来训练神经网络、可应用于空中和陆地两种交通工具的通用框架。实验中,我们把框架应用于在模拟环境中飞行的无人机中,让它学习如何穿越有多障碍物的房间。

到目前为止,无人机控制的训练过程中通常只使用前馈神经网络。为了处理更多高难度的任务,我们提出,引入循环神经网络代替前馈神经网络,并且训练一个长短期存储器( LSTM)来控制无人机。

通过视觉信息进行控制属于序列预测问题,并且需要高相关性的输入数据。这一高相关性就使得训练神经网络,尤其是循环神经网络,变得不容易进行。

为了克服这一问题,我们在训练网络时采用了WW-TBPTT法(window-wise truncated backpropagation through time)。另外,考虑到端对端训练所需的数据通常无法获得,我们将“只对全连接(FC)进行再训练的控制层”和“只对长短期存储器控制层(所需网络为端到端的训练)进行再训练的控制层”的表现进行了对比。

最后,通过让无人机穿越有障碍物房间这一相对简单的实验,我们已经能看出训练神经控制网络所具有的重要指导意义和其良好的实践效果。可视化的差异性有助于解释无人机学习到的行为。

注:此图为论文中的图12——平均模仿损失对比图

实验变量:已知和未知的房间、无人机用不同构架的神经网络和不同训练方法进行控制、是否有摄像头;

S-LSTM 用S-TBPTT训练、WW-LSTM用WW-TBPTT。

探讨和结论

此研究中,我们测试了在导航控制中,存储器(图12)能如何帮助深度神经网络更高效地运作。

结果表明,用WW-TBPTT去除训练数据的相关性,在训练如长短期存储器这样的循环神经网络时,极其有帮助。尽管使用WW-TBPTT 法会使实验方差增大,计算存储值的过程也使训练变慢(如图12最右边一组条形图),但它能通过时间长度有效避免滑动截断反向传播的顺序偏差(the sequential bias of sliding truncated back propagation)。

另外,实验结果表明,预先训练网络也非常有意义。在导航控制试验中,仅仅重训练最后一层卷积网络全连接层(如Inception),比训练端对端训练网络表现更好。训练端对端网络不仅需要更多数据,而且时间也更长。也正是上述这个原因,机器人(AI科技评论注:这里指无人机)在实际应用中才不够灵活。

我们将公开“穿过房间一”和“穿过房间二”两次实验的数据集(它们代表了实验所需数据的复杂程度),让其他研究人员能以此为参考标准,学习导航控制。

最后,我们还想强调,想要打开深度学习这个黑箱子,差异化评价法和可视化是非常有必要的。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-03-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能头条

集成学习:机器学习兵器谱的“屠龙刀”

1114
来自专栏新智元

Facebook AI实验室最新论文:图像检测的无监督学习(下载)

新智元导读】Facebook最近在美国的日子不算好过。据英国《卫报》报道,Facebook平台上广受欢迎的新闻推送功能实际上严重依赖于编辑团队来决定新闻内容的取...

3558
来自专栏悦思悦读

开发一款A股选股器

作者在自学机器学习的过程中,尝试开发了一个基于机器学习的A股选股工具。本文是在赤兔的“数据挖掘”小组分享的此次开发过程和心得体会的整理。 股票价格的可预测性——...

3406
来自专栏ATYUN订阅号

【学术】试试这个!研究人员设计出了更好的推荐算法

改进的推荐算法在评级数据“稀疏”的情况下尤其有效。 ? 亚马逊和Netflix等网站的推荐系统使用了一种名为“协同过滤”的技术。为了确定一个给定的客户可能喜欢...

3315
来自专栏人工智能头条

开发者成功使用机器学习的十大诀窍

1034
来自专栏量子位

第四范式陈雨强:万字深析工业界机器学习最新黑科技

转载自 第四范式公众号 近日,全球最顶级大数据会议Strata Data Conference在京召开。Strata大会被《福布斯》杂志誉为“大数据运动的里程碑...

3379
来自专栏机器之心

专访 | AutoML初创公司探智立方:模型的物竞天择与适者生存

在国内,探智立方就是持有这样愿景的一家公司,这家成立于今年年初的公司致力于开发一个有「自主模型设计」能力的平台——DarwinML——以进化算法为基础,找到模型...

963
来自专栏新智元

【视觉目标跟踪最高峰】VOT Challenge 2017 亚军北邮团队技术分享(附代码)

【新智元导读】视觉跟踪领域国际顶级赛事 Visual-Object-Tracking Challenge (VOT) 2017年结果出炉,结合传统滤波及深度学习...

3457
来自专栏机器之心

业界 | 谷歌官方揭秘AutoDraw人工智能绘画工具原理:让机器学会理解艺术

选自GoogleBlog 作者:David Ha 机器之心编译 参与:黄小天、李泽南、李亚洲 谷歌 4 月 11 日推出的 AutoDraw 是一个应用人工智能...

3498
来自专栏腾讯技术工程官方号的专栏

协同过滤在新闻推荐CTR预估中的应用

作者简介:minlonglin,AI平台部Y项目组员工。2012年毕业于中国科学技术大学计算机科学与技术学院,读博期间主攻集成学习、类别不平衡分类等方向,期间曾...

2618

扫描关注云+社区