语义推理、道路偏离测试、车联网领域论文分别获得一二三等奖

海报论文展示可能是学术会议独有的风景,来自不同国家的学者围绕在一幅论文海报前面展开讨论。刚刚过去的IEEE IV2018会议上,海报论文展示同样受到了一大批专家学者的青睐,IV会议也专门设有“Best Poster Paper Awards ” (最佳海报论文奖),本文简述了获得Best Poster Paper(最佳海报论文奖)的三篇论文。

IEEE IV 2018 Best Poster Paper Awards

First Prize:

最佳海报论文奖(Best Poster Paper Awards)一等奖是一篇来自英国高校的论文MultiNet: Real-time Joint Semantic Reasoning for Autonomous Driving(自动驾驶的实时联合语义推理),第一作者Marvin Teichmann 是剑桥大学博士生,致力于深度学习和计算机视觉项目,他在 github 上建立了自己的数据库,而且小有名气。他在本篇论文中提出了一种新的方法并设计了一种网络架构,被命名为MultiNet,这个框架可以同时非常有效地执行分类,检测和语义分割等任务,它通过将所有三个任务合并到一个统一的编码器-解码器架构中来完成的。

图1.在一个正向通道中解决街道分类,车辆检测和道路分割

1.MultiNet架构的目的与优势

目前计算机视觉领域的进步已经很清楚地表明,视觉感知将在自动驾驶汽车的发展中发挥关键作用,在自动驾驶语义理解上的研究也越来越多。

在分类方面,随着 AlexNet 的发展,大多数现代的图像分类方法都利用深度学习。残差网络构成了最先进的技术,因为它们允许训练深度网络而没有消失或梯度爆炸等问题。在道路分类的背景下,深度神经网络也被广泛使用。传感器融合也被用于此背景。

在检测方面,传统的目标检测深度学习方法遵循两个步骤,首先生成region proposals (候选区域),然后使用卷积网络进行评分。通过将卷积神经网络(CNN)用于提取生成步骤,或通过3D推理,可以获得额外的性能改进。最近,有几种方法提出使用可以端到端训练的单个深度网络直接执行检测。这些方法优于 proposal-based 方法的主要优点是它们在训练和推理时间上都快得多,因此更适合于实时检测应用。然而,到目前为止,他们在性能方面远远落后。

在分割方面,受深度学习的启发,基于CNN的分类器适应了语义分割的任务。早期的方法利用 CNN 固有效率来实现隐式sliding-window(滑动窗口)。FCN被提议使用可训练的端到端深度学习来模拟语义分割。转换卷积用于上采样低分辨率特征。同时,越来越多的人也已经提出了各种更深层次的FCN。通过将FCN与条件随机场(CRF)相结合,可以获得非常好的结果。CRF中的平均场推断可以作为允许端到端训练的循环网络。也有人引入扩张的卷积,以增加接收场的大小而不会失去太多分辨率,同时结合残余网络是目前比较先进的。

在多任务学习方面,通过利用许多任务来学习更好的表示。在CNN的背景下提出几种方法,在其系统中,执行实例级任务,把语义标注被视为中间结果。

然而大多数语义理解方法都侧重于提高性能,比如识别率做得很高,但计算所花费的时间对于实现自动驾驶等实时应用显得也格外重要。MultiNet 利用 Deep-CNN 编码器,可以在所有任务之间共享产生的丰富功能,同时检测解码器将引入了快速回归模型设计的Yolo与尺寸可调的 ROI-align(区域特征聚集方式)的Faster-RCNN 和 Mask-RCNN 相结合,实现了更好的速度准确率。

2.MultiNet架构与方法

本文提出了一种端到端的可训练探测器,它可以显著降低性能差距。利用基于区域候选的主要优点,实现调整大小的功能,同时激发了ROI pooling 的实现。这种有效的前馈架构,可以推理语义分割,图像分类和对象检测。在三个任务上共享一个共同的编码器,并有三个分支,每个分支实现给定任务解码器。

图2.MultiNet基本架构

A)编码器

编码器的任务是处理图像并提取丰富的抽象特征,其中包含执行准确分割,检测和图像分类的所有必要信息。编码器由分类网络的卷积和池化层组成。使用在ImageNet 分类数据上预先训练的权重来初始化编码器的权重。作为编码器,可以使用任何现代分类网络。

该论文使用 VGG16 和 ResNet 架构的版本进行实验。第一种VGG编码器使用VGG16的所有卷积和池化层,但丢弃完全连接的softmax层。此版本称为VGG-pool5,因为pool5是VGG16中使用的最后一层。第二种实现仅丢弃最终完全连接的softmax层,此架构称为VGG-fc7,因为fc7是VGG16中使用的最后一层。VGG-fc7使用来自VGG的两个完全连接的层,即fc6和fc7,同时用相同的1×1卷积替换这些层。对于ResNet,使用了50和101层网络版本。作为编码器,利用除了全连接softmax层之外的所有层。

B)分类解码器

论文中提到共有两个分类解码器,一个版本是具有softmax激活的全连接层。该编码器与224×224的输入大小结合使用。第二类分类解码器旨在利用编码器实现高分辨率的功能。为了利用这些功能,首先应用一个带有30个通道的1×1卷积,该层用作 BottleNeck,主要目的是大大降低维度。

C)检测解码器

检测解码器被设计成类似于 ReInspect,Yolo和 Overfeat 的无提议方法。通过省略和人工构建生成器可以获得更快的推断。这对于构建具有实时功能的检测系统的目标至关重要。基于提议的检测系统与非基于提案的检测系统相比具有至关重要的优势。

D)分段解码器

分段解码器遵循FCN架构的主要思想,鉴于编码器产生的特征,本文使用1×1卷积层产生尺寸为39×12的低分辨率分割。然后使用三个转置卷积层对该输出进行上采样,跳过了连接从较低层提取的高分辨率特征。这些特征首先由1×1卷积层处理,然后添加到部分上采样结果中。

图3.检测编码可视化

3.训练细节

图4.MultiNet可视化输出

作者构建了自己的损失函数并在具有挑战性的KITTI数据集(the KITTI Vision Benchmark Suite)进行了实验评估,基准测试包含的图像显示了从卡尔斯鲁厄市周围移动平台获取的各种街道信息。除原始数据外,KITTI 还提供了许多标签,用于与自动驾驶相关的不同任务。如下视频内容所示,通过使用道路基准来评估语义分段解码器的性能和检测解码器的目标检测基准。利用GPS信息与开放街道地图数据相结合而生成的道路标签,检测性能分析平均精度得分。使用MaxF1得分评估分割性能。总体来说,使用VGG解码器的 MultiNet 在性能和速度之间提供了非常好的平衡。

4.结论

在本文中,开发了一种统一的深层体系结构,能够共同推理分类,检测和语义分割,可以做端到端地训练,并且在具有挑战性的KITTI数据集中表现非常出色,超越了道路细分任务中的最新状态记录,且执行所有任务只需要42.48ms。在未来,作者将计划利用压缩方法,以进一步减少MutiNet的计算瓶颈和能耗。

Second Prize:

最佳海报论文奖二等奖研究了道路偏离检测系统(RDDS),论文一作沈聃是印第安纳大学-普渡大学印第安纳波利斯分校TASI实验室博士。Transportation Active Safety Institute (TASI) 是以大学、工业界以及政府联盟的旨在促进智能交通主动安全系统的研究、开发和评估。作为一个跨校园的研究中心,来自美国IUPUI,印第安纳大学布鲁明顿分校和普渡大学希拉法叶分校均参与TASI 研究活动。主要研究内容包括:自动驾驶汽车测试和评估、碰撞数据分析、汽车智能控制以及车联网等。以下为论文简述:

近年来汽车智能化迅猛发展,很多汽车公司已经研发了用于避免或减轻由道路偏移而引起碰撞的道路偏离检测系统(RDDS)。为了给RDDS提供标准化和客观的性能评估,本文阐述了用于测试各种道路偏移检测系统的数据采集系统和数据处理系统的开发。在我们的工作中使用了七个变量来描述道路偏离的测试场景。通过对RDDS测试场景的分析,我们设计并介绍了用于评估自动驾驶汽车RDDS的数据采集系统和数据处理系统的总体结构和具体组成部分。试验结果表明,传感系统和数据处理系统可以有效捕捉所有需要的信号,并准确地显示测试车辆的运动轨迹和动力学信息。同时针对不同的测试场景和车辆运动曲线,RDDS测试系统均能有效和稳定地工作。

1.道路偏移系统研发的目的

道路偏离提前预警系统和道路保持系统是处理这一问题的两种主要的主动安全技术。目前开发的大多数车道或道路偏离预警和避让系统都是基于车道标记的检测。此外,由于道路边缘检测的技术困难,现今的道路偏离检测系统主要针对直道和略微弯曲的道路而进行研发。然而,许多路边没有车道标记或明显清晰的车道标记,尤其是在一些农村和居民区。因此,道路偏离检测和避让技术应依赖于在任何类型的道路上车辆能够检测和识别各种道路边缘以及道路边界物体。

最近,越来越多的主动安全技术被研究和开发用于高级RDDS的车辆电子稳定性控制系统。然而,一个基本问题仍有待回答:“如何评估和证明车辆RDDS在实际道路上的有效性?”目前业界已经提出了许多基于虚拟建模和计算机模拟的测试和验证方法。但是,结合虚拟模拟和实际测试的全面测试至关重要。因此,开发车辆道路偏离检测系统的测试方法很重要,比如在测试轨道上进行测试。

市场上的RDDS仅用于直道和略微弯曲的道路且道路标记清晰。这项工作的主要目标和主要贡献是开发一种综合方法,用于测试车辆道路偏离避让系统,以及评估有/无车道标记的所有类型道路上的RDDS的道路边缘检测和控制效率。该方法包括测试设备开发,数据收集和数据处理程序,并为下一代智能RDDS的开发提供实用指导。

2.道路偏离系统测试方法介绍

图1 道路偏离测试场景的总体方法与流程

道路偏离系统测试方法包含测试场景和测试系统整体结构两大部分。其中用于确定测试场景的关键参数是基于对美国国家权威碰撞数据库的分析而得出的,它们分别是,道路形状,道路半径,道路边缘类型,车辆偏离速度,车辆偏离角度,车辆偏离方向和光照情况。为对道路偏离检测系统进行标准化性能评估,我们给出了道路偏离测试系统性能评估的总体框架图。该系统包含:(1)数据采集系统,用于收集测试期间所需要的数据;(2)模拟路边物体,比如草地,金属护栏和混凝土等;(3)用于数据记录和后处理的计算机和控制系统,比如解码,分析和绘图显示。除了路边物体外,所有组件都通过Zigbee技术进行无线通信。

图2 道路偏离测试系统性能评估总体框架图

车辆道路偏离检测系统具有三个阶段。 RDDS首先发出视觉和/或声音警告,以警告驾驶员在车辆即将越过道路边界时采取纠正措施。如果驾驶员未采取任何行动,RDDS将主动施加适当的转向扭矩以将车辆推回道路上。如果车辆不能被推回并且车辆在路边,则可以应用自动制动。

为了评估道路偏离检测系统的性能,数据收集系统被设计用于捕获和记录测试车辆的运动轨迹,车辆的道路偏离检测动作的激活时间(警告,自动转向和自动制动)。和驾驶员的行为(转向和/或制动)。建议的数据采集系统结构如图3所示。数据采集系统由六个关键部件组成,包括传感器盒,差分GPS,车载计算机,车载摄像头,CAN记录器,车速显示监视器。用于测量测试车辆的运动曲线和速度,传感器盒捕获由车辆,驾驶员和环境产生的所有视觉,听觉和动作信号。这些信号包括制动踏板信号,制刹车灯信号,由穿过不同路面引起的车辆振动,和方向盘运动以及来自保险杠的冲击力。挡风玻璃上安装了车载摄像头以记录视频数据。

图3 数据采集系统总体框架图

其次本文提出了针对直道和弯道的汽车运动信息的算法。由PEAK-System开发的软件PCAN-View安装在车载计算机中,可以捕获来自CAN总线的所有原始数据并将其保存为原始测试数据文件便于以后处理。基于CAN-USB开发的GUI并根据下图的算法显示车辆分别在直道和弯道的偏离速度,车辆横向偏离速度和车辆偏离角,以帮助驾驶员遵循所需的汽车测试场景。

图4 基于直道的车辆运动信息

第一步 找出与汽车A在运动曲线上距离最近的点D

第二步 求出汽车在弯道上的运动信息

图5 基于弯道的车辆运动信息

为了分析道路偏离检测系统的性能,提出并实现了一种数据后处理方法。图中显示出用C#开发的用于数据后处理方法的软件的结构。数据后处理方法包括解码所有记录的数据,所有收集的数据的时间同步,用户界面设计,数据绘图和数据分析等。

图6 数据后处理系统的基本结构

3.实验与验证

论文中提出两种不同测试场景的数据和分析图。两组数据的路边物体均是草地。根据数据后处理的信息,系统可以依照用户需求生成大量有效信息,包含:到道路边缘的最小距离,发出警告到道路偏离的时间,和从发出警告到转向辅助的时间等。

测试场景1

测试场景2

图7 基于RDDS的测试数据

4.总结

论文中介绍了测试轨道上车辆道路偏离检测系统的数据采集系统和数据后处理方法的发展。提出了车辆道路离场测试系统的总体结构并说明了数据收集系统的综合结构和详细组成部分。试验证明,传感系统可以记录车辆运动曲线并正确捕获测试车辆所需的信号。还计算了直行道路和弯道路车辆横向速度和车辆偏离角的计算算法。设计并实施了数据后处理方法。试验结果表明,传感系统和数据后处理系统能够正确、准确地记录所有需要的信号并显示出具有不同道路偏离情况的测试车辆的所有车辆运动曲线,数据后处理软件也被证明是有效的。

Third Prize:

最佳海报论文三等奖是来自一篇法国的论文,该论文研究了用于异构V2X服务的设施层DCC 集成挑战(Integration Challenges of Facilities-Layer DCC for Heterogeneous V2X Services)。

整个欧盟都在布局车联网,实现标准统一化,2013年推出的欧盟地平线2020科研计划中,推动合作式智能交通、汽车自动化、网联化及产业应用。欧洲一直在重视V2X顶层设计和技术研发,基于802.11p的舱内通信(V2X)的抽象分散拥塞控制(DCC)是未来连接智能车辆分布式无线资源分配的关键机制。迄今为止的研究主要集中在优化单一合作意识服务的资源,而未来连接智能车辆将基于多种异构的新V2X服务。在本文中,提出了一个设施层DCC,针对目前欧洲正在进行的标准化,能够处理异构V2X服务并评估其与传统DCC机制的集成影响。文中首先强调了由于传统和设施层DCC之间的决策冲突而导致的重要无线资源的使用和应用程序性能下降。然后,展示了纯粹基于服务层的DCC机制的能力,并说明了它为智能车辆的V2X服务之间敏捷的无线资源分配的灵活性。

感谢各位关注IEEE IV 2018大会,该网盘照片是IEEE IV 2018的现场照片,按照时间排序,从6月25日开始注册到6月30日结束,分为签到注册、workshop、IPDA、IV现场、学生活动、融合论坛、晚宴、海报会场、展会、联合路演等部分,如有需求请自行查阅。链接:https://pan.baidu.com/s/1Cr5DQrkFn-8SvBRleibXpQ 密码:6bct。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180718B1XY8O00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券