学界 | 英特尔&丰田联合开源城市驾驶模拟器CARLA

选自arXiv

机器之心编译

参与:Nurhachu Null、刘晓坤

英特尔实验室联合丰田研究院和巴塞罗那计算机视觉中心联合发布 CALRA,用于城市自动驾驶系统的开发、训练和验证的开源模拟器,支持多种传感模式和环境条件的灵活配置,论文中详细评估并比较了三种自动驾驶方法的性能。

模拟器和配套的资源将会发布在官方网站:http://carla.org。

论文:CARLA:An Open Urban Driving Simulator

论文链接:https://arxiv.org/abs/1711.03938

摘要:本文介绍一款用于自动驾驶研究的开源模拟器:CARLA。CARLA 的开发包括从最基础的直到支持城市自动驾驶系统的开发、训练和验证。除了开源代码和协议,CARLA 还提供了为自动驾驶创建的开源数字资源(包括城市布局、建筑以及车辆),这些资源都是可以免费获取和使用的。这个模拟平台能够支持传感套件和环境条件的灵活配置。我们使用 CARLA 来研究三种自动驾驶方法的性能:传统的模块化流水线,通过模仿学习训练得到的端到端模型,通过强化学习训练得到的端到端模型。这三种方法在难度递增的受控环境中做了评估,并用 CARLA 提供的指标进行性能测试,表明 CARLA 可以用来进行自动驾驶的研究。在这个网址中可以看到补充的视频:https://youtu.be/Hp8Dz-Zek2E。

图 1:四种不同天气下城市 2 中的一条街道(第三人称视角)。从左上顺时针开始:晴天、雨天、雨后、晴朗的黄昏。在补充视频中可以看到模拟器中的录像。

图 2:CARLA 提供的三种不同模式的传感。从左到右依次是:正常的摄像头视觉、真实深度、真实语义分割。深度和语义分割是由支持控制感知作用实验的伪传感器提供的。额外的传感器模型可以通过 API 接入。

我们在四个难度递增的驾驶任务重测评了这三种方法—模块化的流水线(MP)、模仿学习(IL)、以及强化学习(RL),每个测评都分别在两个不同的城市和六种天气条件中进行。需要注意的是,我们在四个任务上对这三种方法的测试使用的是同一个智能体,并没有为某个场景而单独地去微调一个模型。任务被设置为目标导向的导航:智能体被初始化在城市的某个地方,然后它必须到达指定的目的点。在这些实验中,允许智能体忽略速度限制和交通信号灯。我们遵循难度递增的顺序来安排这些任务,如下:

1. 直线:出发地点和目的地在同一条直线上,而且环境中也没有运动的物体。平均行驶距离是:城市 1 中 200m,城市 2 中 100m。

2. 一次转弯:从出发点到目的地需要一次转弯;没有运动的物体。平均行驶距离是:城市 1 中 400m,城市 2 中 170m。

3. 导航:没有与出发点相关的目的地的严格限定,没有运动的物体。距离目标的平均行驶距离是:城市 1 中 770m,城市 2 中 360m。

4. 具有运动障碍物的导航:与上一个的任务一样,但是有运动的障碍物(包括车辆和行人)。

表 1:三种自动驾驶系统在目标导向导航任务中的量化测评。这张表记录了在每一种环境下每个不同的方法成功完成某个任务中的片段所占的百分比,越高越好。被测试的三种方法分别是:模块化流水线(MP)、模仿学习(IL)、以及强化学习(RL)。

表 1 记录了在每一种环境下每个不同的方法成功完成某个任务中的片段所占的百分比。首先是训练条件:城市 1,训练天气集。要注意,测试中和训练过程中使用的起点和目标点是不一样的:只有通用的环境和条件是一样的。其他三种实验条件均设置在具有挑战性的泛化中:之前从未见过的城市 2 以及从未见过的训练天气集。

表 1 中的结果证明了以下结论。总之,即便是在直线行驶的任务中,三种方法都不是完美的,成功率随着任务难度的增加急剧下降。泛化到新的天气要比泛化到新的城市更加容易。模块化流水线法和模拟学习的方法在大多数任务中的性能都平分秋色。强化学习方法的性能赶不上前两者。我们现在更具体讨论一下这四个关键结论(见原文)。

表 2:两次违规行驶之间的平均行驶距离从(km)。数字越大,性能越好。

违规分析:CARLA 支持细粒度的驾驶规则分析。我们现在测试一下这三个系统在最难的任务上的行为:在具有运动障碍物的环境中导航。我们用这三种方法在五种不同类型的两次违规间行驶的平均距离来描述它们的性能:在相反的车道上行驶,在人行道行驶,与其他车辆并道行驶,与行人并道行驶,碰到静态物体。附录中有具体细节。

表 2 记录了在两次违规行驶之间驾驶的平均距离(km)。所有的方法都在训练的城市 1 中表现更好一些。对于所有的实验条件,模仿学习偏离到对向车道的频率是最低的,强化学习的质量是最糟糕的。在偏向人行道的情况中也是类似的模式。令人惊讶的是,强化学习与行人冲突的频率是最低的,也许这可以通过在这种碰撞中得到的巨大的负面回报来解释。然而,强化学习智能体在避免与行驶的车辆以及静态障碍物发生碰撞时不够成功,而模块化流水线方法通常能够在这些测试中表现得最好。

这些结果突出了端到端方法对罕见事件的脆弱性:在训练期间很少遇到急刹车或者急转弯来避免与行人碰撞的情况。尽管可以在训练期间加大这类事件的频率以支持端到端训练方法,但是为了得到在鲁棒性上的重大突破,学习算法和模型架构上的深层进展是很有必要的。

本文为机器之心编译,转载请联系本公众号获得授权。

原文发布于微信公众号 - 机器之心(almosthuman2014)

原文发表时间:2017-12-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

专栏 | 滴滴KDD2017论文:基于组合优化的出租车分单模型

机器之心专栏 机器之心编辑部 数据挖掘顶会 KDD 2017 已经开幕,国内有众多来自产业界的论文被 KDD 2017 接收。本文是对滴滴 KDD 2017 论...

3808
来自专栏CSDN技术头条

机器学习工作职位需要的7项技能

机器学习经常与人工智能紧密相连,在不考虑显式编程的情况下,机器学习可以使计算机具备完成特定任务的能力,例如识别,诊断,规划,机器人控制和预测等。它往往聚焦于算法...

2005
来自专栏数据科学与人工智能

【机器学习】机器学习工作职位需要的7项技能

机器学习经常与人工智能紧密相连,在不考虑显式编程的情况下,机器学习可以使计算机具备完成特定任务的能力,例如识别,诊断,规划,机器人控制和预测等。它往往聚焦于算法...

2479
来自专栏数据科学与人工智能

【应用】信用评分:第3部分 - 数据准备和探索性数据分析

因此,**数据准备是任何数据挖掘项目的关键方面,包括信用评分卡的开发。 **这是CRISP-DM周期中最具挑战性和耗时的阶段。 项目总时间中至少70%,有时多于...

1261
来自专栏ATYUN订阅号

强化学习开源项目:自己动手创建虚拟自动驾驶汽车

想象一下,你生活在一个没有交通拥堵,没有交通事故,也无需花费时间开车的世界,那会多美好。

5422
来自专栏数据科学与人工智能

【算法】推荐算法--协同过滤

协同过滤推荐(Collaborative Filtering recommendation)是在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内...

1541
来自专栏生信宝典

引起相变的无序结构域(IDRs)怎么预测?跟踪热点,提升文章档次!

蛋白研究过程中,一般认为氨基酸的序列决定了蛋白的结构,结构决定功能(一般指蛋白的三维结构)。然而,近50年的研究中,有一种没有特定三维结构的蛋白不断被研究人员发...

2482
来自专栏机器之心

业界 | 对比了六家计算机视觉API,发现最好的竟然是...

选自free Code Camp 作者:Mariya Yao 机器之心编译 参与:蒋思源、刘晓坤 本文通过吉娃娃与松饼的图像对比了流行的六大计算机视觉API,...

3726
来自专栏ATYUN订阅号

Berkeley发布BDD100K:大型的多样化驾驶视频数据集

Berkeley发布了最大,最多样化的驾驶视频数据集,其中包含丰富的BDD100K注释。您现在可以访问bdd-data.berkeley.edu上的数据进行研究...

1042
来自专栏新智元

深度|详解自动驾驶核心部件激光雷达,它凭什么卖70万美元?

【新智元导读】作为自动驾驶汽车的核心部件之一,激光雷达传感器以昂贵出名,此前的价格高达70万美元,远超普通汽车。自动驾驶研究专家黄武陵在本文中介绍了激光雷达传感...

5196

扫码关注云+社区

领取腾讯云代金券