Waymo和特斯拉都在做的事,“AI民工”要失业了“GGAI布道”

一套强大的传感器套件+神经网络的计算“大脑”,是保证自动驾驶能够在感知车辆周围环境并做出安全、合理决策的关键。

为了建立强健的神经网络,我们需要大量多样的训练数据。同时,通过真实路测和仿真测试来训练机器学习模型,并不断改进自动驾驶技术。

过去几年,在“人脸识别”、“自动驾驶”、“语音识别”等应用领域崛起的背后,核心依然是要求精准的标注数据。

有数据显示,中国有10万名全职数据标注员和100万名兼职数据标注员,他们用人工标注为人工智能数据训练模型提供最重要的“燃料”。

一些所谓的AI公司,一年在数据采集、标注外包业务上都要支付数百万甚至是数千万的费用。但这种依靠人工的数据标注,依然无法达到100%的精确度。

此外,传统采集及分析数据的过程,大多是通过车队采集、给样本数据贴标签的方式进行——这种方式既费时又费钱。让任务变得更加困难的是,某些情况不太可能经常发生。

为了充分利用边缘场景,并进一步改善自动驾驶系统的感知,一直以来Waymo与来自谷歌大脑的团队合作,扩展自动数据增强研究,并在数据集上进行测试。

一、增加没有新数据的数据集

数据的不断扩充使得自动驾驶训练可以增加数据量和多样性,而不需要额外的收集或标记成本。

扩充数据背后的原理很简单:假设你有一张狗的照片。通过使用各种图像增强操作,如旋转、剪切、镜像、颜色变换等,可以对照片进行变形和变换,但这并不能改变这是一张狗的图像的事实。

这些简单的转换将一张狗的图像转换成许多张,尽管确定使用哪些增强操作组合并应用它们需要大量的手工工程。

利用AutoAugment工具,谷歌大脑设计了一个由扩充策略组成的新搜索空间——扩充操作的组合。他们能够通过强化学习自动探索使用哪些增强策略。

通过从数据本身寻找最优的图像转换策略,谷歌大脑能够改进各种学术数据集上的图像识别任务,并将这些思想扩展到COCO数据集上的对象定位问题。

他们还发现了一种方法,可以大大降低搜索有效数据扩展策略的计算成本,使其成为一种有效且廉价的工具,可以使用它来收集超过2000万英里的公共道路上的自动驾驶数据集。

二、应用到激光雷达点云

在谷歌大脑团队的协作下,Waymo正在扩展这项研究,以自动发现最佳数据增强策略,从而改进现有Waymo Drive系统的感知能力。

在2019年,Waymo开始将自动数据增强技术从RandAugment应用到基于Waymo图像的分类和检测任务中。他们在几个分类器和探测器上取得了显著的进步,包括那些有助于对外来物体(如建筑物和动物)进行分类的分类器。

在基于图像的数据取得成功后,Waymo探讨了自动数据增强策略是否也可以改善激光雷达的3D检测任务。

激光雷达是Waymo的核心传感器之一。它不仅能绘制出300米外的3D环境,还为自动驾驶技术提供了重要的背景数据,告诉系统物体在哪里,它们可能去哪里。

由于Waymo定制设计的激光雷达能够提供详细的三维信息,基于激光雷达的模型是系统的关键,并确保准确地检测和跟踪所有在道路上的物体。

为了提高激光雷达点云检测模型的质量和鲁棒性,通常采用数据增强的方法,但是现有的增强策略由于手工设计而受到限制。由于没有现成的点云扩展解决方案,Waymo决定自主构建一个。

与图像不同,扩大激光雷达点云是一个更复杂的整体维度。因此,用于图像分类和目标检测的自动增强技术的搜索空间不能直接用于点云。

由于三维数据中几何信息的性质,点云的变换通常有大量的参数,包括几何距离、运算强度、采样概率等,而某些图像增强技术,如颜色变换,根本不适用于单色的三维数据。

因此,Waymo创建了一个新的点云扩展搜索空间,以发现专门为点云数据集设计的策略。一种新的激光雷达点云增强策略,创建的搜索空间包括八个增强操作。

每个增强操作都与一个概率和特定的参数相关联。例如,GroundTruthAugmentor有参数表示采样车辆、行人、骑自行车的概率,而GlobalTranslateNoise操作有参数表示平移操作在x、y和z坐标上的畸变大小。

为了自动地为激光雷达点云寻找良好的增强策略,Waymo创建了一种新的自动数据增强算法——基于渐进种群的增强(PPBA)。

PPBA建立在谷歌之前的基于种群的训练(PBT)工作的基础上,Waymo用进化计算训练神经网络,使用的原理类似于达尔文的自然进化论。

PPBA通过缩小每次种群迭代的搜索空间,采用在过去迭代中发现的最佳参数,有效地优化扩展策略。

通过在Waymo的开放数据集中自动增加激光雷达点云的数据,PPBA实现了跨越检测架构的显著性能改进。

开放数据集是迄今为止发布的最大和最多样化的多传感器自动驾驶数据集之一。Waymo的实验还表明,与随机搜索或PBA基线相比,PPBA在寻找数据扩充策略方面更快、更有效。

此外,由于依赖标记激光雷达数据来训练神经网络,PPBA还可以节省标记成本,从而提高数据处理效率,因为一个标记的样本可以变得很多。

Waymo开放数据集上的3D检测实验表明,使用PPBA比不增加训练网络的数据效率高10倍。

三、从实现功能到提升效率

实验表明,将自动数据增强技术应用于激光雷达数据,可以在不增加数据采集和标记的情况下显著提高三维目标检测效果。

数据效率的提高尤其重要,因为这意味着Waymo可以加快训练过程,改善第五代Waymo Drive系统的感知能力。

在这方面,特斯拉也有非常类似的策略来加速场景数据的积累。不过,和Waymo不同的是,特斯拉是基于庞大真实数据加快自动标注效率,Waymo则是基于有限数据的多元化标签效率,从降低对路测收集数据的压力。

特斯拉的创新,是一个名为3D自动标签工具,这被其视为全自动驾驶功能开发的重要组成部分。埃隆·马斯克最近证实,正在完成Autopilot核心基础代码和3D标注的工作,基于其超过22亿英里的真实驾驶数据。

“在标识方面,所有8个摄像头同时使用视频进行标识,比原有系统提升三个数量级的效率。“特斯拉的人工智能主管安德烈•卡帕西(Andrej Karpathy)表示,标注数据是一项成本极高的核心技术。

此前,大多数人工智能及自动驾驶公司采用人工处理方式,但特斯拉一直在尝试不同的机制来完善自动化标注平台。

比如,在预测其他车辆切入本车道场景,特斯拉利用其车队获取此类可能造成事故的数据。然后,这些信息被自动注释并用于训练神经网络,而神经网络又从可识别的模式中自我学习。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20200404A08CYE00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券