针对高分辨率雷达和相机的无标定板的像素级外参自标定方法

3D视觉工坊

发布于 2021-10-11 13:35:49

7540

发布于 2021-10-11 13:35:49

文章被收录于专栏：3D视觉从入门到精通

介绍：固态激光雷达和相机的外参标定系统

摘要

这是今年的一篇针对高分辨率的固态激光雷达（非重复性扫描型）或者多线的激光雷达和相机在无标定板的环境中自动化外参标定的一篇文章。本文的方法不需要基于巧克力板，只依赖两个传感器采集的环境中的线特征就可以得到像素级精度的标定结果。在理论层面，作者分析了边缘特征提供的约束和边缘特征在场景中的分布对标定精度的影响。同时，作者分析了激光雷达的测量原理，并提出了一种基于点云体素分割和平面拟合的高精度的激光雷达点云边缘特征提取的方法。由于边缘特征在自然场景中很丰富，所以作者在室内和室外多个数据集上进行了实验并取得了不错的效果。

代码已经开源：https://github.com/hku-mars/livox_camera_calib

介绍

雷达和相机是自动驾驶车辆中常用的传感器。雷达可以直接测量环境的三维信息，所以经常被用在障碍物检测、跟踪和建图。相机可以提供丰富的颜色信息，而且能和雷达的数据互补。随着雷达的分辨率快速增长，对于精准的外参的需求也增加了。基于激光和视觉可以进行构建稠密的点云图，点云着色和精准的3D测量。

当前的标定方法还是主要基于标定板或者特殊的图像标志，通过检测、提取和匹配在图像和点云中的特征然后基于最小二乘的方法计算。传统的激光雷达如velodybe这种采用重复扫描和机械结构造成点云稀疏且噪声很大，这样可能导致代价函数产生不稳定的结果。固态激光雷达例如livox可以很好的利用非重复性扫描的特性产生稠密的点云。但由于标定的target常常放在离标定的传感器不远的地方，这就造成了在场景深度比较大的场景中，外参的标定结果可能会很差。例如在大场景中的点云着色。此外，基于特定标定目标的方法也是相对来说比较麻烦的，我们其实还是喜欢基于自然场景中的信息进行标定。

为了解决上述的问题，本文提出了一个不基于target的像素级的自动化标定的方法。系统通过检测图像和点云中的线特征，最小化重投影误差得到得到准确的外参。系统可以应用在室内或者室外的场景中，并且这种不对场景提出需求的方法可以允许我们在数据采集的任何时刻进行标定。具体来说，本文的贡献主要有：

作者自信的研究了lidar的测量原理，研究结果表明常用的基于深度不连续的边缘特征提取的方法不准确也不可靠。作者提出了新颖可靠的深度连续边缘的特征提取算法。
作者在室内和室外对本文的方法进行了评测，结果标定的结果都很准确，并在自然场景中实现了像素级的标定结果。除此之外，本文的方法同时适用与固态和传统的机械雷达。
作者开源了标定的代码。

方法

A. 概述

下图定义了对应的坐标系：雷达系L，相机系C和2D的图像平面。同时认为激光是视觉之间的外参是一个未知量。由于环境中存在大量的边缘特征，本文的方法基于边缘特征对齐雷达和图像。

上图也表明了单个边的约束。可以看出来，雷达相对于相机的一些自由度的位姿是不能得到的：

沿着边缘的平移量；
垂直于边缘的平移量
绕边缘点和焦点构成的平面的法向量的旋转
绕边缘方向的旋转

实际上，一个边缘特征可以构建两个关于外参的有效的约束。为了获得足够的外参的约束，作者检测了不同位置的不同朝向的边缘特征。

B.边缘特征检测和匹配

1）边缘检测：一些存在的工作把点云投影到图像平面，然后从投影的点云中检测特征，例如边缘特征和互信息关联。利用投影后的点检测特征的一个问题是由于遮挡引起的多值和零值的问题，如下图a所示。如果相机在激光雷达的上方，A部分就会因为遮挡导致相机看得到但是激光看不到，结果导致没有点投影到这部分，深度值全部都是0；另外B部分激光雷达看得到但是相机看不到，这就导致这部分点干扰前景点的投影。这就导致前景点和背景点都投影到了图像的相同区域，一个地方有多个深度值。这种现象对于低分辨率的LIDAR可能不明显，但是在高分辨率的雷达中很明显。这种问题会导致在投影的点云中提取错误的特征，或者造成和图像中特征匹配错误的匹配。

为了避免投影造成的零值或者多值问题，作者之间在点云上检测边缘特征。这里主要有两种边：深度连续的和深度不连续的，如上图4所示。深度不连续的边指的前景后背景物体深度有跳变的地方；而深度连续的边指平面上深度连续的连接线。很多存在的方法都是基于深度是否连续来提取线特征，因为可以很容易基于点的深度来检测。但是在研究了lidar的测量原理后，作者认为这种方法在高精度的标定中是不可靠，不准确的。像下图，实际的激光脉冲不是理想的点，而是具有一定发散角的光束。当从前景物体扫描到背景物体时，一部分激光脉冲被前景物体反射，而其余的则被背景反射，产生两个反射脉冲到激光接收器。在前景物体反射率高的情况下，第一个脉冲的信号将占主导地位，使光束中心线偏离前景物体，这也会导致前景物体的错点超出实际边缘。当从前景物体扫描到背景物体时，一部分激光脉冲被前景物体反射，而其余的则被背景反射，产生两个反射脉冲到激光接收器。在前景物体反射率高的情况下，第一个脉冲引起的信号将占主导地位，即使光束中心线偏离前景物体，这也会导致前景物体的假点超出实际边缘。这两种现象都会错误地使前景物体膨胀，并在边缘提取和校准中造成重大错误。

为了避免前景点膨胀或者错点导致的深度不连续的边缘，本文提取深度连续的边。像上图6显示的过程：

首先把点云划分为大小一定的体素（室内0.5m，室外1m）；
对于每个体素，反复使用 RANSAC 来拟合和提取体素中的平面；
然后，保存在一定角度范围内的平面对（例如，[30°, 150°]）并求解平面相交线（即深度连续边）。

如图 6 所示，本文的方法能够在一个体素内提取多条相互垂直或平行的相交线。此外，通过选择合适的体素的尺寸，我们可以检测出来曲线边缘。

下图显示了在外参正确的情况下提取场景中深度连续和不连续的边。不连续的边的提取是基于Bundle adjustment for lidar mapping中介绍的曲率的概念做的。可以看出来，深度连续边的噪声更小，更准确。对于图像中的线特征，可以直接基于Canny算法。把检测出来的线特征保存成2Dtree的格式用于快速的索引匹配。

2）匹配：检测出来的激光的边缘特征需要和视觉的边缘特征匹配。对于每一个雷达边缘，采样边缘上的点，每一个采样点通过当前估计出来的（可能不是最准的）外参投影到相机平面：

其中：

利用刚体变换可以得到激光点在相机坐标系下的位置，然后利用针孔模型把相机坐标系下的点投影到图像平面上，得到激光点在图像上的位置：

最后根据相机的内参标定参数，得到相机的畸变系数，去畸变后激光点在图像中的位置为：

然后利用图像中的边缘像素构成的kd-tree搜出来k个最近的点，可以得到一个集合Q，然后计算：

可以得到均值和方差，然后利用边缘上的一点q和由协方差矩阵的最小特征值对应的特征向量得到边缘特征方向n得到边缘特征的表达式。同时，作者也把边缘特征的方向投影到了图像平面并验证其和计算得到的n的正交性（一个线段方向，一个法向量）。这也可以快速的去除那些距离很近但是又不平行的错误匹配。下图显示了提取的 LiDAR 边缘特征（红线）、图像边缘特征（蓝线）和匹配（绿线）。

C. 外参标定

1）测量噪声：提取得到的雷达边缘点和对应的图像边缘特征（q,n）受到测量噪声的影响，设满足零均值高斯分布的w是图像中边缘特征的噪声，方差为1.5（由于像素的离散性）。同样的，激光点云的边缘特征也有测量噪声。在实际的测量中，激光雷达通过扫描电机中编码器的方向和激光点的飞行时间来测量深度信息。设ωi表示测量得到的电机轴向方向，而δωi ∼ N (0_2*1 , Σωi )表示ωi在切平面上的测量噪声（如上图所示），然后利用“田”运算通过测量得到真实的测量角：