在实际应用中,选择哪种或哪几种算法组合,取决于具体的应用场景、对精度和速度的要求、以及点云数据的特性。所有算法都在努力解决点云配准的两个核心挑战:1) 大初始位姿偏差(由特征法、全局法、深度学法解决);2) 高精度对齐(由ICP、NDT及其变种解决)。
概述
点云配准算法可以从不同维度分类,一个常见的分类方式是按照是否使用特征以及配准的步骤来划分:
基于匹配的算法: 寻找点与点之间的显式对应关系。
- 基于特征描述子(Feature-based)
- 基于几何一致性(Geometric-based)
基于优化的算法: 不建立显式对应关系,而是优化一个整体对齐的度量。
- ICP家族(Point-to-point, Point-to-plane, Plane-to-plane)
- NDT家族(NDT, V-NDT)
全局配准算法: 不需要初始位姿猜测,试图直接找到全局最优解。
- 基于穷举搜索(Branch-and-Bound)
- 基于随机采样(RANSAC-based)
深度学习配准算法: 利用神经网络学习点云的特征表示或直接预测变换参数。
1. 基于特征描述子的方法
这类方法不直接使用原始点,而是先从点云中提取关键点并计算它们的特征描述子,然后通过描述子的相似性来建立点对点的对应关系。
原理:
- 关键点检测:在两点云中分别提取对旋转、平移、噪声具有一定不变性的特征点。
- 特征描述:为每个关键点计算一个描述其周围局部几何特征的向量(描述子),好的描述子应具有判别性(不同点差异大)和鲁棒性(同一点在不同视角下差异小)。
- 特征匹配:通过比较描述子之间的相似度(如欧氏距离),为源点云中的关键点在目标点云中寻找对应点。
- 误匹配剔除:使用诸如随机采样一致性或几何一致性约束的方法,剔除错误的匹配对。
- 变换估计:基于正确的匹配对,通过SVD等闭式解计算最优的变换矩阵。
代表性算法/描述子:
- FPFH (Fast Point Feature Histograms): 一种轻量级且高效的描述子,将点邻域内的法向量差异统计成直方图。
- SHOT (Signature of Histograms of OrienTations): 将点的局部邻域划分成多个扇形区域,在每个区域内统计法向量的分布,形成直方图。
- 3DSC (3D Shape Context): 3D形状上下文,将点周围的空间划分为多个距离和角度的箱体来生成描述子。
特点:
- 优点:适合大位姿初始偏差的情况,可用于全局粗配准,匹配速度快,因为只需要处理少量关键点。
- 缺点:配准精度最终取决于描述子的匹配精度,通常低于ICP/NDT,因此常作为粗配准步骤,为ICP/NDT提供良好的初始值,在特征匮乏的场景(如平坦的墙面、地面)效果差。
2. 全局配准算法
这类算法的目标是在没有初始位姿猜测的情况下,尽可能找到全局最优的变换,避免陷入局部最优,通常计算量较大,但能解决ICP/NDT对初始值敏感的核心问题。
原理:
- 基于采样一致性:最著名的代表是RANSAC,随机从匹配对中采样最小集(3对点),计算一个变换模型,然后用这个模型去验证所有其他匹配对,统计内点(符合该模型的点对)的数量,重复这个过程多次,最终选择内点数量最多的那个变换模型。
- 基于分支定界:例如Go-ICP算法,将旋转和平移参数空间离散化,以一种全局搜索的方式(使用分支定界策略)来寻找使得误差函数最小的变换参数,理论上可以找到全局最优解。
特点:
- 优点:不需要初始值,能够应对任意初始位姿,是解决局部最优问题的强大工具。
- 缺点:计算成本非常高,非常耗时,通常只用于离线处理或非常关键的粗配准步骤。
3. 概率分布方法
这里介绍一种代表性算法,GMM (Gaussian Mixture Model) Registration:
原理: 将点云建模为一个高斯混合模型,配准问题转化为两个GMM模型之间的对齐问题(通常使用KL散度或L₂距离作为度量),通过优化使得两个分布最相似。
特点: 有坚实的概率理论基础,对噪声和离群点非常鲁棒,但优化过程复杂,计算量巨大,在实际工程中应用较少。
4. 基于深度学习的配准方法
这旨在利用神经网络强大的特征学习能力来解决传统方法的痛点。
原理:
- 特征学习:网络直接从原始点云中学习具有判别性和鲁棒性的特征表示,替代手工设计的描述子(如FPFH)。
- 匹配:通过网络学习的特征来建立点对点的对应关系。
- 变换预测:与传统方法类似,基于预测的对应关系通过SVD计算变换矩阵,网络直接回归输出变换参数(旋转和平移)。
代表性工作:
- PointNetLK: 结合PointNet和经典LK算法的思想,实现端到端的配准。
- DCP (Deep Closest Point): 模仿ICP流程,但使用Transformer网络来学习上下文信息,从而预测更准确的对应关系。
- RPM-Net: 将模糊对应关系引入网络,使其对初始化和噪声更鲁棒。
特点:
- 优点:学习到的特征往往比手工设计的特征更强大,对噪声和遮挡更鲁棒,部分网络对初始值不敏感,一旦训练完成推理速度快。
- 缺点:需要大量标注数据进行训练(虽然有很多无监督/自监督方法),泛化能力可能受限(在训练集分布以外的数据上可能表现不佳)。
5. 算法之间的关系与工作流程
一个鲁棒、高精度的点云配准系统通常是多种算法的组合,下图展示了一个融合多种算法的分层配准策略的典型工作流程:
- 分工与合作:特征法和全局法为局部法(ICP/NDT)提供良好的初始估计,局部法在此基础上实现高精度对齐。
- 演进与发展:深度学习方法是传统特征法的升级,用学习到的强大特征替代手工特征。