前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >CVPR2021 图像匹配挑战赛,双赛道冠亚军方案

CVPR2021 图像匹配挑战赛,双赛道冠亚军方案

作者头像
3D视觉工坊
发布2021-07-27 11:33:47
6680
发布2021-07-27 11:33:47
举报
文章被收录于专栏:3D视觉从入门到精通

来源:腾讯优图

近日,腾讯优图实验室在CVPR2021举办的Image Matching Workshop比赛中,提出的图像匹配技术 (SS-Fusing)荣获双赛道冠亚军。IMW2021是Google和University of British Columbia(UBC)联合举办的Workshop比赛,吸引了包括旷视,商汤,EPFL,KORNIA,华中科大和OPPO等公司、学校和机构参加。

作为计算机视觉领域的基础技术之一,Image Matching是指寻找一张图片中拍摄的子区域在另一张图片中的对应位置,广泛应用于包括SFM、SLAM、三维重建、大规模图像检索,缺陷检测与配准等领域。

图1 图像匹配技术示例

本次比赛的评测机制如图2所示,参赛者根据自己提出的方法提取每张图的关键点和对应描述子,并提交每两张图之间的匹配结果,赛方会根据提交的结果统计两种评估方案:

1、通过对比两张图之间匹配结果对应的相机位姿和真实位姿之间的差异(Stereo)。

2、根据多张图之间的关键点匹配结果,统计重建后预测全图的相机位姿和真实位姿之间的差异(Multi-view)。因此对于任意两张图之间,关键点的分布越分散,匹配的点越准,则位姿估计的效果越好。

图2 比赛流程图

此外,本届比赛分为限制性赛道(Restricted category)非限制性赛道(Unlimited category),其中限制性赛道要求参赛者提交有限的关键点和对应描述子,非限制性赛道可提交不限数量的关键点对和对应描述子。相较于前两届比赛,本届比赛增加了街景和公园等场景,图片之间的角度和尺度变换更大,对算法挑战非常大,因此我们同时针对关键点的提取部分和匹配准确度部分都做了相应的改善,具体思路如下:

SuperPoint+Autoencoder+Super-Glue作为我们的关键点匹配pipeline。其中SuperPoint用于提取关键点和对应描述子,Autoencoder用于特征压缩,SuperGlue用于关键点匹配,最后通过DEGENSAC进行离群点过滤。同时我们优化了SuperGlue的训练过程和损失函数,提升了模型在比赛数据集下的匹配精度。

图3 SS-Fusing算法流程图

我们针对输入图片进行随机变换增加了提取到的关键点对尺度变换的鲁棒性,同时提出了针对描述子的特征融合模块,以提升描述子的表达能力和尺度鲁棒性。同时我们还对比了我们的特征融合和平均特征融合的效果,其中横坐标为描述子的cos相似度,纵坐标为二者的分布差异,可见我们的方法在高相似度区域下的占比明显高于平均特征,而在低相似度区域下的占比明显低于平均特征,验证了我们方法的有效性。

图4 特征融合模块

图5 加权特征和平均特征相似度分布差异图

我们提出了前背景分割和coarse-to-fine的匹配结构,进一步提升关键点匹配的有效性。其中前背景分割可以有效过滤掉与匹配无关的背景部分。Coarse-to-fine的匹配结构可以提升拍摄尺度差异过大导致的匹配率过低的问题。

图6 前背景分离示意图

图7 coarse-to-fine匹配前后示意图

视觉图像匹配作为基础的计算机视觉能力,在其基础上可拓展众多的下游任务。如在图像检索中,可以通过image matching来检索到和Database中相似的图片,如图8所示。在SFM(Structure from motion)中,可以通过关键点匹配来获取摄像头外参并结合内参进行深度估计并重建出拍摄物体,如图9所示。在图像跟踪与配准中,通过前后帧的匹配可以捕捉视频的运动轨迹,并针对目标物体进行视频跟踪与图像配准,如下方视频所示。

图8 图像检索

图9 三维重建

视频:视频轨迹跟踪

作为腾讯旗下顶尖的人工智能实验室,优图实验室聚焦计算机视觉,专注人脸识别、图像识别、OCR等领域开展技术研发和行业落地,在推动产业数字化升级过程中,始终坚持基础研究、产业落地两条腿走路的发展战略,与腾讯云与智慧产业深度融合,挖掘客户痛点,切实为行业降本增效。

未来,腾讯优图实验室也将继续深耕CV技术,并将持续探索更多的应用场景和应用空间,让更多的用户享受到科技带来的红利。

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉,即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总,即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定,即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配,即可下载独家立体匹配学习课件与视频网址。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-07-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 3D视觉工坊 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
图像处理
图像处理基于腾讯云深度学习等人工智能技术,提供综合性的图像优化处理服务,包括图像质量评估、图像清晰度增强、图像智能裁剪等。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档