特征匹配--GMS: Grid-based Motion Statistics for Fast, Ultra-robust Feature Correspondence

GMS: Grid-based Motion Statistics for Fast, Ultra-robust Feature Correspondence CVPR2017 c++ code: https://github.com/JiawangBian/GMS-Feature-Matcher

主要本要针对特征匹配问题,提出了一个简单的基于统计的解决方法,可以快速区分出正确的匹配和错误的匹配,提高了匹配的稳定性。

首先来个直观的特征匹配图示

特征匹配是计算机视觉里一个基础性问题,对于特征匹配当前主要的问题在 robust 的匹配速度慢,快的匹配经常不稳定。 there is a wide performance gap between slow (but robust) feature matchers and the much faster (but often unstable) real-time solutions.

问题的核心在于邻域一致性这个约束的怎么利用。The central problem lies in the coherence constraints (neighboring pixels share similar motion) utilized in the more powerful feature correspondence techniques.

一致性是一个很强大的约束,但是稀疏特征不能很好的定义邻域。这导致基于一致性的特征匹配的计算量比较大,很难实现。 Coherence is a powerful constraint but sparse features lack well defined neighbors。 This causes coherence based feature correspondence [16, 42] to be both expensive to compute and complex to implement.

本文提出 GMS (Grid-based Motion Statistics) 可以有效的解决这个问题。 a means of encapsulating motion smoothness as a statistical likelihood of having a certain number of feature matches between a region pair. We show GMS can rapidly and reliably differentiate true and false matches

本文的核心思想很简单:运动的平滑性导致了匹配的特征点邻域有较多匹配的点。我们可以通过计数邻域的匹配点个数来判断一个匹配正确与否。 Motion smoothness induces correspondence clusters that are highly unlikely to occur at random. Thus true and false matches can be differentiated by simply counting the number of matches in their neighborhood.

2 Our approach

S_i is a measure of neighborhood support

Assumption 1. Motion smoothness causes a (small) neighborhood around a true match to view the same 3D location. Likewise, the neighborhood around a false match views geometrically different 3D locations. 运动的平滑性导致了正确的匹配点附近的邻域里的特征点也是一一对应的。

下面首先用数学的角度推导出 正确匹配点附近的邻域中正确匹配和错误匹配的概率分布。 最终的结论如下:

分布图示

我们的目标是:

下面是将上面的理论分析变成可以实际中的运行算法 主要解决下面四个问题: a) Efficient score computation through grid-cells; b) Which neighborhoods to use; c) How many grid-cells to use; d) How to compute an effectively threshold S

3.1. Griding the problem

a) Efficient score evaluation, 这里我们主要通过将图像分为 G = 20×20 网格来实现 Scores of potential cell-pairs are computed only once. All matches between cell-pairs deemed true are accepted

b) Grouping match neighborhoods (cell-pairs) for robustness. 这里我们计算了一个网络四周的3*3=9个网格,如下图所示

c) How many grid-cells should be used? 经验值 G = 20 × 20 cells for 10,000 features n 大约为 25

d) Thresholding S_ij to divide cell-pairs into true and false sets {T ,F}.

整个算法流程图如下所示:

效果对比图

Dataset details

F-measure, Recall and Precision vs baseline

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

首次成功用CNN自动生成代码:北大研究者搞定了炉石传说

北大研究者最近提出了使用卷积神经网络(CNN)解码器生成代码的方法,并在《炉石传说》数据集上进行了测试,效果超过了此前各类业内最佳模型。该研究的论文已被 AAA...

985
来自专栏AI研习社

无监督聚类问题中,如何决定簇的最优数量?

AI 科技评论按:聚类问题有一大经典难题:没有数据集的真实分类情况,我们怎么才能知道数据簇的最优数目? 本文会谈谈解决该问题的两种流行方法:elbow meth...

3616
来自专栏集智的专栏

使用腾讯云 GPU 学习深度学习系列之五:文字的识别与定位

本系列文章主要介绍如何使用腾讯云GPU服务器进行深度学习运算,前面主要介绍原理部分,后期则以实践为主。

11.4K6
来自专栏新智元

【一文看尽200篇干货】2018最新机器学习、NLP、Python教程汇总!

【新智元导读】本文收集并详细筛选出了一系列机器学习、自然语言处理、Python及数学基础知识的相关资源和教程,数目多达200种!来源既包括斯坦福、MIT等名校,...

1564
来自专栏AI科技评论

干货 | 元旦,一起NLP!(下)

0.Roadmap 1. 模型 | 语言模型与词嵌入 2. 模型 | LSTM 3. 盘点 | 那些顶级会议 4. 模型 | Seq2Seq 和 Attenti...

3605
来自专栏小鹏的专栏

tf25: 使用深度学习做阅读理解+完形填空

记的在学生时代,英语考试有这么一种类型的题,叫:阅读理解。首先让你读一段洋文材料,然后回答一些基于这个洋文材料提的问题。 我先给你出一道阅读理解 Big ...

5295
来自专栏人工智能

Bi-LSTM+CRF在文本序列标注中的应用

机器之心专栏 作者:触宝AI实验室Principal Engineer董冰峰 传统 CRF 中的输入 X 向量一般是 word 的 one-hot 形式,前面提...

6048
来自专栏机器之心

专栏 | Bi-LSTM+CRF在文本序列标注中的应用

3499
来自专栏QQ大数据团队的专栏

海量短文本场景下的去重算法

在大多数情况下,大量的重复文本一般不会是什么好事情,比如互相抄袭的新闻,群发的垃圾短信,铺天盖地的广告文案等,这些都会造成网络内容的同质化并加重数据库的存储负担...

11.5K2
来自专栏大数据挖掘DT机器学习

深度学习word2vec笔记(算法篇)

一. CBOW加层次的网络结构与使用说明 Word2vec总共有两种类型,每种类型有两个策略,总共4种。这里先说最常用的一种。这种的网络结构如下图。 ? 其中第...

3684

扫码关注云+社区