自识别标记(self-identifying marker) -(3) 用于相机标定的CALTag源码剖析(上)

CALTag的源代码(MATLAB)可以从如下网址下载: https://github.com/brada/caltag 下面以一幅被遮挡的图I为例进行代码的详细分析:

1、 灰度图的二值化,计算连通区域

输入的灰度图为I,显示如下

二值化方法是基于Peter Kovesi在http://www.csse.uwa.edu.au/~pk/Research/MatlabFns/提供的adaptive thresholding方法。

T = adaptivethresh( I ); 

显示自适应二值化后的图像T:

用sobel算子检测边缘得到E,然后做了简单的形态学处理,去掉一些杂散的点,对应的代码如下

E = edge( I, 'sobel', 'nothinning' );
E = bwmorph( E, 'bridge' );
E = bwmorph( E, 'majority' );

显示E结果如下:

然后做了形态学里的细化,然后清理孤立的点

E  = bwmorph( E, 'thin', inf );
E  = bwmorph( E, 'clean' );

计算8邻域的连通区域,如果每个连通域内的像素点数小于阈值minDotEdgePixels(作者设为8),则删除掉该区域。

CC = bwconncomp( E, 8 );
nPixels = cellfun( @(x) numel(x), CC.PixelIdxList );
bad = find( nPixels < minDotEdgePixels );
CC = filtercc( CC, bad );
for i = 1:CC.NumObjects
    E(CC.PixelIdxList{i}) = 0;
end
E = bwmorph( E, 'close' );

将上述图反转~E的结果如下:

然后进行腐蚀得到如下结果

上述反转—腐蚀过程循环4次,然后寻找连通区域,上述过程下面一行代码搞定了:

CC = bwconncomp( bwmorph(~E,'erode'), 4 );

2、 过滤连通区域

上一步骤得到了不少连通区域(对应着自识别标记区域),这些连通区域的数目可能比实际的自识别标记数目多。这是因为一些随机的背景物体以及一些高纹理区域也会被检测为连通区域。下面的工作就是过滤连通区域,保留真正是自识别标记的那部分,过滤准则主要有两个:

1、 面积

假设code中的每个bit至少由一个2x2大小的像素组成,而一个自识别标记单元包括code和边界共有8x8个bit,那么每个标记包含的像素数目至少为16x16个像素,也是连通区域包含的最少像素数目。这个最小面积的限制会过滤掉很多细小区域,比如自然场景中的草、毛毯等高纹理区域。最大面积定义为输入图像尺寸的1/8,因为如果图片中的自识别标记少于8个的话无法完成标定。

2、 欧拉数

欧拉数描述的是区域的连通性。对一个给定平面区域来说,区域内的孔数H和区域内的连通组元(其中任2点可用完全在内部的曲线相连接的点集合)的个数C可被进一步用来定义欧拉数(Euler number)E=C-H。如下的几个字母从左到右欧拉数分别为:-1,2,1,0。

图像中欧拉数的定义是图像中的物体数目减去这些物体中孔洞的数目。计算连通区域的欧拉数就可以知道该区域内部有多少个孔洞。最大的孔洞数目就是当code黑白相间的情况,此时孔洞的数目是MN/2,对应的最小欧拉数就是1-(MN/2)。而自识别标记内部至少会有1个孔洞,所以最大的欧拉数为0。实际中,一般一个自识别标记内部的孔洞为1~3个。使用欧拉数来过滤连通区域的优势有两个:一是它的性能和图像分辨率无关,二是不需要参数调整。 代码中实现:

good = find( ([R.Area]>minRegionArea) & ([R.Area]<maxRegionArea) );
good = find( ([R.EulerNumber]>=minEulerNumber) & 
             ([R.EulerNumber]<=maxEulerNumber) );

经过过滤后的连通区域如下图。连通区域旁边的数字表示对应的欧拉数。

未完待续。。。

参考论文:

CALTag: High Precision Fiducial Markers for Camera Calibration 参考网站: http://www.cs.ubc.ca/labs/imager/tr/2010/Atcheson_VMV2010_CALTag/ https://github.com/brada/caltag

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据挖掘DT机器学习

TensorFlow实例: 手写汉字识别

MNIST手写数字数据集通常做为深度学习的练习数据集,这个数据集恐怕早已经被大家玩坏了。识别手写汉字要把识别英文、数字难上很多。首先,英文字符的分类少,总共10...

8645
来自专栏ATYUN订阅号

【实践操作】 在iOS11中使用Core ML 和TensorFlow对手势进行智能识别

在计算机科学中,手势识别是通过数学算法来识别人类手势的一个议题。用户可以使用简单的手势来控制或与设备交互,让计算机理解人类的行为。 这篇文章将带领你实现在你自己...

5316
来自专栏开源优测

大数据测试学习笔记之基准测试HiBench

简介 HiBench是一套基准测试套件,用于帮助我们评估不同的大数据框架性能指标(包括处理速度、吞吐等)的负载指标,可以评估Hadoop、Spark和流式负载等...

5646
来自专栏机器之心

开源 | 深度安卓恶意软件检测系统:用卷积神经网络保护你的手机

选自GitHub 机器之心编译 参与:Panda 恶意软件可以说是我们现代生活的一大威胁,为了保护我们电子设备中的财产和资料安全,我们往往需要寻求安全软件的帮助...

3017
来自专栏GIS讲堂

Openlayers3中如何优雅的表示等值面

等值面,顾名思义,就是值相等的面,在水文或气象中会有很多这样的需求。本文不讲如何做等值面,本文将如何展示等值面。

1282
来自专栏AI研习社

手把手教你搭建能够实现 Prisma 风格迁移效果的 iOS 酷炫应用(附代码)

随着 2012 年深度神经网络在 ImageNetchallenge 比赛上以 AlexNet 模型获胜,深度神经网络开创了空前的高潮。AI 工程师已经将深度学...

2173
来自专栏人工智能头条

EC2上的深度学习:CUDA 7/cuDNN/caffe/DIGITS实战教程

2064
来自专栏1007261的专栏

基于图像识别的自动化

导语 在客户端自动化中,如果需要对UI进行操作,控件识别和操作是最基础的能力。在windows标准控件中,我们可以通过FindWindow来找到窗口,FindW...

2.6K7
来自专栏人工智能头条

技术 | 机器学习中Python库的3个简单实践——你的图片将由你来创造

【导读】今天为大家介绍机器学习、深度学习中一些优秀、有意思的 Python 库,以及这些库的 Code 实践教程。涉及到的理论与学术内容会附上相应的论文与博客,...

1874
来自专栏和蔼的张星的图像处理专栏

LCT代码跑起来先文章思路总结

论文才刚开始看,但是代码先跑了一下看结果,有一点小坑,记录下: 首先去论文的github上去下载代码:点这里 readme里其实写了怎么搞:

5573

扫码关注云+社区

领取腾讯云代金券