Python-OpenCV(7)

接着上篇,这次主要讲一个主题就是:

图像的阈值处理

主要涵盖的内容点包括:

简单阈值 自适应阈值 Otsu’s 二值化

大家可能不是很清楚阈值处理的用途在什么地方,我举几个例子:

图像的二值化

区域的分割

图像的点/线/边缘检测

所以用途还是很广的,实则这块属于图像的分割范畴

ps: 有兴趣的可以看看数字图像处理的MATLAB实现这本书,讲的还是很不错的,代码使用MATLAB编写,推荐阅读

基础知识

对图像做阈值处理,基本的想法就是将图像分成前景和背景,通过选择一个阈值T,使得前景和背景分离,经过阈值处理之后的图像g(x,y)被定义为:

g(x,y)= a if f(x,y) > T g(x,y)= b if f(x,y) <= T

标注为a的像素对应目标,标注为b的像素对应背景,假设此时我们令a=1b=0,那么此时图像就只有两个值0,1了,图像显示出来就是只有黑(0)白(1) ,亦即二值化

简单阈值

这种方法非常简单,一但像素值高于阈值时,我们给这个像素赋予一个新值(可能是白色),否则我们给它赋予另外一种颜色(也许是黑色)

cv2.threshhold(src, thresh, maxval, type[, dst])

参数:

cv2.THRESH_BINARY:img(x,y)>threshold ,dst(x,y) = max_value; 否则,dst(x,y)=0

cv2.THRESH_BINARY_INV:img(x,y)>threshold ,dst(x,y) = 0; 否则,dst(x,y)= max_value

cv2.THRESH_TRUNC:img(x,y)>threshold,dst(x,y) = max_value; 否则dst(x,y) = src(x,y)

cv2.THRESH_TOZERO:img(x,y)>threshold,dst(x,y) = src(x,y) ; 否则 dst(x,y) = 0

cv2.THRESH_TOZERO_INV:img(x,y)>threshold,dst(x,y) = 0 ; 否则 dst(x,y) = src(x,y)

给个图帮助大家理解:

从上到下,分别对应上面的五个参数

代码:

__author__ = 'gavinzhou'
# -*- coding: utf-8 -*-

import cv2
import numpy as np
from matplotlib import pyplot as plt

# read the original images
img = cv2.imread("./images/1.png")
# convert to gray image
gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# convert to binary image
ret, binary_img = cv2.threshold(gray_img, 100, 255, cv2.THRESH_BINARY)

cv2.imshow("ori", img)
cv2.imshow("binary1", binary_img)
cv2.waitKey(10000)
cv2.destroyAllWindows()

结果:

自适应阈值

上面的阈值选择很简单,但是存在很大的问题:

我们使用是全局阈值,整幅图像采用同一个数作为阈值。这种方法并不适应于所有情况,尤其是当同一幅图像上的不同部分的具有不同亮度时

假如我们将上面的阈值从100调整到200,大家看看效果:

几乎什么都看不见了,是不是?所以咱们还需要个更加智能点的方法,我们希望这个方法可以:

  1. 采用自适应阈值
  2. 阈值是根据图像上的每一个小区域计算与其对应的阈值得到的

因此在同一幅图像上的不同区域采用的是不同的阈值,从而使我们能在亮度不同的情况下得到更好的结果,这个方法就是自适应阈值

cv2.adaptiveThreshold(src, maxValue, adaptiveMethod, thresholdType, blockSize, C[, dst])

参数:

cv2.ADPTIVE_THRESH_MEAN_C:阈值取自相邻区域的平均值

cv2.ADPTIVE_THRESH_GAUSSIAN_C:阈值取值相邻区域的加权和,权重为一个高斯窗口

Block Size:邻域大小(用来计算阈值的区域大小)

C:阈值等于的平均值或者加权平均值减去这个常数

注意:

block_size参数决定局部阈值的block的大小,block很小时,如block_size=3 or 5 or 7时,表现为边缘提取函数。当把block_size设为比较大的值时,如block_size=21、51等,便是二值化 代码:

__author__ = 'gavinzhou'
# -*- coding: utf-8 -*-

import cv2
from matplotlib import pyplot as plt

# read the original images
img = cv2.imread("./images/1.png")

# convert to gray image
gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# convert to binary image
binary_img1 = cv2.adaptiveThreshold(gray_img, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 2)
binary_img2 = cv2.adaptiveThreshold(gray_img, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 37, 2)
binary_img3 = cv2.adaptiveThreshold(gray_img, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 2)
binary_img4 = cv2.adaptiveThreshold(gray_img, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 37, 2)

cv2.imshow("binary1", binary_img1)
cv2.imshow("binary2", binary_img2)
cv2.imshow("binary3", binary_img3)
cv2.imshow("binary4", binary_img4)
cv2.waitKey(10000)
cv2.destroyAllWindows()

结果:

Otsu’s Method

其实大家已经看到,上面的方法不好,对于全局阈值我们需要不停的去试,但是加入我们图像很多的话,我们就没法做了,因为我们不可能对每个图像都去试; 对于自适应阈值,其和局部的关系很大,参数也是要调节的,调节的不好,效果也很不行;

解决方法就是otsu's方法,数学原理很复杂,大家想知道的化,自己去搜下相关资料来看看,或者看看我上面推荐的那本数字图像处理的MATLAB实现,讲的很清楚,这里我们侧重实战,原理就不讲了哈!

cv2.threshold(src, 0, maxval, cv2.THRESH_OTSU+type[, dst])

就是将阈值设置为0,flag出加上cv2.THRESH_OTSU即可

代码:

__author__ = 'gavinzhou'
# -*- coding: utf-8 -*-

import cv2
from matplotlib import pyplot as plt

# read the original images
img = cv2.imread("./images/1.png")
# convert to gray image
gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# convert to binary image
ret2, binary_img = cv2.threshold(gray_img, 0, 255, cv2.THRESH_BINARY+cv2.THRESH_OTSU)


cv2.imshow("ori", img)
cv2.imshow("binary", binary_img)
print "Otsu's value is:", ret2

cv2.waitKey(10000)
cv2.destroyAllWindows()

结果:

大家自己看吧,效果比上面的是不是好很多!

此时console打印的是:

Otsu’s value is: 88.0

otsu方法寻找到的阈值是88,自动寻找,省时省力,效果好

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏专知

【论文推荐】最新6篇主题模型相关论文—正则化变分推断主题模型、非参数先验、在线聊天、词义消歧、神经语言模型

【导读】专知内容组整理了最近六篇主题模型(Topic Modeling)相关文章,为大家进行介绍,欢迎查看! 1. Topic Modeling on Heal...

32350
来自专栏一心无二用,本人只专注于基础图像算法的实现与优化。

二值图像中封闭孔洞的高效填充算法(附源码)。

     鉴于心情不好,这篇文章只是简单的说说这个算法的过程。      在对图像二值化后,不管用的是什么二值算法,总会存在一些瑕疵,这个时候我们就需要进行一些...

41270
来自专栏大数据挖掘DT机器学习

Python机器学习——线性模型

最近断断续续地在接触一些python的东西。按照我的习惯,首先从应用层面搞起,尽快入门,后续再细化一 些技术细节。找了一些资料,基本语法和数据结构搞定之后...

40460
来自专栏landv

C语言_用if```else语句解决奖金发放问题

13120
来自专栏CVer

[计算机视觉论文速递] 2018-03-11

通知:这篇推文有10篇论文速递信息,涉及目标检测、行人重识别Re-ID、图像检索和Zero-Shot Learning等方向 这篇文章本来是在2018-03-1...

47380
来自专栏CVer

谷歌CVPR 2018最全总结:45篇论文,Ian Goodfellow GAN演讲PPT下载

谷歌在今年的CVPR上表现强势,有超过200名谷歌员工将在大会上展示论文或被邀请演讲,45篇论文被接收。在计算机视觉领域,生成对抗网络GAN无疑是最受关注的主题...

51830
来自专栏机器学习养成记

小案例(五):销量预测(python)

案件回顾 饭团销售额下滑 现有冰激凌店一年的历史销售数据 数据包括单日的销售量、气温、周几(问题:如何用这些数据预测冰激凌的销量?) 模拟实验与分析 将数据存...

63160
来自专栏数说工作室

回归模型的一个隐藏指标,你知道吗?

假设现在有一个线性回归模型: 人均GDP = a第一产业产值 + b工业产值 + c建筑业产值 + d第三产业产值 + e PS:人均GDP单位元,各产业产值...

33840
来自专栏专知

【重磅】深度学习顶会ICLR2018评审结果出炉,一文快速了解评审分析简报和评分最高的十篇论文

【导读】ICLR,全称为「International Conference on Learning Representations」(国际学习表征会议),201...

35550
来自专栏CreateAMind

使用infogan学习可解释的隐变量特征学习-及代码示例(代码和官方有差异)

In this week’s post I want to explore a simple addition to Generative Adversaria...

23530

扫码关注云+社区

领取腾讯云代金券