3行代码Python搞定图片清晰度识别,原来我们看到的不一定是这样的

在通常情况下,图片是否清晰是个感性认识,同一个图,有可能你觉得还过得去,而别人会觉得不清晰,缺乏一个统一的标准。然而有一些算法可以去量化图片的清晰度,做到有章可循。

原理

如果之前了解过信号处理,就会知道最直接的方法是计算图片的快速傅里叶变换,然后查看高低频分布。如果图片有少量的高频成分,那么该图片就可以被认为是模糊的。然而,区分高频量多少的具体阈值却是十分困难的,不恰当的阈值将会导致极差的结果。

我们期望的是一个单一的浮点数就可以表示图片的清晰度。 Pech-Pacheco 在 2000 年模式识别国际会议提出将图片中某一通道(一般用灰度值)通过拉普拉斯掩模做卷积运算,然后计算标准差,出来的值就可以代表图片清晰度。

这种方法凑效的原因就在于拉普拉斯算子定义本身。它被用来测量图片的二阶导数,突出图片中强度快速变化的区域,和 Sobel 以及 Scharr 算子十分相似。并且,和以上算子一样,拉普拉斯算子也经常用于边缘检测。此外,此算法基于以下假设:如果图片具有较高方差,那么它就有较广的频响范围,代表着正常,聚焦准确的图片。但是如果图片具有有较小方差,那么它就有较窄的频响范围,意味着图片中的边缘数量很少。正如我们所知道的,图片越模糊,其边缘就越少。

有了代表清晰度的值,剩下的工作就是设定相应的阀值,如果某图片方差低于预先定义的阈值,那么该图片就可以被认为是模糊的,高于阈值,就不是模糊的。

实操

原理看起来比较复杂,涉及到很多信号啊图片处理的相关知识,下面我们来实操一下,直观感受下。

由于人生苦短,以及我个人是朋友圈第一 Python 吹子,我选择使用 Python 来实现,核心代码简单到令人发指:

import cv2

def getImageVar(imgPath):

image = cv2.imread(imgPath);

img2gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

imageVar = cv2.Laplacian(img2gray, cv2.CV_64F).var()

return imageVar

真是人生苦短啊,核心代码就三行,简单解释下。

import cv2使用了一个著名的图像处理库 OpenCV,关于 OpenCV 的安装这里不多赘述,需要注意的是它依赖 numpy。

image = cv2.imread(imgPath)使用 OpenCV 提供的方法读取图片。img2gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)转化为灰度图。如下图:

原图是这样的:

cv2.Laplacian(img2gray, cv2.CV_64F)对图片用 3x3 拉普拉斯算子做卷积,这里的cv2.CV_64F就是拉普拉斯算子。

原理部分说过,拉普拉斯算子经常用于边缘检测,所以这里经过拉普拉斯算子之后,留下的都是检测到的边缘。上图经过这步处理之后是这样的:

可以看到这里图片人物大致还是比较清晰的。

cv2.Laplacian(img2gray, cv2.CV_64F).var()计算出方差,并最后返回。

上面那张图按这个计算出来时 3170 多,这个就是最后我们用来判断清晰度的值。

可以再找一张看看:

原图:

做灰度和经过拉普拉斯算子之后,可以看到人物部分已经不是很清晰了。

最后算出来的方差只有 530

剩下的工作就是根据整体图片质量确定阀值了。

局限性

通过上面的实操,我们知道这个算法的技巧在于设置合适的阀值,阈值太低会导致正常图片被误断为模糊图片,阈值太高会导致模糊图片被误判为正常图片。阀值依赖于你实际应用的业务场景,需要根据使用场景的不同做不同的定制。

真正的银弹并不存在。除了需要定个阀值外,有些图片可能会故意做个背景模糊或者背景虚化,这种图片很容易被误杀。

比如:

计算出来是这样的,后面一大片都是黑的。

这个图前景其实看着还行,但是背景有大片的虚化和模糊,这种情况下比较容易被误杀。

所以最好还是在了解原理之后,根据实际场景来使用。

最后写了个简单的脚本,对传入的图片路径的图片进行计算,然后返回一个 json 字符串。

用法python getRank.py --imgs=./1.jpg,./2.jpg

我有一个微信公众号,经常会分享一些python技术相关的干货;如果你喜欢我的分享,可以用微信搜索“python语言学习” 关注,欢迎大家加入千人交流答疑裙:699+749+852

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

狂破11项记录,谷歌年度最强NLP论文到底强在哪里?

一个完整的深度学习系统,通常包括以下四个部分,1. 应用场景、2. 模型、3. 训练数据、4. 算力。

933
来自专栏大数据文摘

暑期追剧学AI | 十分钟搞定机器学习中的数学思维(二)

1552
来自专栏量子位

无监督学习才不是“不要你管”

无监督学习是机器学习算法里非常扑朔迷离的一个类别,负责解决这些“没有真实值 (no-ground-truth) ”的数据。

952
来自专栏数据科学与人工智能

【机器学习】机器学习和计算机视觉相关的数学

MIT一牛人对数学在机器学习中的作用给的评述,写得很实际 机器学习和计算机视觉都是很多种数学的交汇场。看着不同的理论体系的交汇,对于一个researcher来说...

2708
来自专栏机器之心

NAACL | 评价端到端生成式聊天系统,哈工大提出新型数据集 LSDSCC

得益于深度学习的发展,端到端的生成式聊天系统在模型层面的研究工作在近两到三年中取得了长足的进步 [1-5]。与之相比,对于生成结果的合理评价方法的探索则极为滞后...

1383
来自专栏AI研习社

一言不合就想斗图?快用深度学习帮你生成表情包

AI研习社:斯坦福大学的两个学生 Abel L Peirson V 和 Meltem Tolunay 发表了自己的 CS224n 结业论文—— 用深度神经网络生...

1191
来自专栏CreateAMind

使用模仿学习攻克Atari最难游戏!DeepMind新论文解读

1253
来自专栏机器之心

学界 | 跟着大神回顾ACL 2018:大会亮点一览

很高兴看到很多论文都在从方法上研究现有模型以及它们捕获的内容,而不是一直在引入更新的模型。进行这样的研究最常用的办法是自动创建一个侧重于泛化行为的某个特定方面的...

1282
来自专栏大数据挖掘DT机器学习

搭建LSTM(深度学习模型)做文本情感分类的代码

传统的文本情感分类思路简单易懂,而且稳定性也比较强,然而存在着两个难以克服的局限性: 一、精度问题,传统思路差强人意,当然一般的应用已经足够了,但是要进一步提高...

7068
来自专栏机器学习算法与Python学习

干货 | 【深度学习】 在 【推荐算法】 上的应用研究进展

关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第一 【Python】:排名第三 【算法】:排名第四 文章来源:知乎 作者:赵鑫 深度学...

8386

扫码关注云+社区

领取腾讯云代金券