首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >iOS-OpenCV之蔡徐坤教你玩转边框画

iOS-OpenCV之蔡徐坤教你玩转边框画

作者头像
iOSSir
发布2019-06-14 12:18:59
1.8K1
发布2019-06-14 12:18:59
举报

原文作者:chouheiwa

前言

这一系列的文章已经写了第二篇了,所以这个系列将会转变为连载文章,每当我有什么新的发现,都会更新。

本文demo地址: github.com/chouheiwa/O…

正文

现在关于OpenCV的很多有趣的例子,都是python的。

这篇文章的整体思路来源于 知乎 的 Maker毕 的文章: 蔡徐坤教你用OpenCV实现素描效果

上一篇文章中我们已经讲述过了,图像的存储,以及一些相关的信息。这篇文章就不会重复了,如果不是很清楚的读者可以看看第一篇文章。

这篇文章说是素描,其实与广义素描差距很大,准确的说应该是叫边框画。

步骤及原理

这里我们还是要先讲述一下步骤,这里先展示下原图

1. 将给定图片转灰度图

转成灰度图片的过程是为了消除其他影响因子(这一步也是很多图片处理|文字识别等相关领域的第一步)。

将图片从原来的三维层面,降到一维。


- (UIImage *)grayImage:(UIImage *)image {
    cv::Mat cvImage;

    UIImageToMat(image, cvImage);

    cv::Mat gray;
    // 将图像转换为灰度显示
    cv::cvtColor(cvImage, gray, CV_RGB2GRAY);

    cvImage.release();
    // 将灰度图片转成UIImage
    UIImage *nImage = MatToUIImage(gray);

    gray.release();

    return nImage;
}

处理完毕后,我们能看到原来的蔡老师变灰了。

2. 对灰度图片进行高斯模糊

首先,先来讲一下如何进行简单的 模糊 处理

在上一篇文章中我们已经讲过了,图片其实就是一个二维数组。

所以图片上的每一个像素,都有一个像素数值。

我们可以以当前像素点为中心,取一个n * n的矩阵。

这里假定我们选了一个中心灰度值为190的像素点,它的周边像素的像素灰度值为100(255为纯白色)的3*3的像素矩阵

模糊处理的简单形式就是做平均,也就是将中间点的像素点和周围8个像素点的灰度值取平均值。也就是(100 * 8 + 190) / 9 = 110

简单的模糊处理就是这么做的,不过高斯模糊是通过高斯函数去进行相应的计算,这里我找到了一篇相当好的文章: 高斯模糊

- (UIImage *)gaussianblurImage:(UIImage *)image {
    cv::Mat cvImage;

    UIImageToMat(image, cvImage);

    cv::Mat blur;
    // 选取一个5 * 5 的核用于模糊
    cv::GaussianBlur(cvImage, blur, cv::Size(5, 5), 0);
    cvImage.release();
    UIImage *blurImage = MatToUIImage(blur);
    blur.release();

    return blurImage;
}

有一个模糊的蔡老师出现了

3. 对图像进行自适应二值化处理

这一步其实要讲的就是二值化,其实他的概念很简单。我们将灰度图上的某一个像素点的灰度值与给定的一个值进行比较,小于这个给定值的我们将其灰度值设置为0(黑色),大于的设置为255(白色)。我们给定的比较值被称之为阈值

当然,这种二值化太过固化、死板。因为真实的照片有可能有阴影之类的遮挡,会导致我们的全局二值化,产生很多的误差,如下图右上角所示:

因此我们需要采用自适应二值化的方法,这里我们选择采用自适应高斯二值化(效果如上图右下角)

- (UIImage *)adaptiveThresholdImage:(UIImage *)image {
    cv::Mat cvImage;

    UIImageToMat(image, cvImage);

    cv::Mat outImage;

    cv::adaptiveThreshold(cvImage, outImage,
                          255,
                          cv::ADAPTIVE_THRESH_GAUSSIAN_C, // 这里我们采用的是高斯自适应模糊
                          cv::THRESH_BINARY, // 二值化
                          5,
                          2);

    cvImage.release();

    UIImage *adaImage = MatToUIImage(outImage);

    outImage.release();

    return adaImage;
}

蔡老师的线条出现啦

4. 二值化图片进行再次模糊

现在蔡老师的衣服都已经变成线条了,基础的描边效果已经达成。但是我们可以看到,图片中比如说地面上,还有一些黑色的我们并不想要的点(我们称这些点为噪点)。以及蔡老师的线条还是有点细,所以我们需要将蔡老师的线条变粗些。

将上面的图片再次进行高斯模糊。

蔡老师变得模糊了

5. 对模糊图片再次进行二值化

这里我们再次进行二值化操作,因为现在图片已经相对干净,且并无阴影等干扰项。我们可以直接使用全局二值化来加深边框了(计算速度快)。

- (UIImage *)thresholdImage:(UIImage *)image {
    cv::Mat cvImage;

    UIImageToMat(image, cvImage);

    cv::Mat outImage;
    // 因为这时的图片已经比较干净且没什么阴影,所以选择普通二值化,灰度值 > 200 (这个值可以调,我觉得220效果更好) 的就赋值为255(白色)
    cv::threshold(cvImage, outImage, 200, 255, cv::THRESH_BINARY);

    cvImage.release();

    UIImage *threImage = MatToUIImage(outImage);

    outImage.release();

    return threImage;
}

6. 对图片进行噪点去除

现在需要去除图片中的小的噪点,我们就需要进行一系列的操作了

关于这些操作,我们在图像处理方面有专门的名词描述:

腐蚀 与 膨胀

腐蚀:

腐蚀通俗的来说,就是将原本的图像根据给定的核(为我们自定义的一种形状,一般为n*n的正方形,n为奇数)缩小。

只有当原本的图像上对应核心周围所有的点都有值时,我们才保留当前核心的值。

膨胀:

膨胀则正好相反,我们将给定的图片根据给定的核放大。

当我们扫描核的任意一点上有值时,当前核心点将会被赋值

腐蚀膨胀便是我们这步处理的关键。

它们之间的组合被我们称之为开运算闭运算

开运算

我们先对图片进行腐蚀运算,然后进行膨胀运算

最终效果将如上图的左下角结果

我们和原图进行比较可以发现。

开运算可以去除毛刺,小桥和孤立的小点(在腐蚀运算中小点会直接消失)。最终总的位置和形状不变(膨胀运算会恢复)

闭运算

闭运算这里因为我们不会用到,因此不会过多赘述。

它和开运算的过程相反,先对原图像进行膨胀运算后进行腐蚀运算。

我们的目的是处理图片中的一些噪点,因此我们采用开运算来处理。

- (UIImage *)morphologyImage:(UIImage *)image {
    cv::Mat cvImage;

    UIImageToMat(image, cvImage);
    // 将图片取反,原黑变白,原白变黑
    cv::bitwise_not(cvImage, cvImage);

    cv::Mat outImage;
    /// 获取一个3*3的核
    cv::Mat ken = cv::getStructuringElement(cv::MORPH_RECT, cv::Size(3, 3));
    /// 进行图像的开运算(开运算需要对有数值的地方进行缩小,所以我们需要将图片反色,即大部分有数值,而小部分没有,才能达到效果)
    cv::morphologyEx(cvImage, outImage, cv::MORPH_OPEN, ken);

    ken.release();

    cvImage.release();

    cv::bitwise_not(outImage, outImage);

    UIImage *morphologyImage = MatToUIImage(outImage);

    outImage.release();

    return morphologyImage;
}

图片干净了很多

7. 最后进行一次高斯模糊

我们最后在进行一次高斯模糊,使我们的图像效果更好。

其他

视频的转换,这里就不多写了(正在研究过程中...)

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-06-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 iOSSir 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 腐蚀:
  • 膨胀:
  • 开运算
  • 闭运算
相关产品与服务
文字识别
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档