CV | 2.颜色阈值&蓝幕替换

萝卜

发布于 2022-05-12 20:03:26

1.2K00

代码可运行

文章被收录于专栏：Python 商业数据分析案例Python 商业数据分析案例

运行总次数：0

代码可运行

本文含 2624 字，14 图表截屏

建议阅读 7 分钟

本文是计算机视觉系列的第3篇

1 - 新专栏 | 有趣的计算机视觉
2 - CV | 1. 一切的基础:灰度图像
3 - CV | 颜色阈值&蓝幕转换

前言

把图像转为灰度图像的像素网格以及 x 和 y 的函数来处理以后，我们还需要学会如何利用这些信息，例如如何用图像信息来分离特定区域。

计算机图形和视频广泛应用了颜色阈值这门技术，比如蓝幕。使用蓝幕时，我们需要识别并替换大片蓝色区域，构建虚拟的背景图就是通过蓝幕进行（比如我们要将下图的蓝色背景换成跑车本该在的跑道上）。

能够理解颜色阈值的基本原理并将代码用于实际的案例是本文的目标，下面将详细介绍如何利用Python实现颜色阈值的选取与蓝幕替换，本节的原理和代码结合的十分紧密，所以就不像以往那样拆成原理+代码两个部分讲解了。

蓝幕

在正式开始讲解颜色阈值前，我们先从现实生活场景入手，借以更好的理解蓝幕的概念和颜色阈值的使用。

什么是蓝幕？和常见的电影特效绿幕有什么不同？

下图解释截自百度知道

所以，蓝幕其实就是一种处理图片/视频背景的工具，至于具体该怎么用还得结合颜色阈值。

颜色阈值

颜色阈值是什么，有什么用？

阈值又叫临界值，是指一个效应能够产生的最低值或最高值。所以颜色阈值要求我们首先得定义要被分离的颜色的上下限，也就是蓝色的上下限，在上下限范围内的颜色都会被识别出来（因为我们将要用这个上下限来选出包含颜色范围的蓝幕区域，然后将该区域删除）

我们希望实现的效果如上图，检测出所有的蓝色区域并把它删掉，只留下跑车的轮廓，转换成灰度图像只是为了让轮廓更明显。

# 定义的颜色下限涉及红、绿和蓝色三者，所以会是一个三维数组
lower_blue = np.array([50, 0, 0])  
upper_blue = np.array([150, 255, 255]) 
# 并不是一开始就能够调出这么完美的两个矩阵数据，会经过一定数量的尝试

这里先插入一段代码展示颜色阈值的python设置。上一章我们提到了彩色图像会被解析为具有宽高和深的三维立方体。深是指颜色通道的数量：大多数彩色图像可以仅通过三种颜色组合来表示，即红绿蓝（red,green,blue；组合起来便是我们经常见到的 rgb），所以在设置颜色阈值的上下限时我们需要给出两个三维数组。

颜色阈值怎么设置，三维数组中的值是什么意思？

我们的目的是替换掉图片中的蓝幕部分，即挖出我们感兴趣的图像部分（跑车），有两种做法可以达到目的：

1. 我只知道自己不想要的：从图像的四个角开始往里缩小搜索圈，只要检测到蓝色，我就舍弃，直到“一检测到跑车边缘的那一刻”就停止。
2. 我只知道自己想要的：从跑车本身开始，往四周开始发散与保留，发散并保留到到“一检测跑车外的蓝色边缘”就停止。


# 定义的颜色下限涉及红、绿和蓝色三者，所以会是一个三维数组
lower_blue = np.array([50, 0, 0])  
upper_blue = np.array([150, 255, 255]) 
# 并不是一开始就能够调出这么完美的两个矩阵数据，
 ## 会经过一定数量的尝试
代码中颜色阈值上下限的设置这里，我们采用了第二种方法，因为车身有红色，所以第一维的 R 我们设置成了下界50，上界150。最终会一检测到跑车外的蓝色边缘就停止。