每张图像都包括RGB三个通道,分别代表红色、绿色和蓝色,使用它们来定义图像中任意一点的像素值,红绿蓝的值在0-255之间。
例如:一个像素值[255,0,0]代表全部为红色,像素值[255,255,0]是红色和绿色的混合,将显示为黄色。
但是,如果使用OpenCV读取图像,它将以BGR格式生成图像,那么[255,0,0]将代表蓝色。
使用OpenCV读取一张图像
任何图像都可以通过OpenCV使用cv2.imread()命令读取。不过,OpenCV不支持HEIC格式的图像,所以不得不使用其它类型的库,如Pillow来读取HEIC类型的图像(或者先将它们转换为JPEG格式)
import cv2image = cv2.imread(‘image.jpg’)
当读取图像之后,如果有必要的话可以将其从BGR格式转换为RGB格式,通过使用cv2.cvtColor()命令实现。
image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
image_gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
覆盖
图像可以看作是是一堆像素值以类似矩阵的格式存储。任何像素的值都可以独立于其他像素进行更改。这里有一张图像,使用OpenCV读取图像:
image_1
image_1 = cv2.imread(‘image_1.jpg’)
print(image_1)
这里将给出矩阵形式的一系列像素值
array([[[107, 108, 106],[107, 108, 106],[107, 108, 106],…,[ 77, 78, 76],[ 77, 78, 76],[ 76, 77, 75]],…,[[ 93, 88, 87],[ 93, 88, 87],[ 92, 87, 86],…,[ 52, 62, 62],[ 52, 62, 62],[ 52, 62, 62]]], dtype=uint8)
如果只改变图像某一区域的像素值,比如更改为[0,0,0],这部分区域将变成黑色,因为这是颜色为黑色的像素值。同样,如果将像素值更改为[255,0,0],则该区域将变为蓝色(OpenCV以BGR格式读取图像)。
image_1[50: 100, 50:100] = [255, 0, 0]
同样,这些像素值可以被另一幅图像替换,只需通过使用该图像的像素值。
为了做到这一点,我们需要将覆盖图像修改为要替换的像素值的大小。可以通过使用cv2.resize()函数来实现
image_2 = cv2.imread(‘image_2.jpg’)
resized_image_2 = cv2.resize(image_2, dsize=(100, 100))
其中,dsize 代表图像要被修改的尺寸。
现在,可以将第二张图像够覆盖在第一张图片的上面
image_1[50:150, 50:150] = resized_image_2
覆盖PNG图像
与JPEG图像不同,PNG图像有第四个通道,它定义了给定像素的ALPHA(不透明度)。
除非另有规定,否则OpenCV以与JPEG图像相同的方式读取PNG图像。
为了读取带有Alpha值的PNG图像,我们需要在读取一张图像时指定标志cv2.IMREAD_UNCHANGED。现在,这个图像已经有了四个通道:BGRA
image_3 = cv2.imread(‘image_3.png’, cv2.IMREAD_UNCHANGED)
print(image_3)
array([[[0 0 0 0][0 0 0 0][0 0 0 0]…[0 0 0 0][0 0 0 0][0 0 0 0]]…[[0 0 0 0][0 0 0 0][0 0 0 0]…[0 0 0 0][0 0 0 0][0 0 0 0]]], dtype=uint8)
然而,这个图像有4个通道,但是我们的JPEG图像只有3个通道,所以这些值不能简单地替换。
我们需要在我们的JPEG图像中添加一个虚拟通道。
为此,我们将使用 numpy。可以使用pip install numpy命令安装它。
numpy提供了一个函数numpy.dstack() 来根据深度叠加值。
首先,我们需要一个与图像大小相同的虚拟数组。
为了创建虚拟通道,我们可以使用numpy.ones()函数创建一个数组。
import numpy as npones = np.ones((image_1.shape[0], image_1.shape[1]))*255
image_1 = np.dstack([image_1, ones])
我们将其数组与255相乘,因为alpha通道的值也存在于0-255之间。
现在,我们可以用PNG图像替换图像的像素值。
image_1[150:250, 150:250] = image_3
然而,它不会给出期望的结果,因为我们将alpha通道的值改为了零。
我们只需要替换那些具有非零值的像素值。为了做到这一点,我们可以通过检查每个像素值和替换非零值来强行执行,但这很耗时。
这里有一个更好的方法。我们可以获取要覆盖图像的alpha值。
alpha_image_3 = image_3[:, :, 3] / 255.0
我们将像素值除以255.0,以保持值在0-1之间。
image_1 和image_3的alpha之和需要等于255。因此,我们可以创建另一个数组,其中包含和等于255的所需alpha值。
alpha_image = 1 — alpha_image_3
现在,我们可以简单的取每个图像的alpha值和每个通道的图像像素值的元素乘积,并取它们的和。
for c in range(0, 3): image_1[150:250, 150:250, c] = ((alpha_image*image_1[150:250, 150:250, c]) + (alpha_image_3*image_3[:, :, c]))