前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >opencv(4.5.3)-python(七)--图像的基本操作

opencv(4.5.3)-python(七)--图像的基本操作

作者头像
用户9875047
发布2022-07-04 14:17:20
5960
发布2022-07-04 14:17:20
举报
文章被收录于专栏:机器视觉全栈er

翻译及二次校对:cvtutorials.com

目标

学会:

  • • 访问像素值并修改它们
  • • 访问图像属性
  • • 设置感兴趣的区域(ROI)
  • • 分割和合并图像

本节中几乎所有的操作都主要与Numpy而不是OpenCV有关。要想用OpenCV写出更好的优化代码,需要有良好的Numpy知识。

(例子将在Python终端中显示,因为大多数只是单行的代码)

访问和修改像素值

让我们先加载一个彩色图像。

代码语言:javascript
复制
>>> import numpy as np
>>> import cv2 as cv
>>> img = cv.imread('messi5.jpg')

你可以通过其行和列坐标来访问一个像素值。对于BGR图像,它返回一个蓝、绿、红值的数组。对于灰度图像,只返回相应的强度。

代码语言:javascript
复制
>>> px = img[100,100]
>>> print( px )
[157 166 200]
# accessing only blue pixel
>>> blue = img[100,100,0]
>>> print( blue )
157

你可以用同样的方法修改像素值。

代码语言:javascript
复制
>>> img[100,100] = [255,255,255]
>>> print( img[100,100] )
[255 255 255]

警告:Numpy是一个用于快速数组计算的优化库。因此,简单地访问每一个像素值并对其进行修改将是非常缓慢的,我们不鼓励这样做。

注释:上述方法通常用于选择一个数组的某个区域,例如前5行和后3列。对于单个像素的访问,Numpy数组方法,array.item()和array.itemset()被认为更好。然而,它们总是返回一个标量,所以如果你想访问所有的B、G、R值,你将需要为每个值分别调用array.item()。

更好的像素访问和编辑方法:

代码语言:javascript
复制
# accessing RED value
>>> img.item(10,10,2)
59
# modifying RED value
>>> img.itemset((10,10,2),100)
>>> img.item(10,10,2)
100

访问图像属性

图像属性包括行、列和通道的数量;图像数据的类型;像素的数量等。

图像的形状是由img.shape访问的。它返回一个包含行数、列数和通道数(如果图像是彩色的)的元组。

代码语言:javascript
复制
>>> print( img.shape )
(342, 548, 3)

如果一个图像是灰度的,返回的元组只包含行和列的数量,所以这是一个很好的方法来检查加载的图像是灰度还是彩色。

总像素数由Img.size访问。

代码语言:javascript
复制
>> print( img.size )
562248

图像数据类型由img.type获得。

代码语言:javascript
复制
>> print( img.dtype )
uint8

注意:img.dtype在调试时非常重要,因为OpenCV-Python代码中大量的错误是由无效的数据类型引起的。

图像ROI

有时,你必须对图像的某些区域进行处理。对于图像中的眼睛检测,首先在整个图像上进行人脸检测。当得到一个人脸时,我们单独选择人脸区域并在其中搜索眼睛,而不是搜索整个图像。它提高了准确性(因为眼睛总是在脸上)和性能(因为我们在一个小区域内搜索)。

使用Numpy索引再次获得ROI。这里我选择了球,并将其复制到图像的另一个区域。

代码语言:javascript
复制
>> ball = img[280:340, 330:390] 
>> img[273:333, 100:160] = ball

看看下面的结果:

分割和合并图像通道

有时你需要分别处理图像的B、G、R通道。在这种情况下,你需要将BGR图像分割成单个通道。在其他情况下,你可能需要将这些单独的通道连接起来以创建一个BGR图像。你可以通过以下方式简单地做到这一点。

代码语言:javascript
复制
>>> b,g,r = cv.split(img)
>>> img = cv.merge((b,g,r))

或者:

代码语言:javascript
复制
>>> b = img[:,:,0]

假设你想把所有的红色像素设置为零--你不需要先分割通道。Numpy索引的速度更快。

代码语言:javascript
复制
>>> img[:,:,2] = 0

警告:cv.split()是一个耗时的操作。所以只有在必要时才使用它。否则,请使用Numpy索引。

为图像制作边框(填充)

如果你想在图像周围创建一个边框,类似于一个相框,你可以使用cv.copyMakeBorder()。但它在卷积操作、零填充等方面有更多应用。这个函数需要以下参数。

  • • src - 输入图像
  • • top, bottom, left, right - 相应方向的边框宽度,以像素数计
  • • borderType - 定义要添加的边界类型的标志。它可以是以下类型:cv.BORDER_CONSTANT - 添加一个恒定颜色的边框。该值应作为下一个参数给出;cv.BORDER_REFLECT - 边框将是边框元素的镜像反射,像这样:Fedcba|abcdefgh|hgfedcb;cv.BORDER_REFLECT_101 或 cv.BORDER_DEFAULT - 与上述相同,但有轻微变化,像这样:gfedcb|abcdefgh|gfedcba;cv.BORDER_REPLICATE - 最后一个元素被整体复制,像这样:aaaaa|abcdefgh|hhhhh;cv.BORDER_WRAP - 无法解释,看起来会像这样:cdefgh|abcdefgh|abcdefg;
  • • value - 如果边框类型是cv.BORDER_CONSTANT,它指的是边框的颜色。

下面是一个演示所有这些边框类型的示例代码,以便更好地理解:

代码语言:javascript
复制
import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
BLUE = [255,0,0]
img1 = cv.imread('opencv-logo.png')
replicate = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_REPLICATE)
reflect = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_REFLECT)
reflect101 = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_REFLECT_101)
wrap = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_WRAP)
constant= cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_CONSTANT,value=BLUE)
plt.subplot(231),plt.imshow(img1,'gray'),plt.title('ORIGINAL')
plt.subplot(232),plt.imshow(replicate,'gray'),plt.title('REPLICATE')
plt.subplot(233),plt.imshow(reflect,'gray'),plt.title('REFLECT')
plt.subplot(234),plt.imshow(reflect101,'gray'),plt.title('REFLECT_101')
plt.subplot(235),plt.imshow(wrap,'gray'),plt.title('WRAP')
plt.subplot(236),plt.imshow(constant,'gray'),plt.title('CONSTANT')
plt.show()

请看下面的结果。(图片是用matplotlib显示的。所以红色和蓝色通道将被替换)。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-06-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器视觉全栈er 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
人脸识别
腾讯云神图·人脸识别(Face Recognition)基于腾讯优图强大的面部分析技术,提供包括人脸检测与分析、比对、搜索、验证、五官定位、活体检测等多种功能,为开发者和企业提供高性能高可用的人脸识别服务。 可应用于在线娱乐、在线身份认证等多种应用场景,充分满足各行业客户的人脸属性识别及用户身份确认等需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档