前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >浅谈tensorflow 中的图片读取和裁剪方式

浅谈tensorflow 中的图片读取和裁剪方式

作者头像
砸漏
发布2020-10-21 10:45:12
1.2K0
发布2020-10-21 10:45:12
举报
文章被收录于专栏:恩蓝脚本

一 方式1: skimage

代码语言:javascript
复制
from skimage import data, io, transform, color 
import matplotlib.pyplot as plt 
 
# io.imread 读出的图片格式是uint8,value是numpy array 类型。
image = data.coffee()
image = io.imread(dir)
 
plt.imshow(image)
plt.show()
 
io.save('1.jpg',image) #保存图像
 
image_gray = color.rgb2gray(image) #转换为灰度图像
io.save('2.jpg',image_gray)
 
# 通过transform.resize()裁剪后的图片是以 float64的格式存储的,数值的取值范围是(0~1)
image_ = transform.resize(image,(200,200))
img = image_ * 255 #将图片的取值范围改成(0~255)
img = img.astype(np.uint8) 
img = image_ * 255 #将图片的取值范围改成(0~255)
img = img.astype(np.uint8) 

二、方式2:cv2

代码语言:javascript
复制
import cv2
import matplotlib.pyplot as plt 
 
# cv2.imread读出的图片格式是uint8,value也是numpy array 类型。
# 图像数据格式是以BGR的格式进行存储的。需要将存储类型改成RGB 的形式才能正常显示原图的颜色。
image=cv2.imread(dir) 
b,g,r = cv2.split(image)  #将图像通道分离开 
rgb_image = cv2.merge([r,g,b]) #以RGB的形式重新组合 
#image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) 也可以使用这个函数直接转换成RGB 形式 
plt.imshow(rgb_image) 
 
# 通过cv2.resize()裁剪后的图片还是以 numpy array 的方式保存的, 数值的取值范围是(0~255)
image_cv2 = cv2.resize(rgb_image)
 
image=cv2.imread(dir) 
b,g,r = cv2.split(image)  #将图像通道分离开 
rgb_image = cv2.merge([r,g,b]) #以RGB的形式重新组合 
#image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) 也可以使用这个函数直接转换成RGB 形式 
plt.imshow(rgb_image) 

# 通过cv2.resize()裁剪后的图片还是以 numpy array 的方式保存的, 数值的取值范围是(0~255)
image_cv2 = cv2.resize(rgb_image)

补充知识:tensorflow中两种读图及裁剪图片的区别(io.imread和cv2.imread)以及(transform.resize和cv2.resize)

Tensorflow中,在训练图片数据之前,需要先对图片进行预处理,读图和裁剪是最基本的两步。常见的的读图何裁剪分别有两种方式,这里小编将和大家分享下这几种方式的实现以及他们之间的区别。

一、常见的两种读图方式 io.imread() 和 cv2.imread()

1.io.imread 读出的图片格式是uint8,value是numpy array 类型。对于RGB 图片,图像数据是以RGB 的格式进行存储的。

2.cv2.imread读出的图片格式是uint8 ,value也是numpy array 类型。唯一的区别是,图像数据格式是以BGR的格式进行存储的。需要将存储类型改成RGB 的形式才能正常显示原图的颜色。特别是制作tfrecord 时,需要将图片通道改成RGB,具体代码如下。

代码语言:javascript
复制
import cv2
import matplotlib.pyplot as plt
from skimage import transform 
import numpy as np
import skimage.io as io 
 
train_dir = 'E:/TensorFlow/Project_TF/flower_tfrecord/data/test/roses/timg.jpg'
 
'''以cv2方式读取图片'''
image=cv2.imread(train_dir)
b,g,r = cv2.split(image)  #将图像通道分离开
rgb_image = cv2.merge([r,g,b]) #以RGB的形式重新组合
 
#image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) 也可以使用这个函数直接转换成RGB 形式
plt.imshow(rgb_image)
 
'''以io.imread方式读取图片'''
#image = io.imread(train_dir) #读图并显示 
#plt.imshow(image)

二、常见的两种图片裁剪方式 cv2.resize() 和 transform.resize()

1.通过cv2.resize()裁剪后的图片还是以 numpy array 的方式保存的, 数值的取值范围是(0~255)

2.通过transform.resize()裁剪后的图片是以 float64的格式存储的,数值的取值范围是(0~1)。通常在制作tfrecord 数据集的过程中,我们需要将其转换成numpy array的形式,具体代码如下

代码语言:javascript
复制
'''以io.imread方式读取图片并使用transform形式裁剪图片'''
image = io.imread(train_dir) #读图并显示 
plt.imshow(image)
image =transform.resize(image, (208, 208))
img = image * 255 #将图片的取值范围改成(0~255)
img = img.astype(np.uint8) 
 
plt.imshow(img) 

读图和裁剪图片在制作tfrecord数据集时,是很基础的步骤,在接下来,我还将进一步更新如何制作自己的tfrecord数据集,以及tfrecord的读取。如有谬误,还请大家斧正。

以上这篇浅谈tensorflow 中的图片读取和裁剪方式就是小编分享给大家的全部内容了,希望能给大家一个参考。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020-09-11 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档