TensorFlow 图像处理和解码操作函数概述

TensorFlow提供提供了42个图像处理相关的函数,主要涉及解码编码,简单的图像几何变换等等。比较有特点的一个方面是有很多随机性的操作,主要增加模型的泛化能力。

原地址:Module: tf.image 定义在:tensorflow/python/ops/image_ops.py 图像处理和解码操作。 查看TensorFlow Images指南。

类:

class ResizeMethod

功能:

adjust_brightness(...): 调整RGB图像或灰度图的亮度。

adjust_contrast(...): 调整RGB图像或灰度图的对比度。

adjust_gamma(...): 在输入图像上执行伽玛校正。

adjust_hue(...): 调整RGB图像的色调。

adjust_saturation(...): 调整RGB图像的饱和度。

central_crop(...): 从图像的中央区域裁剪图像。

convert_image_dtype(...): 将图像转换为dtype,如果需要,缩放其值。

crop_and_resize(...): 对输入图像做剪裁并通过插值方法调整尺寸。

crop_to_bounding_box(...): 指定边界的裁剪图像。

decode_gif(...): 将GIF编码图像的第一帧解码为 uint8 tensor。

decode_image(...): 图像解码操作,包含了 decode_gif, decode_jpeg,和 decode_png。

decode_jpeg(...): 将jpeg编码图像解码为 uint8 tensor。

decode_png(...): 将png编码图像解码为 uint16 tensor。

draw_bounding_boxes(...): 在一个batch的图像上绘制边框。

encode_jpeg(...): JPEG图像编码。

encode_png(...): PNG图像编码。

extract_glimpse(...): 从指定的位置提取指定尺寸的区域,如果超过了原图像的尺寸,将随机填充。

flip_left_right(...): 水平翻转图像 。

flip_up_down(...): 上下翻转图像。

grayscale_to_rgb(...): 单个或多个图像灰度转RGB。

hsv_to_rgb(...): 单个或多个图像HSV转RGB。

non_max_suppression(...): 根据分数降序选择边界框,分数是一个输入,函数别没有计算分数的规则,其实只是提供了一种降序选择操作。

pad_to_bounding_box(...): 补零,将图像填充到指定的宽高。

per_image_standardization(...): 图像标准化(不是归一化)。

random_brightness(...): 通过随机因子调整图像的亮度。

random_contrast(...): 通过随机因子调整图像的对比度。

random_flip_left_right(...): 随机水平翻转图像。

random_flip_up_down(...): 随机上下翻转图像。

random_hue(...): 通过随机因子调整RGB图像的色调。

random_saturation(...):通过随机因子调整RGB图像的饱和度。

resize_area(...): 应用区域插值调整图像尺寸。

resize_bicubic(...): 应用双三次插值调整图像尺寸。

resize_bilinear(...): 应用双线性内插值调整图像尺寸。

resize_nearest_neighbor(...): 应用最邻近插值调整图像尺寸。

resize_images(...): 使用指定的方法调整图像尺寸(其实包含的是上面四种插值方法)。

resize_image_with_crop_or_pad(...): 根据目标图像的宽高(自动)裁剪或填充图像。

rgb_to_grayscale(...): 单个或多个图像RGB转灰度图。

rgb_to_hsv(...): 单个或多个图像RGB转HSV。

rot90(...): 将图像逆时针旋转90度。

sample_distorted_bounding_box(...): 为图像生成单个随机变形的边界框。

total_variation(...): 计算一个图像或多个图像的总体变动(输入图像中相邻像素值的绝对差异) transpose_image(...): 交换图像的第一维和第二维(输入要求是3D,没有batch,也就是宽和高的变换)

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏目标检测和深度学习

学界 | 牛津大学提出神经网络新训练法:用低秩结构增强网络压缩和对抗稳健性

作者:Amartya Sanyal、Varun Kanade、Philip H.S. Torr

613
来自专栏计算机视觉战队

干货——线性分类(中)

通过之前发布的“干货——线性分类(上)”,得到很多关注者的私信,今天就详细的把线性分类笔记(中)和(下)分享给大家,之后我们也会不短给大家带来一些基础的干货,让...

783
来自专栏技术小站

吴恩达深度学习笔记 course4 week2 深度卷积网络 实例探究

这周会讲一些典型的cnn模型,通过学习这些,我们能够对于cnn加深自己的理解,并且在实际的应用中有可能应用到这些,或从中获取灵感

621
来自专栏AI科技大本营的专栏

笔记 |《深度学习原理与TensorFlow实践》学习笔记(三)

作者 | 王清 目录 图像识别的经典课题 计算机视觉 图像识别课题 卷积神经网络原理 前深度学习时代 卷积操作Convolution 池化Pooling ReL...

3185
来自专栏机器之心

教程 | 将注意力机制引入RNN,解决5大应用领域的序列预测问题

3054
来自专栏机器学习实践二三事

Fully Convolutional Networks for Semantic Segmentation

主要思想 传统的做图像分割的方式大概是这样的: 以某个像素点中心取一个区域,取图像块的特征做样本训练分类器,分类结果作为此像素点的结果 这样做缺点很明显,比...

2168
来自专栏机器学习算法与Python学习

线性分类器-中篇

导读: 神经网络 反向传播算法 线性分类器-上篇 1 损失函数 在上一节定义了从图像像素值到所属类别的评分函数(score function),该函数的参数是权...

3379
来自专栏量化投资与机器学习

【Python机器学习】数据预处理——图像压缩与线性代数

现在有一张朱迪的照片,这张照片有500多列的像素点构成,但是大部分地方都是白色的,相互没有什么差别,也就是说图像中有很多列都是相互线性相关的,这些列向量对我们接...

1917
来自专栏深度学习与计算机视觉

学习SVM(五)理解线性SVM的松弛因子

学习SVM(一) SVM模型训练与分类的OpenCV实现 学习SVM(二) 如何理解支持向量机的最大分类间隔 学习SVM(三)理解SVM中的对偶问题 ...

2055
来自专栏机器之心

学界 | 结合堆叠与深度转换的新型神经翻译架构:爱丁堡大学提出BiDeep RNN

3064

扫码关注云+社区