解析卷积神经网络——数据扩充

用户1386409

发布于 2018-07-26 09:51:19

1.1K0

发布于 2018-07-26 09:51:19

文章被收录于专栏：PaddlePaddle

《解析卷积神经网络——深度学习实践手册》基础理论篇部分已经更新完毕，从今天开始更新实践应用篇，正文部分为数据扩充篇目的知识

附下载文档地址: http://lamda.nju.edu.cn/weixs/book/CNN_book.pdf

简单的数据扩充方式（p84-85）

在实践中，往往会将如下几种方式叠加使用，如此便可将图像数据扩充至原有数量的数倍甚至数十倍。

水平翻转：操作会使原数据集扩充一倍。
随机抠取：操作一般用较大的正方形在原图的随机位置处抠取图像块，每张图像随机抠取的次数决定了数据集扩充的倍数。
尺度变换：将图像分辨率变为原图的0.8, 0.9, 1.1, 1.2, 1.3等倍数，将尺度变换后的图像作为扩充的训练样本加人原训练集。
旋转操作：将原图旋转一定角度，如一30度、-15度、15度、30度等，同样将旋转变换的图像作为扩充样本加人模型训练。
色彩抖动是在RGB颜色空间对原有RGB色彩分布进行轻微的扰动，也可在HSV颜色空间尝试随机改变图像原有的饱和度和明度(即改变S和V通道的值)或对色调进行微调(小范围改变该通道的值)。

特殊的数据扩充方式（p85-87）

Fancy PCA

Krizhevsky等人提出了一种名为“Fancy PCA"的数据扩充方法「52} o Fancy PCA首先对所有训练数据的R,G,B像素值进行主成分分析操作，得到对应的特征向量pi和特征值，然后根据特征向量和特征值可以计算一组随机值，将其作为扰动加到原像素值中即可。每经过一轮训练后,将重新随机选取并重复上述操作对原像素值进行扰动。