目前深度学习神经网络对数据的要求很高,不仅数据要相关,而且要求有尽可能更大的数据集。在现实生活中,要想得到大量的数据,不仅要收集各种情景下、各种角度、各个位置的照片,还要确保数据的多样性,只有这样才能确保神经网络学到的特征更加全面
但在现实中,若想达到以上的目的要付出巨大的代价,并且还要对照片上出现的东西进行准确标注,另外对于一些稀有的物种信息收集更是十分困难
因此我们这里介绍一些为神经网络提供更多数据的方法——数据增强(Data augmentation)
数据增强有很多手段,包括对原照片进行旋转、拉伸、加噪声等。但是采用这种方法加入的数据肯定没有新照片的效果好,因为其本质上仍是原图片
如下图所示:
数据增强的手段包括:
首先看图像翻转
如上图所示,原图片黄人在右边,经过左右翻转后,黄人在左边;经过上下翻转后,整个图片倒立。代码实现如下
import torch
import torch.nn
import torch.nn.functional as F
from torchvision import datasets, transforms
train_loader = torch.utils.data.DataLoader(
datasets.MNIST('../data', train=True, download=True,
transform=transforms.Compose([
# Random表示有可能做,所以也可能不做
transforms.RandomHorizontalFlip(),# 水平翻转
transforms.RandomVerticalFlip(), # 上下翻转
transforms.ToTensor(),
])),
batch_size=batch_size, shuffle=True
)
旋转操作也十分常见
上面分别经过了90°、180°、270°的旋转。代码实现如下
import torch
import torch.nn
import torch.nn.functional as F
from torchvision import datasets, transforms
train_loader = torch.utils.data.DataLoader(
datasets.MNIST('../data', train=True, download=True,
transform=transforms.Compose([
# Random表示有可能做,所以也可能不做
transforms.RandomHorizontalFlip(),# 水平翻转
transforms.RandomVerticalFlip(), # 上下翻转
transforms.RandomRotation(15), # 随机旋转-15°~15°
transforms.RandomRotation([90, 180, 270]) # 随机在90°、180°、270°中选一个度数来旋转,如果想有一定概率不旋转,可以加一个0进去
transforms.ToTensor(),
])),
batch_size=batch_size, shuffle=True
)
还可以把图片进行缩放