前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >解析卷积神经网络——数据扩充

解析卷积神经网络——数据扩充

作者头像
用户1386409
发布2018-07-26 09:51:19
1.1K0
发布2018-07-26 09:51:19
举报
文章被收录于专栏:PaddlePaddle

《解析卷积神经网络——深度学习实践手册》基础理论篇部分已经更新完毕,从今天开始更新实践应用篇,正文部分为数据扩充篇目的知识

附下载文档地址: http://lamda.nju.edu.cn/weixs/book/CNN_book.pdf

1

简单的数据扩充方式(p84-85)

在实践中,往往会将如下几种方式叠加使用,如此便可将图像数据扩充至原有数量的数倍甚至数十倍。

  • 水平翻转:操作会使原数据集扩充一倍。
  • 随机抠取:操作一般用较大的正方形在原图的随机位置处抠取图像块,每张图像随机抠取的次数决定了数据集扩充的倍数。
  • 尺度变换:将图像分辨率变为原图的0.8, 0.9, 1.1, 1.2, 1.3等倍数,将尺度变换后的图像作为扩充的训练样本加人原训练集。
  • 旋转操作:将原图旋转一定角度,如一30度、-15度、15度、30度等,同样将旋转变换的图像作为扩充样本加人模型训练。
  • 色彩抖动是在RGB颜色空间对原有RGB色彩分布进行轻微的扰动,也可在HSV颜色空间尝试随机改变图像原有的饱和度和明度(即改变S和V通道的值)或对色调进行微调(小范围改变该通道的值)。

2

特殊的数据扩充方式(p85-87)

  • Fancy PCA

Krizhevsky等人提出了一种名为“Fancy PCA"的数据扩充方法「52} o Fancy PCA首先对所有训练数据的R,G,B像素值进行主成分分析操作,得到对应的特征向量pi和特征值,然后根据特征向量和特征值可以计算一组随机值,将其作为扰动加到原像素值中即可。每经过一轮训练后,将重新随机选取并重复上述操作对原像素值进行扰动。

  • 监督式数据扩充

2016种监督式年ImageNet竞赛的场景分类任务中,国内海康威视研究院提出了一种利用图像标记信息的新型数据扩充方式。

首先根据原数据训练一个分类的初始模型。而后,利用该模型,对每张图生成对应的特征图或热力图.这张特征图可指示图像区域与场景标记间的相关概率。之后,可根据此概率映射回原图选择较强相关的图像区作为扣取的图像块。

上述过程如图所示,图b展示了对应该场景图像的热力图,按照此热力图指示,我们选取了两个强响应区域作为扣取的扩充图像块由于一开始利用了图像标记训练了一个初始分类模型,因此这样的过程称作“监督式数据扩充”。同样的数据扩充方式适用于高层语义图像分类任务,如场景分类和基于图像的节日分类等问题。

3

小结(p87-88)

  • 数据扩充是深度模型训练前的必须一步,此操作可扩充训练数据集,增强数据多样性,防止模型过拟合;
  • 一此简单的数据扩充方法为:图像水平翻转、随机扣取、尺度变换、旋转 变换、色彩抖动等等;
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-05-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 PaddlePaddle 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档