前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >机器学习 - Data Augmentation 策略

机器学习 - Data Augmentation 策略

作者头像
AIHGF
发布2019-02-27 17:50:41
1.1K0
发布2019-02-27 17:50:41
举报
文章被收录于专栏:AIUAIAIUAI

Data Augmentation 策略

数据增强是提高模型性能和泛化能力的重要方法.

  • 随机调整 - Random resize
  • 平移 - Shift
  • 水平/垂直翻转 - Horizontal/Vertical flip
  • Rotation/Reflection 旋转/仿射变换
  • Noise - 高斯噪声,模糊处理
  • 颜色增强 - Color Augmentation,包括色彩饱和度、亮度和对比度等.
  • PCA Jittering 首先,按照 RGB 三个颜色通道计算均值和方差,规范网络输入数据; 然后,计算整个训练数据集的协方差矩阵,进行特征分解,得到特征向量和特征值,以作 PCA Jittering.
  • 随机图像插值 - Random Image Interpolation,主要是在图像裁剪和缩放时采用.
  • 裁剪采样 - Crop Sampling,从原始图像中缩放裁剪,得到网络输入. 常用有两种方式:
    • Scale Jittering,如 VGG 和 ResNet;
    • 尺度和长宽比增强变换 - Scale and aspect ratio augmentation,如 Google Inception 网络; 其缺点:随机选择 crop center 时,可能出现选择的区域不包含目标物体的区域.
    这里写图片描述
    这里写图片描述
  • 监督数据增强 - Supervised Data Augmentation(SDA) (海康威视2016提出)
  • 类别标签不均衡问题 - Imbalanced Class Problem. 数据集中各类别所包含的样本数可能很不均匀,有的类别包含样本数很多,有的类别包含样本数很少. 海康威视2016 受 Class-Aware Sampling方法启发提出 Label Shuffling/Label Smoothing 策略. ​

Reference

[1] - 深度学习大讲堂 - 海康威视研究院ImageNet2016竞赛经验分享

[2] - 使用深度学习(CNN)算法进行图像识别工作时,有哪些data augmentation 的奇技淫巧? - 知乎

[3] - 深度学习之图像的数据增强

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018年03月09日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Data Augmentation 策略
    • Reference
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档