开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

社区首页 >专栏 >图像扩张

图像扩张

linxinzhe

发布于 2018-04-10 15:07:56

6240

发布于 2018-04-10 15:07:56

举报

文章被收录于专栏：林欣哲

机器视觉中的图像识别问题，常常需要大量的数据，而带标签的数据需要人工标注，很难得到较多的数据。因此，我们需要使用图像扩张的方法，人工生成各种变换后的数据，扩大我们的数据量，增强系统的鲁棒性，也是一种防止过拟合的方法。

图像扩张的非常常用变换有：

镜像反转：像镜子一样把一张图像左右互换了
随机切割：把一个图像随机的取出其中的部分
颜色转换：RGB的三个颜色通道，简单的变化就随机加减，高级玩法可以用PCA主成分分析的降维方法调整RGB，图像的颜色会有些变化

较常用：

旋转
扭曲
裁剪

图像扩张的手段，其实相对于让机器学习的模型能见识各种情况下的数据，增强它的鲁棒性。在我们人类看来可能觉得是同一个图像，但是机器觉得这就是不同的图像。

在具体编程实施，通常是开一个线程专门处理原始图像的变换，并形成一个mini-batch集，塞入到训练的过程中，这可以是并行的，不影响原来训练的顺序。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2017-11-17，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自林欣哲微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

评论

登录后参与评论

0 条评论

热度

最新

LV.

相关产品与服务

图像识别

腾讯云图像识别基于深度学习等人工智能技术，提供车辆，物体及场景等检测和识别服务，已上线产品子功能包含车辆识别，商品识别，宠物识别，文件封识别等，更多功能接口敬请期待。

产品介绍产品文档

精选特惠用云无忧