前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >在某个范围内随机生成一些数据_cut out删除造句

在某个范围内随机生成一些数据_cut out删除造句

作者头像
全栈程序员站长
发布2022-09-27 15:02:08
4400
发布2022-09-27 15:02:08
举报
文章被收录于专栏:全栈程序员必看

大家好,又见面了,我是你们的朋友全栈君。

目录

1、Cutout

2、Random Erasing


根据yolov4文献中提到的cutout数据增广方式,进行扩展阅读。Cutout & Random Erasing

1、Cutout

论文地址:https://arxiv.org/pdf/1708.04552.pdf

代码地址:https://github.com/Dingzixiang/cutout/blob/master/cutout.py

出发点:

文章的出发点除了解决遮挡问题外,还有从dropout上得到启发。众所周知,Dropout随机隐藏一些神经元,最后的网络模型相当于多个模型的集成。类似于dropout的思路,这篇文章将drop用在了输入图片上,并且drop掉连续的区域——即矩形区域。以下是一个简易的样例(灰色部分为drop掉的区域):

在某个范围内随机生成一些数据_cut out删除造句
在某个范围内随机生成一些数据_cut out删除造句

方法:

作者首先尝试通过一些可视化技术,发现图片高激活区域,对这些区域进行擦除。但是最后发现这种方法和随机选一个区域遮挡效果差别不大,而且带来了额外的计算量,得不偿失,便舍去。上图为早期的cutout擦除样例图,可以发现这种方法有针对性地擦除重要区域。本文最后采用的擦除方式为:利用固定大小的矩形对图像进行遮挡,在矩形范围内,所有的值都被设置为0,或者其他纯色值。而且擦除矩形区域存在一定概率不完全在原图像中的(文中设置为50%)。

在某个范围内随机生成一些数据_cut out删除造句
在某个范围内随机生成一些数据_cut out删除造句

实现代码:

代码语言:javascript
复制
# cutout.py
import numpy as np
import tensorflow as tf

def cutout(img, num_holes=1, length=4):
  """
  Args:
  img (Tensor): Tensor image of size (H, W, C). input is an image
  Returns:
  Tensor: Image with n_holes of dimension length x length cut out of it.
  """

  h = img.shape[0]
  w = img.shape[1]
  c = img.shape[2]
  mask = np.ones([h, w], np.float32)
  for _ in range(num_holes):
    y = np.random.randint(h)
    x = np.random.randint(w)
    y1 = np.clip(max(0, y - length // 2), 0, h)
    y2 = np.clip(max(0, y + length // 2), 0, h)
    x1 = np.clip(max(0, x - length // 2), 0, w)
    x2 = np.clip(max(0, x + length // 2), 0, w)
    mask[y1: y2, x1: x2] = 0
  mask = tf.expand_dims(mask, 2)
  mask_list = []
  for _ in range(c):
    mask_list.append(mask)
  mask = tf.concat(mask_list, axis=2)
  img = img * mask
  return img


input  = tf.get_variable('v1', [1,10,10,3], dtype=tf.float32)
print(input)
with tf.Session() as sess:
  sess.run(tf.global_variables_initializer())
  for i in range(input.get_shape()[0]):
    output = cutout(input[i], num_holes=1, length=4)
    print(output.eval())

效果:

在C10,C10+,C100,C100+,SVHN数据集上的test error rates表现如下(其中C表示CIFAR)。与Random Erasing非常类似,两篇论文发表时间为16NOV2017和29NOV2017,也是因为这个时间点才能同时发表,不然大概率会认为是抄袭。最主要的区别在于在cutout中,擦除矩形区域存在一定概率不完全在原图像中的。而在Random Erasing中,擦除矩形区域一定在原图像内。Cutout变相的实现了任意大小的擦除,以及保留更多重要区域。不过Cutout在更多情况下效果更好。这两种方法在用到自己的任务中,还得进行实验比较,才能得到更好的结果。

在某个范围内随机生成一些数据_cut out删除造句
在某个范围内随机生成一些数据_cut out删除造句

2、Random Erasing

论文地址:https://arxiv.org/pdf/1708.04896.pdf

代码地址:https://github.com/zhunzhong07/Random-Erasing

出发点:

为了增强模型泛化能力,常常对原始数据做数据增强处理,常用的方式一般为random cropping,flipping等。但是在现实场景中,遮挡问题一直都是一个难以处理和解决的问题。为了更好的实现对遮挡数据的模拟,利用Random Erasing的方式,将原数据集中一部分保持原样,另外一部分随机擦除一个矩形区域。效果图如下:

在某个范围内随机生成一些数据_cut out删除造句
在某个范围内随机生成一些数据_cut out删除造句

方法:

上图是对Random Erasing的一个简单样例,灰色区域表示擦除的部分。具体实现算法为:我们可以简单的解释为:

1) 设立五个超参数,分别表示原数据集中实施Random Erasing的概率P,擦除面积比率的下界sl和上界sh,擦除矩形长宽比的下界r1和上界r2。

2) 首先通过均匀分布得到一个概率P1,如果满足条件,实施擦除。

3) 擦除的过程如下:通过均匀分布取样得到擦除矩形面积,以及长宽值。选择一个满足所有矩形部分都在图像内的左上角坐标,将这个矩形区域都设置为统一的和图像其他区域无关的纯色值。

在某个范围内随机生成一些数据_cut out删除造句
在某个范围内随机生成一些数据_cut out删除造句

结果:

虽然十分简单,但是效果非常惊艳。对处理遮挡问题非常有帮助,是涨分的利器。分类、检测、识别任务上表现出色,下面贴出目标检测上VOC2007数据集测试效果。

在某个范围内随机生成一些数据_cut out删除造句
在某个范围内随机生成一些数据_cut out删除造句

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/193254.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1、Cutout
  • 2、Random Erasing
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档