专栏首页arxiv.org翻译专栏如果可以的话,找到它:端到端对抗擦除,用于弱监督语义分割(CS CV)

抱歉,你查看的文章已删除

原创

如果可以的话,找到它:端到端对抗擦除,用于弱监督语义分割(CS CV)

语义分割是一项传统的任务,需要大量的像素级地面真实标签数据集,获取这些数据既费时又昂贵。最近在弱监督设置方面的进展表明,仅使用图像级别标签就可以获得合理的性能。分类通常作为训练深度神经网络的代理任务,从深度神经网络中提取注意力地图。然而,分类任务只需要最少的证据就可以进行预测,因此它关注的是识别性最强的目标区域。为了克服这个问题,我们提出了一种新的对抗擦除注意地图的方法。与以往的对抗擦除方法相比,我们优化了两个具有相反损耗函数的网络,消除了某些次优策略的要求;例如,有多个训练步骤使训练过程变得复杂,或者在运行于不同分布的网络之间的权重共享策略可能对性能不是最优的。该方法不需要显著性遮罩,而是利用正则化损失来防止注意力地图扩散到识别性较差的目标区域。我们在Pascal VOC数据集上的实验表明,我们的对抗方法比基准方法提高了分割性能2.1 mIoU,比以前的对抗擦除方法提高了1.0 mIoU。

原文题目:Find it if You Can: End-to-End Adversarial Erasing for Weakly-Supervised Semantic Segmentation

原文 :Semantic segmentation is a task that traditionally requires a large dataset of pixel-level ground truth labels, which is time-consuming and expensive to obtain. Recent advancements in the weakly-supervised setting show that reasonable performance can be obtained by using only image-level labels. Classification is often used as a proxy task to train a deep neural network from which attention maps are extracted. However, the classification task needs only the minimum evidence to make predictions, hence it focuses on the most discriminative object regions. To overcome this problem, we propose a novel formulation of adversarial erasing of the attention maps. In contrast to previous adversarial erasing methods, we optimize two networks with opposing loss functions, which eliminates the requirement of certain suboptimal strategies; for instance, having multiple training steps that complicate the training process or a weight sharing policy between networks operating on different distributions that might be suboptimal for performance. The proposed solution does not require saliency masks, instead it uses a regularization loss to prevent the attention maps from spreading to less discriminative object regions. Our experiments on the Pascal VOC dataset demonstrate that our adversarial approach increases segmentation performance by 2.1 mIoU compared to our baseline and by 1.0 mIoU compared to previous adversarial erasing approaches.

原文作者:Erik Stammes, Tom F.H. Runia, Michael Hofmann, Mohsen Ghafoorian

原文地址:https://arxiv.org/abs/2011.04626

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 目标驱动的长期轨迹预测(CS CV)

    随着强大的序列建模和丰富的环境特征提取技术的应用,人类短期运动轨迹的预测有了很大的进步。然而,长期预测仍然是当前方法的一个主要挑战,因为误差可能会在这一过程中累...

    凌茜
  • DTGAN:文本到图像生成的双重注意力生成对抗网络(CS CV)

    现有的文本到图像生成方法大多采用多级模块化结构,存在三个主要问题:(1)训练多个网络会增加生成模型的运行时间,影响生成模型的收敛性和稳定性;(2)这些方法忽略了...

    凌茜
  • 用超图进行超真实感图像填充(CS CV)

    图像修复是计算机视觉中的一项重要任务,它可能依赖于图像的全局信息来填充缺失的数据。现有的方法大多使用注意力机制来学习图像的全局上下文。由于无法捕捉全局上下文,这...

    凌茜
  • 一个有效的许可区块链与可证明的信誉机制(Computers and Society)

    许可区块链,只允许已知节点参与,已广泛应用在政府、公司、研究所等等。我们研究了将许可的区块链应用于横向战略联盟领域的案例,以确保联盟中任何不遵守规则的参与者在事...

    用户6869393
  • 强盗反馈下的机构设计(cs.GT)

    我们研究了多轮福利最大化机制设计问题,其中,在每一轮,一个机制分配一个分配给一组代理,并收取他们的价格。然后,代理报告他们实现的(随机)值给机制。这是由云市场和...

    Donuts_choco
  • 追踪接触者以控制COVID-19大流行(CS SI)

    控制 COVID-19大流行需要大量减少接触,主要是通过实施行动控制达到强制隔离的水平。 这导致了经济的大部分崩溃。这种疾病的携带者大约在接触病毒后3天具有传染...

    用户7095611
  • 【Codeforces】1213A - Chips Moving

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

    喜欢ctrl的cxk
  • 神经网络零空间分析的异常值检测 (CS)

    许多机器学习分类系统缺乏能力意识。具体而言,许多系统缺乏识别何时将异常值(例如,不同于训练数据分布且未在训练数据分布中表示的样本)呈现给系统的能力。检测异常值的...

    DDDDDaemon
  • Towards a Definition of Disentangled Representations

    Towards a Definition of Disentangled Representations Irina Higgins∗ , David Amos...

    用户1908973
  • 用QUnit对Razor进行测试

    Given how central JavaScript is to many modern web applications,  it is importan...

    javascript.shop

扫码关注云+社区

领取腾讯云代金券