前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >ECCV 2020 | 针对长尾分布问题的特征空间增广

ECCV 2020 | 针对长尾分布问题的特征空间增广

作者头像
Amusi
发布2020-11-11 14:55:39
1.1K0
发布2020-11-11 14:55:39
举报
文章被收录于专栏:CVerCVer

本文作者:LeoFerguson https://zhuanlan.zhihu.com/p/203799008 本文已由原作者授权,不得擅自二次转载

题目:Feature Space Augmentation for Long-Tailed Data

这篇文章收录于ECCV2020,针对的是分类任务中的长尾分布问题。

论文地址:https://arxiv.org/abs/2008.03673

现实世界的数据通常遵循长尾分布,也就是说每个类的数量通常是不同的。例如,数据集头部类中样本数很多,而尾部类中样本数很少。然而我们希望模型是能够公平的表示整个数据集,而不是偏向某些样本多的类。解决长尾问题的各种方法中,类平衡损失、重采样和数据增广是比较常见的方法。但是对于尾部类来说,我们不得不考虑一些其他知识来弥补丢失的信息。在本文中,作者提出了一种新的方法来解决长尾问题-在特征空间中将头部类的特征增广到尾部类特征上。具体来说是将每个类的特征解耦成类特有和类共有特征,将尾部类的类特有特征和头部类的类共有特征进行融合,从而实现特征空间的增广。该方法在iNaturalist, ImageNet-LT, Places-LT 和长尾的CIFAR集四个数据集上都取得了不错的效果。

简介

长尾分布广泛存在于视觉任务中。如图所示在分类和检测任务中存在长尾分布问题。

长尾分布带来的主要问题是在训练时,因为尾部类数据量少,统计信息不够丰富,因而模型并不能很好的表达尾部类。现有的方法主要有数据增广,下采样,过采样,和平衡损失函数的构建等。但是这些方法当尾部类数量极少时,性能并不理想。如下图所示。

本文提出了在特征空间中,将头部类的信息迁移到尾部类上,具体方法如下。

本文方法

本文首先用CAM方法提取注意力区域,得到每个类的类特有特征和类共有特征。之后将尾部类的类特有特征和头部类的类共有特征进行融合。

首先来介绍一下CAM(Class Activation Map)。

M是我们得到的高亮图。c是类别,x,y是像素位置,k是通道,w是权重,f是特征向量。当M越大,意味着x,y处的特征对于c这一类别来说越发重要。之后我们将M归一化到0-1,给一个阈值

,通过下面的公式,我们就能得到类特有特征(s代表specific)和类共有特征(g代表generic)。

代表Hadamard乘积,而当x大于等于0时,sgn(x)=1,小于0时,sgn(x)=0。

之后我们来看整体的训练流程。第一步是进行全部数据的训练,得到提取特征的子网络和基础分类器,用于之后的步骤中。第二步是根据刚刚得到的提取特征网络和分类器,以及之前的CAM,进行尾部类的增广。可以看到,第二步进去一张尾部类图片和一张头部类图片,选取头部类图片时是选取的与尾部类距离较近,容易混淆的头部类(根据置信度排序得到)。

第三步则是微调。注意第三步和第二步是同步进行的,统称为第二阶段。第二阶段整体算法流程如下。

实验与结果

数据集: Long-tailed CIFAR-10 and CIFAR-100, ImageNet-LT and Places-LT Dataset,iNaturalist 2017 and 2018.

对比实验:

消融实验

结果分析

更多细节可参考论文原文。

下载1

在CVer公众号后台回复:PRML,即可下载758页《模式识别和机器学习》PRML电子书和源码。该书是机器学习领域中的第一本教科书,全面涵盖了该领域重要的知识点。本书适用于机器学习、计算机视觉、自然语言处理、统计学、计算机科学、信号处理等方向。

PRML

下载2:CVPR / ECCV 2020开源代码

在CVer公众号后台回复:CVPR2020,即可下载CVPR 2020代码开源的论文合集

在CVer公众号后台回复:ECCV2020,即可下载ECCV 2020代码开源的论文合集

重磅!CVer-论文写作与投稿交流群成立

扫码添加CVer助手,可申请加入CVer-论文写作与投稿 微信交流群,目前已满2400+人,旨在交流顶会(CVPR/ICCV/ECCV/NIPS/ICML/ICLR/AAAI等)、顶刊(IJCV/TPAMI/TIP等)、SCI、EI、中文核心等写作与投稿事宜。

同时也可申请加入CVer大群和细分方向技术群,细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-11-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CVer 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档