专栏首页arxiv.org翻译专栏使用高噪声标签进行深度学习分类(CS LG)
原创

使用高噪声标签进行深度学习分类(CS LG)

深度学习系统在图像分类方面表现出了超高的准确性,但代价是需要收集大量的图像数据集。收集如此大量的数据会导致训练集中的标签错误。对多媒体内容进行检索、分类或推荐的索引可能涉及到基于多个标准的标签化或分类。在我们的案例中,我们用一个封闭的角色身份数据集来训练人脸识别系统,用于演员识别,同时暴露在大量的扰动器(我们的数据库中未知的演员)。众所周知,人脸分类器对标签噪声很敏感。同时,我们回顾了最近关于如何在训练深度学习分类器时管理噪声注释的工作,不过这与我们对人脸识别的研究无关。

原文题目:Deep Learning Classification With Noisy Labels

原文:Deep Learning systems have shown tremendous accuracy in image classification, at the cost of big image datasets. Collecting such amounts of data can lead to labelling errors in the training set. Indexing multimedia content for retrieval, classification or recommendation can involve tagging or classification based on multiple criteria. In our case, we train face recognition systems for actors identification with a closed set of identities while being exposed to a significant number of perturbators (actors unknown to our database). Face classifiers are known to be sensitive to label noise. We review recent works on how to manage noisy annotations when training deep learning classifiers, independently from our interest in face recognition.

原文作者:Guillaume Sanchez, Vincente Guis, Ricard Marxer, Frédéric Bouchara

原文地址:https://arxiv.org/abs/2004.11116

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 数据驱动的 Astrobot 群体收敛预测(CS RO)

    天体机器人是一种机器人制品,其群落用于天体物理学研究,用于生成可观测到的宇宙图。这些天体机器人群必须与各种期望的观测结果进行协调。这种协调是如此复杂,以至于分布...

    刘持诚
  • 动态合并点预测(CS AR)

    经过几十年的研究,条件分支的错误预测仍然给性能带来了很大的问题。此外,对无限大小预测器的极限研究表明,许多剩余的分支是当前策略无法预测的。我们的工作重点是在面对...

    刘持诚
  • 个性化语法纠错:根据能力水平和 L1 进行调整(CS CL)

    语法纠错 (GEC) 系统在各种软件应用中已变得无处不在,并已开始在某些数据集上接近人类水平的性能。然而,对于如何根据用户的特点(如用户的熟练程度和第一语言)或...

    刘持诚
  • 乐器分类的端对端对抗性白盒攻击行为(CS SD)

    对输入数据的小规模对抗性扰动会在很大程度上改变机器学习系统的性能,从而对这种系统的有效性提出挑战。我们提出了第一个针对乐器分类系统的端到端对抗性攻击,允许直接在...

    Rosalie
  • 通过共分割实现基于涂鸦的域自适应

    中文摘要:虽然深卷积网络在许多医学图像分割任务中已经达到了最先进的性能,但它们通常表现出较差的泛化能力。为了能够从一个领域(例如,一种成像模式)归纳到另一个领域...

    用户7454122
  • Tracking Emerges by Colorizing Videos

    Carl Vondrick , Abhinav Shrivastava , Alireza Fathi , Sergio Guadarrama ,Kevin M...

    用户1908973
  • Tips about MacBook's battery health

    内容摘自Mac上的一个灰常好的免费软件Battery Health中关于保养MacBook的电池寿命的建议,与大家一起分享

    宅男潇涧
  • 实用且可验证的电子分类(CS CR)

    由于计算量大的验证(与注册阶段的持续时间T成线性关系)或易于拒绝服务,因此现有的可验证电子分类系统不切实际。 基于可验证的延迟功能的改进,我们提出了一种可验证的...

    小童
  • 比较13种算法在165个数据集上的表现,你猜哪个最好?

    量化投资与机器学习微信公众号
  • C++核心准则C.152:永远不要将派生类数组的指针赋值给基类指针

    Subscripting the resulting base pointer will lead to invalid object access and p...

    面向对象思考

扫码关注云+社区

领取腾讯云代金券