开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

为什么imagenet数据集标签中存在差异？

imagenet数据集标签中存在差异的原因是由于数据集的构建和标注过程中的主观因素和技术限制导致的。

数据集构建过程中的主观因素：imagenet数据集是由大量的人工标注完成的，标注者可能会因为个人认知、背景知识等因素而产生主观差异。不同的标注者可能会对同一张图片给出不同的标签，导致数据集中存在差异。
标注过程中的技术限制：在标注过程中，标注者可能会受到时间、精力和技术限制。由于数据集规模庞大，标注者需要快速地对图片进行标注，可能会导致一些标注错误或不准确的情况。此外，对于一些复杂的图片，标注者可能会面临难以确定的情况，导致标签的不一致性。
图片本身的多样性：imagenet数据集包含了大量不同类别的图片，这些图片可能涵盖了各种场景、角度、光照条件等因素的变化。由于图片本身的多样性，不同的标注者可能会对同一张图片给出不同的标签，导致数据集中存在差异。
数据集更新和演进：imagenet数据集是一个长期更新和演进的过程，随着时间的推移，数据集中的标签可能会随着新的研究和发现而进行调整和更新。这也会导致数据集中存在标签的差异。

总结起来，imagenet数据集标签中存在差异是由于数据集构建过程中的主观因素、标注过程中的技术限制、图片本身的多样性以及数据集的更新和演进等因素综合作用的结果。这种差异需要在使用数据集进行训练和评估时予以考虑，并采取适当的方法来处理和纠正。

相关搜索:@瞬态-为什么数据会保存在数据库中？chart.js中存在多个数据集的问题 Chart.js从if数据集值的图例中移除标签 chart.js修改数据集标签中的样式 IntelliJ idea deeplearning4j调试器在数据中存在差异为什么gnuplot时间数据图中的常规x轴和x2轴之间存在差异？为什么scala中不存在类集？为什么在脉冲音频中，空接收器和实际设备之间存在延迟差异？为什么数据库中不存在该表为什么直接使用图片数据集和pytorch自己的数据集精度差异这么大？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

预训练后性能反而变差，自训练要取代预训练了吗？

早在2018年底，FAIR的研究人员就发布了一篇名为《Rethinking ImageNet Pre-training》的论文，这篇论文随后发表在ICCV2019。该论文提出了一些关于预训练的非常有趣的结论。

01

如何减少噪声标签的影响？谷歌提出一种鲁棒深度学习方法MentorMix

在深度神经网络中，能够使用高质量标签训练数据对于学习效果至关重要，因为训练数据中存在错误标签（噪声标签）会大大降低干净测试数据上模型的准确性。

02

清华构建新一代数据集NICO，定义图像分类新标准

每件事物的出现都有它各自的使命，我们今天提数据集就不得不提到ImageNet，ImageNet数据集及其它推动的大规模视觉比赛对人工智能特别是计算机视觉领域的巨大贡献是毋庸置疑的。

03

ImageNet验证集6%的标签都是错的，MIT：十大常用数据集没那么靠谱

我们平时用的机器学习数据集存在各种各样的错误，这是一个大家都已经发现并接受的事实。为了提高模型准确率，有些学者已经开始着手研究这些数据集中的错误，但他们的研究主要集中在训练集，没有人系统研究过机器学习测试集的误差。

05

卧槽！ImageNet验证集6%的标签都是错！基于这些数据集的论文尴尬了！

众所周知，测试集是我们拿来衡量机器学习模型性能的基准。如果测试集错误百出，我们得‍到的性能数据也会存在很大偏差。‍

02

ImageNet验证集6%的标签都是错的，MIT：十大常用数据集没那么靠谱

机器之心报道编辑：张倩、小舟把老虎标成猴子，把青蛙标成猫，把码头标成纸巾……MIT、Amazon 的一项研究表明，ImageNet 等十个主流机器学习数据集的测试集平均错误率高达 3.4%。我们平时用的机器学习数据集存在各种各样的错误，这是一个大家都已经发现并接受的事实。为了提高模型准确率，有些学者已经开始着手研究这些数据集中的错误，但他们的研究主要集中在训练集，没有人系统研究过机器学习测试集的误差。众所周知，测试集是我们拿来衡量机器学习模型性能的基准。如果测试集错误百出，我们得‍到的性能数据也

02

港科技 & 港中文解密 CLIP 模型 Backbone 网络大小与虚假特征的关系！

大型视觉语言模型（LVLMs）能够将图像和文本表示对齐，以理解跨越前所未有的真实世界数据规模的图像中的普遍关系，这已经在现代机器学习中呈现出显著的范式转变。许多先进的LVLM作品，如CLIP、ALIGN、BASIC、Flamingo和BLIP，已经在广泛的视觉和多模态任务中展现出卓越的性能，大幅超过了传统的ImageNet训练模型。因此，LVLMs的巨大成功使得社区的焦点从ImageNet基准测试转向了如LAION这样的网络规模的多模态数据集。

01

10亿级数据规模的半监督图像分类模型，Imagenet测试精度高达81.2％ | 技术头条

作者| I. Zeki Yanlniz, Herve Jegou, Kan Chen, Manohar Paluri, Dhruv Mahajan

04

MICCAI 2020 | 腾讯开源大规模X光预训练模型及代码

“ 预训练模型能够加速任务模型收敛速度和提升模型性能。自然场景图像有ImageNet预训练模型，但此类数据和医学图像差异较大。因此腾讯提出了一个基于70万X光数据进行训练的模型，以作为该领域的预训练模型。模型及训练代码已开源！”

02

斯坦福、Meta AI新研究：实现AGI之路，数据剪枝比我们想象得更重要

选自arXiv 作者：Ben Sorscher等机器之心编译编辑：蛋酱 Scale is all you need？No. 在视觉、语言和语音在内的机器学习诸多领域中，神经标度律表明，测试误差通常随着训练数据、模型大小或计算数量而下降。这种成比例提升已经推动深度学习实现了实质性的性能增长。然而，这些仅通过缩放实现的提升在计算和能源方面带来了相当高的成本。这种成比例的缩放是不可持续的。例如，想要误差从 3% 下降到 2% 需要的数据、计算或能量会指数级增长。此前的一些研究表明，在大型 Transform

02

ImageNet训练的AI竟然人妖不分，网友炸了！

一个最近出现的网站“ImageNet Roulette”可以告诉你，但事先警告：现实并不美好，AI对你的评价有时甚至很残酷。

03

在小目标检测上另辟蹊径的SNIP

相信大家都或多或少的熟悉一些检测器，不知道你是否思考过这样一个问题？FPN的多特征图融合方式一定是最好的吗？如果你看过【CV中的特征金字塔】一，工程价值极大的ASFF这篇论文的话，你应该知道这篇论文的出发点就是如何对不同尺度的特征做自适应特征融合（感觉也可以叫作FPN+Attention），而非【CV中的特征金字塔】二，Feature Pyramid Network那样较为暴力的叠加（不知道这个说法是否稳妥，有意见欢迎来提）。而今天要介绍的这个SNIP（「An Analysis of Scale Invariance in Object Detection – SNIP」）算法，是CVPR 2018的文章，它的效果比同期的目标检测算法之CVPR 2018 Cascade R-CNN效果还好一些。为什么说这个算法是另辟蹊径呢？因为这个算法从COCO数据集开始分析，作者认为目标检测算法的难点在于「数据集中目标的尺寸分布比较大，尤其对小目标的检测效果不太好」，然后提出了本文的SNIP算法。

02

预、自训练之争：谷歌说预训练虽火，但在标注数据上自训练更有效

早在 2018 年，何恺明等人在论文《Rethinking ImageNet Pre-training》中重新思考了 ImageNet 预训练模型。他们发现这种利用预训练模型抽取「通用」特征，并借此解决大多数视觉任务的方法是值得质疑的。因为即使在比 ImageNet 还大 3000 倍的数据集上进行预训练，它们对目标检测任务的性能提升仍然不是很大。

01

迁移学习中如何利用权值调整数据分布？DATL、L2TL两大方法解析

深度神经网络的应用显著改善了各种数据挖掘和计算机视觉算法的性能，因此广泛应用于各类机器学习场景中。然而，深度神经网络方法依赖于大量的标记数据来训练深度学习模型，在实际应用中，获取足够的标记数据往往既昂贵又耗时。因此，一个自然的想法是利用现有数据集（即源域）中丰富的标记样本，辅助在要学习的数据集（即目标域）中的学习。解决这类跨领域学习问题的一种有效方法就是迁移学习：首先在一个大的标记源数据集（如 ImageNet）上训练模型，然后在目标数据集上进行模型调整更新，从而实现将已训练好的模型参数迁移到新的模型来帮助新模型训练。

02

Learning Texture Invariant Representation for Domain Adaptation

由于为语义分割注释像素级标签非常费力，因此利用合成数据是一个很有吸引力的解决方案。然而，由于合成域与真实域之间存在域间的差异，用合成数据训练的模型很难推广到真实数据中去。在本文中，我们考虑到两个域之间的根本区别作为纹理，提出了一种适应目标域纹理的方法。首先，我们利用风格转换算法对合成图像的纹理进行多样性处理。生成图像的各种纹理防止分割模型过度拟合到一个特定的(合成)纹理。然后通过自训练对模型进行微调，得到对目标纹理的直接监督。我们的结果达到了最先进的性能，我们通过大量的实验分析了在程式化数据集上训练的模型的属性。

03

CVPR 2022丨清华大学提出：无监督域泛化 (UDG)

近日，清华大学崔鹏团队在CVPR 2022上发表了一篇工作，针对传统域泛化 (DG) 问题需要大量有标签数据的问题，提出了无监督域泛化 (UDG) 问题，旨在通过利用无标签数据进行预训练提升模型在未知域上的泛化能力，并为 UDG 提出了 DARLING 算法。该算法仅使用ImageNet 数据量 1/10 的无标签数据进行预训练即可在DomainNet上超过ImageNet预训练的效果。 1 DG简介&现有DG的问题目前深度学习在很多研究领域特别是计算机视觉领域取得了前所未有的进展，而大部分深度学习算法假

02

超越ImageNet预训练，Meta AI提出SplitMask，小数据集也能自监督预训练

目前，计算机视觉神经网络被大量参数化：它们通常有数千万或数亿个参数，这是它们成功利用大型图像集合 (如 ImageNet) 的关键。然而，这些高容量模型往往会在小型（包含数十万张图像）甚至中型数据集上过度拟合。因此，有研究者指出在 2014 年：学习 CNN 的过程相当于估计模型数百万个参数，这需要大量的带标注的数据。

04

ViT训练的全新baseline！

‍‍‍‍ 来源：机器之心本文约3500字，建议阅读10+分钟本文为你介绍ViT的三种数据增强方法。本文提出了训练视觉 Transformer（ViT）的三种数据增强方法：灰度、过度曝光、高斯模糊，以及一种简单的随机修剪方法 (SRC)。实验结果表明，这些新方法在效果上大大优于 ViT 此前的全监督训练方法。 Transformer 模型 [55] 及其衍生模型在 NLP 任务中取得巨大成功后，在计算机视觉任务中也越来越受欢迎。这一系列的模型越来越多地用于图像分类 [13]、检测与分割 [3]、视频分析

01

ViT 训练的全新baseline

Transformer 模型 [55] 及其衍生模型在 NLP 任务中取得巨大成功后，在计算机视觉任务中也越来越受欢迎。这一系列的模型越来越多地用于图像分类 [13]、检测与分割 [3]、视频分析等领域。尤其是 Dosovistky 等人 [13] 提出的视觉 Transformer（ViT）成为了卷积结构的合理替代模型。这些现象说明 Transformers 模型已经可以作为一种通用架构，来通过注意力机制学习卷积以及更大区间的操作 [5,8]。相比之下，卷积网络 [20,27,29,41] 本就具备了平移不变性，不用再通过训练来获取。因此，包含卷积的混合体系结构比普通 Transformers 收敛得更快也就不足为奇了 [18]。

01

ViT的复仇：Meta AI提出ViT训练的全新baseline

选自arXiv 作者：Adam Zewe 机器之心编译编辑：赵阳、张倩本文提出了训练视觉 Transformer（ViT）的三种数据增强方法：灰度、过度曝光、高斯模糊，以及一种简单的随机修剪方法 (SRC)。实验结果表明，这些新方法在效果上大大优于 ViT 此前的全监督训练方法。 Transformer 模型 [55] 及其衍生模型在 NLP 任务中取得巨大成功后，在计算机视觉任务中也越来越受欢迎。这一系列的模型越来越多地用于图像分类 [13]、检测与分割 [3]、视频分析等领域。尤其是 Dosov

02

【谷歌升级ImageNet】大规模视觉理解竞赛WebVision冠军分享 | 新智元CVPR-17专题

【新智元导读】ImageNet 竞赛在今年正式完结。那么，图像识别未来的重点将是什么，ImageNet 竞赛之后又会出现什么呢？WebVision 竞赛被誉为接棒 ImageNet的大规模图像识别竞赛，今年有 100 多个团队参与。本文介绍 WebVision 竞赛，后附冠军团队码隆科技的技术分享。 2017 年 7 月 26 日，CVPR 2017 研讨会“超越 ILSVRC”将正式宣布 ImageNet 竞赛结束。然而，这并不代表着领域对图像识别兴趣的消退。实际上，相关的关注度正在走高。 ImageNe

Adversarial Reinforcement Learning for Unsupervised Domain Adaptation

将知识从已有的标记域转移到新的域时，往往会发生域转移，由于域之间的差异导致性能下降。领域适应是缓解这一问题的一个突出方法。目前已有许多预先训练好的神经网络用于特征提取。然而，很少有工作讨论如何在源域和目标域的不同预训练模型中选择最佳特性实例。通过采用强化学习我们提出了一种新的方法来选择特征，再两个域上学习选择最相关的特征。具体地说，在这个框架中，我们使用Q-learning来学习agent的策略来进行特征选择，通过逼近action-value来进行决策。在选择最优特征后，我们提出一种对抗分布对齐学习来改进预测结果。大量的实验证明，该方法优于目前最先进的方法。

01

【AI有识境】如何掌握好图像分类算法？

进入到有识境界，可以大胆地说自己是一个非常合格的深度学习算法工程师了，能够敏锐地把握自己研究的领域，跟踪前沿和能落地的技术，对自己暂时不熟悉的领域也能快速地触类旁通。

02

Jigsaw pre-training：摆脱ImageNet，拼图式主干网络预训练方法 | ECCV 2020

论文: Cheaper Pre-training Lunch: An Efficient Paradigm for Object Detection

01

改进模型架构遇到了瓶颈？你该考虑改善自己的数据了！

AI 科技评论按：这篇博客来自 Jetpac（现被谷歌收购） CTO、苹果毕业生、TensorFlow 团队成员 Pete Warden。文中讨论了一个很容易被机器学习领域的研究人员们忽略的问题：你是否真的清楚数据对模型表现有多大影响，同时你又有没有付出适当的精力在改善你的数据上呢？已经为生产环境开发过模型的研究人员相信已经对这件事足够重视，不过也不妨重温一下其中的重要思路。

05

深度 | 生产级深度学习的开发经验分享：数据集的构建和提升是关键

本文从生产层面强调了深度学习项目开发中需要更加重视数据集的构建，并以作者本人的亲身开发经验为例子，分享了几个简单实用的建议，涉及了数据集特性、迁移学习、指标以及可视化分析等层面。

00

【GAN优化】长文综述解读如何定量评价生成对抗网络(GAN)

欢迎大家来到《GAN优化》专栏，这里将讨论GAN优化相关的内容，本次将和大家一起讨论GAN的评价指标。

01

从0上手Kaggle图像分类挑战：冠军解决方案详解

【新智元导读】这篇文章介绍了作者在Kaggle植物幼苗分类比赛使用的方法，该方法连续几个月排名第一，最终排名第五。该方法非常通用，也可以用于其他图像识别任务。

00

当自监督遇上语言-图像预训练，UC伯克利提出多任务框架SLIP

近来一些研究表明，在具有挑战性的视觉识别任务上，自监督预训练可以改善监督学习。CLIP 作为一种监督学习新方法，在各种基准测试中都表现出优异的性能。

03

颠覆三观！谷歌最新研究：用性能差的模型计算「相似度」反而更准？

虽然当下有一些相对直接的方法来计算图像相似度，比如测量像素上的差异（如FSIM, SSIM），但这种方法获得的相似性差异和人眼感知到的差异相去深远。

03

【GAN优化】最早被用于评价GAN模型的定量指标Inception Score是什么

最近一部分的内容将会比较容易，将和大家一起讨论GAN的评价指标，也没有太难以理解的东西，希望大家踊跃讨论，欢迎留言。

01

独家 | 如何改善你的训练数据集？（附案例）

这张幻灯片是Andrej Karpathy 在Train AI 演讲的一部分，我很赞同它表达的观点。它充分体现了深度学习在研究和应用上的差异。学术论文几乎全部集中在新的和改进的模型上，使用的数据集是从公共数据集中选出的一小部分。相反，我认识的将深度学习作为实际应用的一部分人，他们大部分时间都在思考如何改善训练数据。

04

对比自监督学习方法综合对比分析

【导读：这篇来自华盛顿大学的论文深入研究了各种对比自监督模型，系统分析了计算机视觉任务的基准问题；算法，数据集和终端任务如何影响模型性能；以及哪种编码器是最好的通用主干网络。】

04

NeurIPS 2021 | 旷视提出：空间集成 ——一种新颖的模型平滑机制

论文链接:https://arxiv.org/pdf/2110.01253.pdf

02

吓人！AI模型性能上不去真的不怪我，ImageNet等数据集每100个标签就错3个！

标签错误会破坏基准的稳定性，然而，令人没想到的是，大多数机器学习中使用的10个主流基准测试集普遍存在标签错误。比如，把“狮子”标记成“猴子”，把“青蛙”标记成“猫”。

02

AAAI 2022 | InsCLR：一种利用自监督训练提升实例检索的方法

InsCLR: Improving Instance Retrieval with Self-Supervision

03

预训练还需要监督信息吗？一文了解无监督训练的优势

论文链接：https://arxiv.org/pdf/2006.06606.pdf

02

ImageNet 存在十万标签错误，你知道吗？

使用ImageNet、CIFAR、MNIST 或 IMDB 这些数据集时，你是不是会潜意识中假设，这些数据集中的类标签都是正确的？

02

重新标注128万张ImageNet图片：多标签，全面提升模型性能 | 留言送书

ImageNet 是机器学习社区最流行的图像分类基准数据集，包含超过 1400 万张标注图像。该数据集由斯坦福教授李飞飞等人于 2006 年开始创建，后成为评估计算机视觉模型在下游视觉任务中能力的试金石。

02

分类干货实践 | 重新标注128万张ImageNet图片：多标签，全面提升模型性能

ImageNet 是机器学习社区最流行的图像分类基准数据集，包含超过 1400 万张标注图像。该数据集由斯坦福教授李飞飞等人于 2006 年开始创建，后成为评估计算机视觉模型在下游视觉任务中能力的试金石。

03

数据集中存在错误标注怎么办？置信学习帮你解决

如果你曾经使用过诸如 CIFAR、MNIST、ImageNet 或 IMDB 之类的数据集，那么你可能会假设类标签是正确的。令人吃惊的是，ImageNet 中可能至少有 10 万个标签有问题。为什么我们不早点找到它们？在海量数据集中描述和发现标签错误的原则性方法非常具有挑战性，解决方案也很有限。

02

学界 | Moments in Time：IBM-MIT联合提出最新百万规模视频动作理解数据集

AI 科技评论按：本文为上海交通大学林天威为 AI 科技评论撰写的独家稿件，未经许可请勿转载。在过去一年中，视频理解相关的领域涌现了大量的新模型、新方法，与之相伴的，今年也出现了多个新的大规模的视频理解数据集。近期，MIT-IBM Watson AI Lab 就推出了一个全新的百万规模视频理解数据集Moments-in-Time[1]。虽然没有之前的YouTube-8M数据集大，但应该是目前多样性，差异性最高的数据集了。该数据集的任务仍然为视频分类任务，不过其更专注于对“动作”的分类，此处的动作为广义的动

07

数据集中存在错误标注怎么办？置信学习帮你解决

如果你曾经使用过诸如 CIFAR、MNIST、ImageNet 或 IMDB 之类的数据集，那么你可能会假设类标签是正确的。令人吃惊的是，ImageNet 中可能至少有 10 万个标签有问题。为什么我们不早点找到它们？在海量数据集中描述和发现标签错误的原则性方法非常具有挑战性，解决方案也很有限。

01

数据集中存在错误标注怎么办？置信学习帮你解决

如果你曾经使用过诸如 CIFAR、MNIST、ImageNet 或 IMDB 之类的数据集，那么你可能会假设类标签是正确的。令人吃惊的是，ImageNet 中可能至少有 10 万个标签有问题。为什么我们不早点找到它们？在海量数据集中描述和发现标签错误的原则性方法非常具有挑战性，解决方案也很有限。

01

详解分析 | ViT如何在医疗图像领域替代CNNs？

在自动医学图像诊断的领域中卷积神经网络(CNN)方法已经统治了将近十年之久。最近，vision transformers(ViTs)作为CNN的一个有竞争力的替代方法出现了，它具有差不多的性能，同时还具有一些有趣的特性，同时也已经被证明对医学成像任务有益。

03

详解分析 | ViT如何在医疗图像领域替代CNNs？

在自动医学图像诊断的领域中卷积神经网络(CNN)方法已经统治了将近十年之久。最近，vision transformers(ViTs)作为CNN的一个有竞争力的替代方法出现了，它具有差不多的性能，同时还具有一些有趣的特性，同时也已经被证明对医学成像任务有益。

02

何恺明团队新作ResNext：Instagram图片预训练，挑战ImageNet新精度

目前，几乎所有最先进的视觉感知算法都依赖于相同的范式：（1）在手动注释的大型图像分类数据集上预训练卷积网络，（2）在较小的特定任务的数据集上微调网络。这个模式已经广泛使用了好多年，并取得了明显的进展。比如：物体检测，语义分割，人体姿势估计，视频识别，单眼深度估计等。

02

CV未来在这68张图上？Google Brain深扒ImageNet：顶级模型全都预测失败

---- 新智元报道编辑：LRS 【新智元导读】ImageNet的标签问题一直为人诟病，最近Google Brain全面分析了基准内遗留的历史问题，并找出了所有顶级模型全都预测失败的68张图片，或许未来CV想取得突破，先得攻破这68关！过去的十年里，ImageNet基本就是计算机视觉领域的「晴雨表」，看准确率有没有提升，就知道有没有新技术问世。「刷榜」一直是模型创新的原动力，把模型Top-1准确率推动到90%+，比人类还高。但ImageNet数据集是否真的像我们想象中的那么有用？很多论

03

华人博士提出原型对比学习，非监督学习效果远超MoCo和SimCLR

本文提出的原型对比学习(PCL) ，统一了非监督式学习的两个学派: 聚类学习和对比学习。PCL 推动了机器学习和人工智能的圣杯--非监督式学习技术的进步，并向无需人类指导的机器智能迈出了重要的一步。

03

CV未来在这68张图上？Google Brain深扒ImageNet：顶级模型全都预测失败

---- 点击上方↑↑↑“OpenCV学堂”关注我来源：公众号新智元授权【导读】ImageNet的标签问题一直为人诟病，最近Google Brain全面分析了基准内遗留的历史问题，并找出了所有顶级模型全都预测失败的68张图片，或许未来CV想取得突破，先得攻破这68关！过去的十年里，ImageNet基本就是计算机视觉领域的「晴雨表」，看准确率有没有提升，就知道有没有新技术问世。「刷榜」一直是模型创新的原动力，把模型Top-1准确率推动到90%+，比人类还高。但ImageNet数据集是否真的像我

04

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭