学习
实践
活动
专区
工具
TVP
写文章

ImageNet 的衰落

我做了一个机器学习示例,它使用了曾经最受欢迎的ImageNet 数据集,这是目前每个机器学习从业者都知道的经典图像分类问题。这是一张图片,对1000个类别中的哪一个进行分类。 但这次我注意到了一些奇怪的地方,首先网站崩溃了,当它恢复时,一切都变了,ImageNet 维护者修改了数据集中的每一张图像,以模糊人脸。 今天,大多数最先进的计算机视觉模型都在 ImageNet 上进行了预训练,它们所呈现的自然情境和对象为大多数计算机视觉问题提供了强有力的基础。 由于 ImageNet 的挑战不是识别人,而是识别物体,因此团队决定进一步模糊数据集中人的面孔,最后,他们修改了 243,198 张图片。 如果将 ImageNet 组织为 Pachyderm 中的数据集,则隐私感知版本可能会覆盖原始数据集。

17530
  • 广告
    关闭

    云原生TDSQL-C MySQL 数据库开发者限时免费认证了!

    为帮助各类数据库从业者,提升云原生数据库专业技能、加速业务交付能力和个人从业竞争力,腾讯产业互联网学堂联合腾讯云数据库团推出TDSQL-C MySQL 数据库开发者限时免费认证。适于开发工程师、运维工程师、架构师、测试工程师、项目经理、产品经理、数据库爱好者等。

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Rethinking ImageNet Pre-training

    预训练 加快模型收敛」,「ImageNet 预训练不能缓解过拟合现象」,「当目标任务对空间位置更敏感时,ImageNet pretrain所起到的作用会比较小」 。 可以总结一下就是 在数据集充分的条件下,各个任务里,「从头训练的效果并不比在ImageNet预训练过的要差」 从头训练的模型「需要更多的迭代次数」,才能追上预训练模型Finetune的结果 ImageNet 通过我们大量的实验,我们得出了如下的结论 ImageNet预训练加快收敛速度,「特别是在训练初期阶段」。 这告诉我们imagenet pretrain 加 coco数据集上进行finetune,和从头在coco数据集上训练。 预训练 加快模型收敛」 「ImageNet 预训练不能缓解过拟合现象」 「当目标任务对空间位置更敏感时,ImageNet pretrain所起到的作用会比较小」 在笔者看来,训练网络就跟人类学习行为很相似

    68720

    浅谈混合精度训练imagenet

    浅谈混合精度训练imagenet 零、序 本文没有任何的原理和解读,只有一些实验的结论,对于想使用混合精度训练的同学可以直接参考结论白嫖,或者直接拿github上的代码(文末放送)。 训练nan 由于以前每周都没跑很多模型,问题也不是经常出现,所以以为是偶然时间,不过最近恰好最近要做一些transformer的实验,在跑imagenet baseline(R50)的时候,出现了类似的问题 )优化器LearningRatetop1@accResNet50ImageNet1k256SGD optimizer0.175.40%ResNet50ImageNet1k512SGD optimizer0.275.70% ResNet50ImageNet1k1024SGD optimizer0.475.57%ResNe50ImageNet1k2048SGD optimizer0.8NaNResNet50ImageNet1k4096SGD optimizer1.675.79%ResNe50O2 (FP16训练,BN用FP32计算)ImageNet1k4096SGD optimizer1.675.59%ResNet50O3(几乎存FP16

    59420

    ImageNet Classification with Deep Convolutional Neural Networks

    摘要我们训练了一个大型的深度卷积神经网络,将ImageNet lsvprc -2010竞赛中的120万幅高分辨率图像分成1000个不同的类。 本文的具体贡献如下:我们对ImageNet large Visual Recognition Challenge (ILSVRC)-2010和ILSVRC-2012比赛中使用的ImageNet子集进行了迄今为止最大的 3、数据集ImageNet是一个超过1500万张高分辨率图像的数据集,属于大约22000个类别。 从2010年开始,作为Pascal视觉对象挑战赛的一部分,每年都会举办一场名为ImageNet大型视觉识别挑战赛(ILSVRC)的比赛。 ImageNet由可变分辨率的图像组成,而我们的系统需要一个恒定的输入维数。因此,我们将图像降采样到256×256的固定分辨率。

    1.3K40

    Imagenet与ILSVRC数据集介绍

    IMAGENET Large Scale Visual Recognition Challenge(ILSVRC) 1. 基本介绍 从2010年开始,每年举办的ILSVRC图像分类和目标检测大赛。 Imagenet数据集是目前深度学习图像领域应用得非常多的一个领域,关于图像分类、定位、检测等研究工作大多基于此数据集展开。 Imagenet数据集文档详细,有专门的团队维护,使用非常方便,在计算机视觉领域研究论文中应用非常广,几乎成为了目前深度学习图像领域算法性能检验的“标准”数据集。 Imagenet数据集有1400多万幅图片,涵盖2万多个类别; 其中有超过百万的图片有明确的类别标注和图像中物体位置的标注。 1,034,908 Number of synsets with SIFT features: 1000 Number of images with SIFT features: 1.2million Imagenet

    6K20

    Imagenet数据集_mnist数据集介绍

    官网:http://www.image-net.org/ 数据集下载地址:http://www.image-net.org/challenges/LSVRC/ IMAGENET Large Scale Imagenet数据集是目前深度学习图像领域应用得非常多的一个领域,关于图像分类、定位、检测等研究工作大多基于此数据集展开。 Imagenet数据集文档详细,有专门的团队维护,使用非常方便,在计算机视觉领域研究论文中应用非常广,几乎成为了目前深度学习图像领域算法性能检验的“标准”数据集。 Imagenet数据集有1400多万幅图片,涵盖2万多个类别; 其中有超过百万的图片有明确的类别标注和图像中物体位置的标注。 1,034,908 Number of synsets with SIFT features: 1000 Number of images with SIFT features: 1.2million Imagenet

    13920

    AlexNet- ImageNet Classification with Deep Convolutional Neural Networks

    2 The Dataset 公共测试数据库让大家有一个共同的测试基准,这样可以对不同算法的性能进行比较,孰优孰劣就一目了然了。 在深度学习中数据库最有名气的当然是 ImageNet ,李飞飞等人建立的(最近加入了 Google了)。 这里大致介绍一下 ImageNet,该数据库包含 1千5 百万张标记的高清图像,大约 22000个类。这些图像从网络收集的,人工标记类别。 在这个数据库基础上 有了一个 ImageNet Large-Scale Visual Recognition Challenge (ILSVRC) 用于大家算法比武测试用的。 ImageNet 中很有不同尺寸的图像,我们的系统输入需要固定尺寸的图像,所以我们将图像下采样之256*256。

    56830

    “烘焙”ImageNet:自蒸馏下的知识整合

    “烘焙”在任意网络架构的训练中即插即用,以最少的时间成本实现有效的大幅性能提升,我们在ImageNet及其他多个常见的图像分类基准下进行了算法验证。 ? 深度学习时代以来,有大量的算法致力于提升图像分类的性能,尤其是在最流行的ImageNet基准上。近期一些研究指出,不够完善的人为标注成为了阻碍监督训练的分类模型性能进一步提升的关键问题。 例如,使用BAKE训练的ResNet-50在ImageNet上的top-1分类准确率显著提升1.2%,而相比基线模型训练所增加的计算开销仅为3.7%。 下图汇报了在ImageNet上的top-1分类准确率 ? Re-labeling imagenet: from single to multi-labels, from global to localized labels.

    57310

    语音领域的「ImageNet时刻」为何迟迟不来?

    本文希望回答以下两个问题: 什么是所谓的「ImageNet 时刻」(ImageNet moment),以及它为什么重要? 为什么语音领域还未实现「ImageNet 时刻」,学界和业界应为此负哪些责任? 什么是「ImageNet 时刻」? 关系型数据库是一个新的基础支持层,它改变了计算的功能。在 20 世纪 70 年代末关系型数据库出现之前,如果你想让数据库向你展示「所有购买该产品并居住在该城市的顾客」,通常需要一个定制的工程项目。 数据库不是用结构来构建的,否则任何任意的交叉引用查询都是一件容易的、常规的事情。而当时如果你想问一个问题,就必须有人来构建它。数据库只是记录保存系统,关系型数据库则把它们变成了商业智能系统。 这里一个重要的相似之处是,尽管关系型数据库有规模经济效应,但也有有限网络或「赢家通吃」效应。如果公司 B 和 A 从同一个供应商处购买相同的数据库软件,那么公司 A 使用的数据库不会变得更好。

    42330

    全球最大的图像识别数据库ImageNet不行了?谷歌DeepMind新方法提升精度

    新智元原创 编辑:元子 【新智元导读】来自苏黎世谷歌大脑和DeepMind London的研究人员认为,世界上最受欢迎的图像数据库之一ImageNet需要改造。 此后,全世界最大的图像识别数据集「ImageNet」诞生。 ImageNet的出现,伴随着一个非常宏大的野心。完整版ImageNet拥有超过1400多万幅图片,涉及2万多个类别标注,超百万边界标注。 近十年来,ImageNet一直是人工感知研究的核心测试平台,它的规模和难度凸显了机器学习领域的里程碑式成就。 但Google和DeepMind的科学家却认为,已有的ImageNet有些落伍了。 他们发现,原始的ImageNet标签不再是新标注的最佳预测者,已经被最近的高绩效模型系统性地超越了。 ImageNet标签出了哪些问题? 新方法如何改进ImageNet的缺陷 知道了症结所在,接下来就对症下药了。

    81530

    关注

    腾讯云开发者公众号
    10元无门槛代金券
    洞察腾讯核心技术
    剖析业界实践案例
    腾讯云开发者公众号二维码

    相关产品

    • 云数据库 MySQL

      云数据库 MySQL

      腾讯云数据库MySQL是一种高性能、高可靠、高安全、可灵活伸缩的数据库托管服务,其不仅经济实惠,而且提供备份回档、监控、快速扩容、数据传输等数据库运维全套解决方案,为您简化 IT 运维工作,让您能更加专注于业务发展。

    相关资讯

    热门标签

    活动推荐

      运营活动

      活动名称
      广告关闭

      扫码关注腾讯云开发者

      领取腾讯云代金券