谷歌开启 Naturalist 2018 挑战赛,大型物种分类技术有望突破

雷锋网 AI 研习社按:计算机视觉技术从 70 年代到现在,40 多年时间得到迅速发展,许多计算机视觉的应用出现在了生产生活领域。尤其是到了 2012 年,基于深度学习的图像识别技术出现,极大地提高了计算机视觉的识别精确度,在一些特定场景下,机器的识别错误率已经远低于人眼识别的错误率。与此同时,研究员也发现在真实世界中,那些细粒度,实例级级别的物体识别还存在很大的挑战!

为了能使这一领域得到快速突破,谷歌向全球 CV 领域的开发者们发送了 iNaturalist 2018 挑战赛的邀请函。iNaturalist 2018 挑战赛是 iNaturalist 和 Visipedia 合作举办的大型物种分类竞赛。这个挑战赛仅仅是 CVPR 2018 FGVC5 研讨会上的众多挑战之一。

以下是雷锋网对 iNaturalist 2018 挑战赛介绍的编译。

随着深度学习近些年的快速发展,机器视觉识别能力也在大大提高。目前已经可将计算机视觉技术应用于自动驾驶、行人检测、虚拟现实、表情识别等任务。然而,计算机视觉仍然面临着细粒度和实例级别领域的挑战。本月早些时候,我们发布了识别个别地标的实例级地标识别挑战。这个挑战中,我们专注于细粒度的视觉识别,即区分动植物物种,汽车和摩托车模型,建筑风格等。对于计算机来说,鉴别细粒度类别非常具有挑战性,因为许多类别的训练样本相对较少,存在的样本通常缺乏权威的训练标签,并且在照明,视角和物体遮挡方面都有很大的易变性。

为了能战胜这些困难和障碍,我们很高兴宣布 2018 年 iNaturalist 挑战赛(iNat-2018)正式启动报名。这是一项与 iNaturalist 和 Visipedia(简称 Visual Encyclopedia)合作举办的物种分类竞赛,是加州理工学院(Caltech)和康奈尔纽约校区(Cornell Tech)被评为 Google 重点研究奖的一个项目。第五届国际细粒度视觉分类研讨会(FGVC5)将在 CVPR 2018 上举办,在第一届 iNaturalist 挑战基础之上,iNat-2017,iNat-2018 跨越 8000 多种植物,动物和真菌类别,拥有共超过 45 万个训练图像样本。我们邀请参与者在 Kaggle 上参加比赛,最终的实验结果提交日期截止到今年的 6 月初。训练数据,注释和预训练模型链接都可以在我们的 GitHub 中找到。

  • GitHub地址:https://github.com/visipedia/inat_comp
  • Kaggle报名地址:https://www.kaggle.com/c/inaturalist-2018

iNaturalist 数据集中的一些照片:

您可能会注意到左边的照片中有一只乌龟,但是你是否也知道这是一个彩龟属(Trachemys scripta),俗名「滑龟」?如果你知道后者,你就拥有细粒度或从属类别的知识。

与其他图像分类数据集(如 ImageNet)相反,iNaturalist 挑战中的数据集呈现长尾分布,许多种类的图像相对较少。让机器学习模型能够处理长尾类别很重要,因为自然世界严重不平衡 - 有些物种比其他物种更丰富且更容易拍摄。iNaturalist 挑战赛将促进机器学习模型的进步,因为 iNat-2018 的训练分布比 iNat-2017 更长。

与 iNat-2018 一起,FGVC5 还将举办 iMaterialist 2018 挑战赛(包括家具分类挑战和产品图像的时尚属性挑战)以及一系列代表规模较小但仍然重要的挑战——「FGVCx」挑战,例如,以食物和现代艺术为内容的识别挑战。

FGVC5 将在 CVPR 2018 的主会场上展示,从而确保为表现最佳的团队提供大量曝光。该项目将推动现实世界中的细粒度类别,严重的类别不平衡和大量的类别图像自动分类技术更进一步。我们诚挚地邀请您参加这些比赛,并帮助推动这一领域的发展!

致谢

感谢 iNaturalist,Visipedia 和 FGVC5 的同事和朋友们一起努力推进这一重要领域的发展。 还要感谢 Google 的 Hartwig Adam,Weijun Wang,Nathan Frey,Andrew Howard,Alessandro Fin,Yuning Chai,Xiao Zhang,Jack Sim,Yuan Li,Grant Van Horn,Yin Cui,Chen Sun,Yanan Qian,Grace Vesom, Tanya Birch,Wendy Kan 和 Maggie Demkin。

via Google Research Blog

原文发布于微信公众号 - AI研习社(okweiwu)

原文发表时间:2018-03-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏深度学习自然语言处理

3招打破机器学习工程师的边界

对,就是数学。掌握了数学这个机器学习的底层基础,不仅可以加深对算法的理解,还能在模型优化阶段更加游刃有余。

973
来自专栏AI科技评论

学界 | 关于模型可解释性的深入思考:从哪里来,到哪里去?

「学习出一个通用智能行动者的潜力和局限性,算法公平方面细微的以及可以被真正规范化的挑战,以及现在的热门话题:能向人类解释、能被人类理解对模型来说意味着什么?」

1023
来自专栏人工智能头条

最强大脑第二场战平听音神童!百度大脑小度声纹识别技术算法解析

2026
来自专栏CreateAMind

浅析 Hinton 最近提出的 Capsule 计划

最近一次更新 17-09-22 15:00 (按中国时间计)。修复了一些笔误,加入了更多关于无监督学习的介绍内容,使思路更完整;以及一两句关于 Capsule ...

952
来自专栏目标检测和深度学习

谷歌开启 Naturalist 2018 挑战赛,大型物种分类技术有望突破

雷锋网 AI 研习社按:计算机视觉技术从 70 年代到现在,40 多年时间得到迅速发展,许多计算机视觉的应用出现在了生产生活领域。尤其是到了 2012 年,基于...

39911
来自专栏机器之心

人物 | Ian Goodfellow亲述GAN简史:人工智能不能理解它无法创造的东西

选自Wired 作者:Cade Metz 机器之心编译 参与:黄小天、蒋思源 著名物理学家、加州理工学院教授以及畅销书作者理查德·费曼( Richard Fey...

37811
来自专栏目标检测和深度学习

谷歌开启 Naturalist 2018 挑战赛,大型物种分类技术有望突破

雷锋网 AI 研习社按:计算机视觉技术从 70 年代到现在,40 多年时间得到迅速发展,许多计算机视觉的应用出现在了生产生活领域。尤其是到了 2012 年,基于...

3475
来自专栏大数据文摘

理解深度学习的局限性

3178
来自专栏大数据文摘

深度 | 深度学习并不是AI的未来

1804
来自专栏AI科技大本营的专栏

AI是万能的吗?当前AI仍面临的难题是什么?

【导读】谈到人工智能(特别是计算机视觉领域),大家关注的都是这一领域不断取得的进步,然而人工智能到底发展到什么程度了?AI 已经成为万能的了吗?Heuritec...

1132

扫码关注云+社区

领取腾讯云代金券