全球最大地标识别数据集问世:包含200万张图片和3万处地标

今天,谷歌推出了目前世界上最大的人造和自然地标识别数据集Google-Landmarks。数据集中包含200万张图片,描述了3万处全球独特地标,量级是普通的数据集的30倍。

数据集中地标的位置分布

两场竞赛

和这个数据集一同推出的,还有两场相关的数据竞赛:地标识别(Landmark Recognition)挑战和地标检索(Landmark Retrieval)挑战。谷歌在博客中表示,这将成为Kaggle竞赛的赛题,也设有相应的奖金。

这场竞赛的后续消息,还将出现在今年6月份的CVPR 2018会议的Landmarks workshop中。

谷歌路标识别挑战赛(内含数据集下载): https://www.kaggle.com/c/landmark-recognition-challenge

谷歌路标检索挑战赛(内含数据集下载): https://www.kaggle.com/c/landmark-retrieval-challenge

地标识别和其他问题比较大的区别在于,即使在一个大型标注过的数据集,对一个不太知名的地标也可能训练得不够。

此外,由于地标建筑不会移动并且内部的变化非常小,因此,图像的拍摄条件,如遮挡、不同视角、天气和光线等因素决定了地标图像的变化。但其他的普通数据集(比如萌犬数据集),往往变化多样。

这两个Kaggle挑战提供了标注数据,帮助研究人员解决这些问题。路别识别竞赛是在具有挑战性的测试图像数据集中,让参赛者构建识别正确地标的模型。而在路标检索挑战赛中,参与者需要检索包含相同地标的图像。

数据集中部分地标建筑

开源DELF

讲到这里还没完。为了刺激这个领域的研究,谷歌研究人员还开源了专注本地特征的描述符Deep Local Features(DELF)。关于DELF的论文Large-Scale Image Retrieval with Attentive Deep Local Features首次亮相于2016年,一个月前又进行了一次修改。

论文地址:

https://arxiv.org/abs/1612.06321

DELF开源代码和数据集地址:

https://github.com/tensorflow/models/tree/master/research/delf

最后,附谷歌博客介绍地址:

https://research.googleblog.com/2018/03/google-landmarks-new-dataset-and.html

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2018-03-02

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏目标检测和深度学习

挑战赛 | ECCV 2018 Person in Contex (PIC) 图像关系分割挑战赛

14920
来自专栏企鹅号快讯

攻击生物识别验证,可以分哪几步?

刷脸乘车、刷脸支付、刷脸解锁手机......从钱包到手机,这一次干脆彻底解放。生活中似乎不会再有忘带现金、忘记密码的尴尬,因为没有人出门会忘记”带脸“。现实真魔...

25270
来自专栏CreateAMind

DeepMind声称通过AI为Google全球机房节能15%的新闻有多少可信度?

在DeepMind的官网blog里[3],提到了Google使用DeepMind提供的AI技术,在机房的能耗上获得了大幅的削减,对应于PUE(Power Usa...

22030
来自专栏量子位

语音合成论文与韩国小哥“撞车”后续:英伟达“赶紧”把代码开源了

在得知自己的论文与英伟达的论文“撞车”之后,韩国小哥赶紧在arXiv上提交了论文。并在GitHub上放出了自己研究的源代码。

10730
来自专栏大数据文摘

【译】统计学教会我们的10件事

21190
来自专栏机器人网

工业机器人的基本组成及技术参数

工业机器人的基本组成   工业机器人由3大部分6个子系统组成。 3大部分是机械部分、传感部分和控制部分。 6个子系统是驱动系统、机械结构系统、感受系统、机器人-...

45980
来自专栏云加头条

云+社区分享——腾讯云OCR文字识别

2018年3月27日腾讯云云+社区联合腾讯云智能图像团队共同在客户群举办了腾讯云OCR文字识别——智能图像分享活动,活动举办期间用户耐心听分享嘉宾的介绍,并提出...

4.6K400
来自专栏AI科技大本营的专栏

实战干货 | 这位成功转型机器学习的老炮,想把他多年的经验分享给你

这个年代,不怕你是大牛,就怕大牛还会写文章。 作为AI100智库专家,智亮总是能在口若悬河中,让人深入浅出地学到一堆堆干货,掏心窝子的干货。 多年的实战经验...

415100
来自专栏PPV课数据科学社区

大数据告诉你,如何写论文能上核心期刊

评职称要发论文,可是为什么论文投出去,都石沉大海、毫无音讯了呢?隔壁的王教授、张老师,为什么写一篇论文,核心期刊就发一篇,他有什么秘诀? 各位老师、同学,是不...

39230
来自专栏新智元

论文 | 预测 API 从谷歌、亚马逊等大平台盗取机器学习算法

2016年10月18日, 世界人工智能大会技术分论坛,特设“新智元智库院长圆桌会议”,重量级研究院院长 7 剑下天山,汇集了中国人工智能产学研三界最豪华院长阵容...

40760

扫码关注云+社区

领取腾讯云代金券