前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >全球最大地标识别数据集问世:包含200万张图片和3万处地标

全球最大地标识别数据集问世:包含200万张图片和3万处地标

作者头像
量子位
发布2018-03-20 16:43:03
1.9K0
发布2018-03-20 16:43:03
举报
文章被收录于专栏:量子位量子位

今天,谷歌推出了目前世界上最大的人造和自然地标识别数据集Google-Landmarks。数据集中包含200万张图片,描述了3万处全球独特地标,量级是普通的数据集的30倍。

数据集中地标的位置分布

两场竞赛

和这个数据集一同推出的,还有两场相关的数据竞赛:地标识别(Landmark Recognition)挑战和地标检索(Landmark Retrieval)挑战。谷歌在博客中表示,这将成为Kaggle竞赛的赛题,也设有相应的奖金。

这场竞赛的后续消息,还将出现在今年6月份的CVPR 2018会议的Landmarks workshop中。

谷歌路标识别挑战赛(内含数据集下载): https://www.kaggle.com/c/landmark-recognition-challenge

谷歌路标检索挑战赛(内含数据集下载): https://www.kaggle.com/c/landmark-retrieval-challenge

地标识别和其他问题比较大的区别在于,即使在一个大型标注过的数据集,对一个不太知名的地标也可能训练得不够。

此外,由于地标建筑不会移动并且内部的变化非常小,因此,图像的拍摄条件,如遮挡、不同视角、天气和光线等因素决定了地标图像的变化。但其他的普通数据集(比如萌犬数据集),往往变化多样。

这两个Kaggle挑战提供了标注数据,帮助研究人员解决这些问题。路别识别竞赛是在具有挑战性的测试图像数据集中,让参赛者构建识别正确地标的模型。而在路标检索挑战赛中,参与者需要检索包含相同地标的图像。

数据集中部分地标建筑

开源DELF

讲到这里还没完。为了刺激这个领域的研究,谷歌研究人员还开源了专注本地特征的描述符Deep Local Features(DELF)。关于DELF的论文Large-Scale Image Retrieval with Attentive Deep Local Features首次亮相于2016年,一个月前又进行了一次修改。

论文地址:

https://arxiv.org/abs/1612.06321

DELF开源代码和数据集地址:

https://github.com/tensorflow/models/tree/master/research/delf

最后,附谷歌博客介绍地址:

https://research.googleblog.com/2018/03/google-landmarks-new-dataset-and.html

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-03-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 两场竞赛
  • 开源DELF
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档