首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

GeoSOT时空编码的海量照片组织检索方法

摘 要

经过对用户行为模式调查,照片管理主要涉及了照片的位置、时间、目录以及标签等信息。针对个人照片数据日益增多,由于其大数据量、异构性等特点,传统的管理方式已经无法适应照片的检索需求的现状,该文提出了一种基于标识的照片组织管理方式。根据时空唯一性的特点,通过GeoSOT位置码+时间码唯一标识照片,同时在数据库中存储用户关心的其他标签,并对编码建立了相应的索引。最后,对编码生成和照片检索的效率进行了实验验证,结果表明该组织方式能够高效地管理个人照片数据。

引用格式

田方杰,程承旗,濮国梁.GeoSOT时空编码的海量照片组织检索方法[J].测绘科学,2018,43(2):24-29.

正文

随着智能手机与数码相机的普及,照片的获取途径越发广泛,获取手段也越发简单,个人照片数量急剧增加。根据国外网站Mylio调查显示,在2014年人们拍照总量已经达到了8 098亿张。预计到2017年,这一数字有望攀升到1.272 1兆张,复合年均增长率达到16.2%。另外,Mylio预测表示,到2017年由智能手机拍摄的照片将占全部的照片78.8%。管理照片数据成为个人数据管理一个重要内容。照片数据管理问题本质上是大数据量、大规模、异构数据的管理问题在个人数据管理领域的反映,涉及数据存储、索引、查询、安全与隐私保护等诸多问题[1-4]。所谓异构性,源数据环境和目的数据环境结构不同,典型表现为源数据和目的数据所在的数据库管理系统(DBMS)不同。作为一种非结构化数据,照片数据不方便采用传统关系型数据库二维逻辑表来表现。如何有效地管理照片是最近几年来一个备受关注的议题。

值得关注的是,用户行为模式的差异性,使得照片数据的查询检索变得更为复杂多变。不同个体对照片的浏览检索有着显著的差异,个体性表现极其明显。文献[5]对不同用户采取了抽样调查方法,用户关心的照片属性主要有位置(location)、时间(date)、目录(content)以及标签(tag)。实际生活中也是如此,用户在浏览照片时往往根据前述属性进行筛选。例如,用户在浏览到某一比较感兴趣的照片时,他可能提出一个查询请求:查询在该照片附近的照片。而且,这种时空相关的搜索在生活中越来越流行,需求量越来越大。

信息标注是一种对非结构化数据进行管理的重要手段。其通常是采用事先定义的标识对目标数据进行关联标识,标识即元数据。在标识的理念下,照片管理产品推陈出新,各产品侧重也各不相同,包括标签的分类、贴标签方法、结果的关联性[6-8]等。其中很多产品在时空检索查询上存在很大的不足,因此空间标识概念应运而生。文献[9]中指出空间标签主要有两种形式,一种是精确的GPS标签(即经纬高),另一种是隐含的地理标签(如北京)。针对空间标签,许多新的基于语义的照片标识和检索算法应运而生,文献[10-11]提出了基于贝叶斯网络的语义获取法以及交互反馈检索法,文献[12]提出了基于支持向量机(SVM)的语义关键字提取法,文献[13]提出CSP(CrowdSense@Place)方法来联系语义上的位置和GPS位置。但这些算法中语义转换的准确率仍然是一大问题。在某种程度上,这些方式在对第二种时空标签的检索解决了部分问题,但是时空照片检索的高效性与准确性难以得到保证。

本文借鉴标签的思想,基于GeoSOT[14]编码设计一种新型的时空标识,准确地记录照片的时空信息;同时采取降维的思想,提出一种高效、准确的检索方法,以实现对海量照片在时空范围的高效组织检索。

针对非结构化的照片数据,本文提出了一种基于时空标识的组织方式,在用户行为模式的基础上,针对时空查询请求,基于GeoSOT编码唯一关联每一张照片,将用户主要关心的信息存储于数据库,同时对时空编码建立了相适应的索引,适应传统的关系型数据库管理。一方面,这种组织查询方式可以根据照片的EXIF信息自动化管理;另一方面,除了满足用户多样化的个人需求,在建立合适的索引后,实现了用户复杂的时空检索请求,提高了用户基于时空条件查找照片的效率和查询的准确率。

2018年(第43卷)第2期

往期热点文章

感谢关注、点赞、留言、转发

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180301A0A3WY00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券