【戴嘉乐 IPFS】基于IPFS和GeoHash构建具有地理位置价值服务的DDApp(理论篇)

作者简介:戴嘉乐( Mr.Maple ) | 前百度高级研发工程师 | IPFS应用实践者&布道师| 个人网站:https://www.daijiale.cn 联系方式:微信号:daijiale6239。

一、概述

1.1 项目意义

打造地理位置信息与区块链的关系对象模型,建立一套 人->位置->真实世界->传递信任->价值转移->位置->人 的生态模型,实现用区块链来索引真实世界的愿景。

通过GeoHash算法可以大幅度提高在庞大位置数据中的检索效率,同时为应用提供便捷的缓存机制。

IPFS&Filecoin技术则可以保证在一个可信的区块链网络中去大规模传递与海量位置信息相关联的海量文件、数据集合,并保证传递过程中数据的产权价值。

1.2 名词解释

  • DDApp DDApp ( Data Decentered Application ):是一个数据去中心化应用的概念,介于传统应用和去中心化应用之间,解决了DApp不能依赖中心化的API的问题,又保证部分需要去中心化场景下的数据,在与应用交互之外,还可以独立分布部署、P2P传输。
  • IPFS IPFS全称InterPlanetary File System,中文名:星际文件系统,是一个旨在创建持久且分布式存储和共享文件的网络传输协议。它是一种内容可寻址的对等超媒体分发协议可以让网络更快、更安全、更开放。它是一个面向全球的、是一个点对点的分布式版本文件系统,试图将所有具有相同文件系统的计算设备连接在一起。
  • GeoHash Geohash是由Gustavo Niemeyer发明的公共域地理编码系统,它将一个地理位置编码成一串字母和数字。它是一种层次化的空间数据结构,将空间细分为网格形状的桶,是一种被称为z -阶空间填充曲线的应用,下图中就是GeoHash算法中常用的Peano曲线,一种四叉树线性编码方式。
GeoHash数据将具有如下3个特点:
  • 1 GeoHash将二维的经纬度转换成字符串,比如下图展示了北京9个区域的GeoHash字符串,分别是WX4ER,WX4G2、WX4G3等等,每一个字符串代表了某一矩形区域。也就是说,这个矩形区域内所有的点(经纬度坐标)都共享相同的GeoHash字符串,这样既可以保护隐私(只表示大概区域位置而不是具体的点),又比较容易做缓存,比如左上角这个区域内的用户不断发送位置信息请求餐馆数据,由于这些用户的GeoHash字符串都是WX4ER,所以可以把WX4ER当作key,把该区域的餐馆信息当作value来进行缓存,而如果不使用GeoHash的话,由于区域内的用户传来的经纬度是各不相同的,很难做缓存。
  • 2)字符串越长,表示的范围越精确。如图所示,5位的编码能表示10平方千米范围的矩形区域,而6位编码能表示更精细的区域(约0.34平方千米)。
  • 3)字符串相似的表示距离相近(特殊情况后文阐述),这样可以利用字符串的前缀匹配来查询附近的POI信息。如下两个图所示,一个在城区,一个在郊区,城区的GeoHash字符串之间比较相似,郊区的字符串之间也比较相似,而城区和郊区的GeoHash字符串相似程度要低些。

例如,坐标对(116.414597,39.955441),位于北京安定门附近,GeoHash后形成的值为WX4G2。

我们已经知道现有的GeoHash算法使用的是Peano空间填充曲线,这种曲线会产生突变,造成了编码虽然相似但距离可能相差很大的问题,因此在基于个人位置查询附近Poi信息时,首先筛选GeoHash编码相似的POI点,然后进行实际距离计算,来规避算法突变所造成的误差。

当然Geohash只是空间索引的一种方式,特别适合POI点数据,而对线Link、面数据采用R树索引更有优势。

二、系统设计

2.1 架构设计

2.2 对象模型设计

Geo Object Model

属性

类型

备注

geo_id

INT

唯一标识

geo_address

STRING

地址名

geo_lng

FLOAT

位置经度

geo_lat

FLOAT

位置纬度

geo_hash

STRING

位置生成的GeoHash值

ipfs_hash

STRING

所存数据的IpfsHash值

addGeoInfoByParam()

FUNCTION

添加位置信息方法

getGeoInfoByParam()

FUNCTION

获取位置信息方法

mixGeoHashByParam()

FUNCTION

GeoHash生成算法

addIpfsDataByParam()

FUNCTION

添加Ipfs数据方法

mixIpfsHashByParam()

FUNCTION

关联Ipfs数据方法

2.3 数据库对象映射

2.3.1 数据库选型

这是网友以 100万 poi 数据查询范围 3km 内的点(最多取100条)的性能测试统计:

以下是各数据库的对比情况:

数据库

耗时

区域查询

多条件支持

redis(3.2.8)

1-10ms

支持

不支持

mongo(3.4.4)

10-50ms

支持

支持

postgreSQL(9.6.2)

3-8ms

支持

支持

mysql(5.7.18)

8-15ms

支持

支持

综合比较后,个人选择了MySql 来进行后文Demo的支撑数据库:

  • MySql在5.7.4以前版本的童鞋可以通过myISAM引擎提供的Geom内置函数来实现
  • MySql在5.7.4以后版本的童鞋可以舒服的继续使用InnoDB引擎,官方对其添加了对空间索引的支持,感兴趣的朋友也可以对比下性能。

PS:

  1. 数据库没有哪个一定好,只要适合场景即可。
  2. 在研究IPFS存储性能的过程中,由于测试网络节点问题,有很严重的数据传输瓶颈,且不稳定,短期内,很难将需要频繁更新以及百万级别数据的检索逻辑事务放在IPFS这一层中来做。
  3. 在IPFS节点网络性能目前并不乐观的情况下,尝试去寻找能实现具有商业级别能力IPFS应用的过渡方案。

2.3.2 对象模型映射成表结构

-- 表的结构 `geo_object`--CREATE TABLE `geo_object` (`geo_id` bigint(20) NOT NULL  AUTO_INCREMENT,`geo_loc` point NOT NULL,`geo_address` varchar(255) NOT NULL,`ipfs_hash` varchar(255) NOT NULL) ENGINE=MyISAM DEFAULT CHARSET=utf8 COMMENT='geo对象模型';-- Indexes for table `geo_object`ALTER TABLE `geo_object`ADD PRIMARY KEY (`geo_id`),ADD SPATIAL KEY `geo_loc` (`geo_loc`);

三、Demo

有了以上的概念和设计模型,接下来,给大家看一个简单的Demo实现:

3.1 通过IPFS上传位置数据

IPFS单节点的部署就不详细介绍了,这边可以参考文章 利用IPFS构建自己的去中心化分布式Wiki系统 的实现过程.

官方提供了Curl的API方式,我们可以通过addIpfsDataByParam()方法实现RPC调用。

curl -F file=@myGeoFile "http://localhost:5001/api/v0/add?recursive=false&quiet=false&hash=sha2-256"

PS:这边Demo采用的是本地单节点的数据上传,为了保障服务的稳定性,建议使用ipfs-cluster的节点集群解决方案,具体方案可以参考IPFS资深大牛(飞向未来)的文章《IPFS家族二》。

3.2 获取IPFS网络返回值,并关联数据

响应体为 ‘multipart/form-data’格式,成功,会返回如下Body数据:

{"Name":"myGeoFile""Hash":"QmYftndCvcEiuSZRX7njywX2AGSeHY21Sa7VryCq1mK1Ew""Bytes":"2428803""Size": ""}

拿到Hash值后,再通过mixIpfsDataByParam()方法关联到我们的Geo位置数据上。

3.3 Geo模型预演

选取第一个基准位置点(模拟用户所在定位):

维度lat:39.989049
经度lng:116.313658
INSERT INTO `geo_object`(`geo_loc`, `geo_address`, `ipfs_hash`) VALUES (GeomFromText('POINT(39.989049 116.313658)'),'3W咖啡馆','QmYftndCvcEiuSZRX7njywX2A21Sa7VryCq1mK1Ew21')

选取第二个Geo位置点(模拟近点):

维度lat:39.988878
经度lng:116.313352
INSERT INTO `geo_object`(`geo_loc`, `geo_address`, `ipfs_hash`) VALUES (GeomFromText('POINT(39.988878 116.313352)'),'中关村创业大街南广场','WCJIEFSCvcE231233HY21Sa7Vr1Cq1mK1Ew')

选取第三个Geo位置点(模拟远点):

维度lat:40.005466
经度lng:116.315938
INSERT INTO `geo_object`(`geo_loc`, `geo_address`, `ipfs_hash`) VALUES (GeomFromText('POINT(40.005466 116.315938)'),'圆明园','KBYftndCvcEiuSZRX7njyw1332Y21Sa723mKASDED')

球面距离围栏算法

假设球面围栏对角点坐标A1(x1,y1),B1(x2,y2):

    x1 = lat + distance / ( 111.1 / COS(RADIANS(lng))),  
    y1 = lng + distance / 111.1  
    x1 = lat - distance / ( 111.1 / COS(RADIANS(lng))),  
    y1 = lng - distance / 111.1  
    //构建一阶空间填充曲线
    LineString(A1,B1)  

PS:

  1. 赤道上经度的每个度大约相当于111.1km,经度的每个度的距离从0km到111.1km;
  2. RADIANS()为弧度计算内置函数;
  3. LineString() 为构建一阶空间填充曲线内置函数。

3.4 获取地理区域内的IPFS数据服务

获取1km以内的IPFS数据:

SELECT  *  FROM    geo_object  WHERE   MBRContains  
(  
LineString  
(  
Point  
(  39.989049 + 1 / ( 111.1 / COS(RADIANS(116.313658))),  116.313658 + 1 / 111.1  ),  
Point  
(  39.989049 - 1 / ( 111.1 / COS(RADIANS(116.313658))),  116.313658 - 1 / 111.1  )   
),  
geo_loc  
)  

如下图所示,我们拿到了距离3W咖啡馆1Km以内中关村大街南广场附近相关联的IPFS数据:

获取10km以内的IPFS数据:

SELECT  *  FROM    geo_object  WHERE   MBRContains  
(  
LineString  
(  
Point  
(  39.989049 + 10 / ( 111.1 / COS(RADIANS(116.313658))),  116.313658 + 10 / 111.1  ),  
Point  
(  39.989049 - 10 / ( 111.1 / COS(RADIANS(116.313658))),  116.313658 - 10 / 111.1  )   
),  
geo_loc  
)  

如下图所示,我们拿到了距离3W咖啡馆10Km以内中关村大街南广场附近相关联的IPFS数据:

PS:

关于Demo这块,后续会另外新开一篇实战文章【应用】基于IPFS和GeoHash构建具有地理位置价值服务的DDApp(实战篇)来做专门介绍,让大家也能自己动手编写一个功能相对完善(可视化界面)DDApp 。

四、应用场景

  • Vevue:一个在选定的区域内街拍可获得代币奖励的DApp,鼓励用户分享原创内容,激励场景化广告。
  • 地理位置签到:只有到达指定位置坐标点,才可取得可信签到密码凭证,进行核对,确认地理位置信任问题。(滴滴加班公司打车报销场景)
  • 到店红包(糖果):,吸引用户到达指定实体店铺位置,通过位置可信核对,分发代币糖果凭证/快照,激励用户到店消费,体验现场活动。
  • 车主停车位产权保护:经过购买的专用停车位实为车主用户的资产,应受到产权保护,且车位的转移、交易需要在一套依赖地理位置的信任体系中进行。
  • 景区、名胜古迹、历史遗迹信息保护:沧海桑田,地转星移,也许有一天名胜古迹不复存在,但它们的电子信息(地理位置、图像、所属国家、历史文化、视频、VR全景等信息)将永远被保存在区块链上,真实且不被篡改,源远流长。
  • 与位置AR游戏结合:之前很火的Pokémon Go如果再加上Filecoin的奖励机制会是一种什么样的场面?也可以参考MANA区块链项目的价值。
  • 物联网结合: 充电桩,ETC这些具有支付属性、位置属性的智能设备创新等等。

五、开源计划

初衷:期望能让大家看到区块链的实际应用场景,为区块链和传统技术的结合做更多预演、布道、分享,不去听币圈熙熙攘攘的声音,用技术创造真实的价值,也期待更多和我一样想法的朋友加入,带一些正能量给这个圈子。

IPFS-Geo

意义:是一个具有地理位置特征的IPFS智能对象,其元数据具备Geo相关特性,支持千万级别空间数据的快速索引,对象内还提供LBS相关功能的接口服务。


相关文章和视频推荐

【戴嘉乐】利用IPFS构建自己的去中心化分布式Wiki系统

圆方圆学院汇集大批区块链名师,打造精品的区块链技术课程。 在各大平台都长期有优质免费公开课,欢迎报名收看。

公开课地址:https://ke.qq.com/course/345101?flowToken=1007371

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏LhWorld哥陪你聊算法

【自然语言处理篇】--Chatterbot聊天机器人

ChatterBot是一个基于机器学习的聊天机器人引擎,构建在python上,主要特点是可以自可以从已有的对话中进行学(jiyi)习(pipei)。

97750
来自专栏工科狗和生物喵

【我的漫漫跨考路】数据结构之堆栈的线性实现

正文之前 ? 昨天晚上阶段性的完成了一部分数学的复习(一元积分学终于搞定了,后面的貌似没这么难了),所以今天打算撸一撸代码,结合前几天写的链表实现线性存储,今天...

29660
来自专栏张俊红

你们要的代码来了

40880
来自专栏社区的朋友们

【小程序码设计篇】菊花绽放

2017 年四月,微信正式推出了小程序码。小程序码设计深度解析,为何长得像菊花,进行二次美化应该注意什么,本文为你揭晓!

5.9K10
来自专栏Crossin的编程教室

【每周一坑】图像的指纹:数字水印 + 【解答】鸡兔同笼

曾经有过这样的新闻:某公司的员工将内网论坛上的言论截屏发布到互联网上,引发了热议。于是公司通过截图定位到了员工的身份,将其开除。

22620
来自专栏Android群英传

程序员英语口语等级考试

17540
来自专栏工科狗和生物喵

【闲来无事,py写game】用pygame写一个冒泡排序的实体图

正文之前 不好意思忘了配图了!!时间太紧迫了,图书馆就要关门了!! ? 正文 import pygame,sys import time from pygame...

44190
来自专栏数据结构与算法

dsu on tree入门

说起来我跟这个算法好像还有很深的渊源呢qwq。当时在学业水平考试的考场上,题目都做完了不会做,于是开始xjb出题。突然我想到这么一个题

26940
来自专栏牛客网

京东Java岗面经

16800
来自专栏PPV课数据科学社区

【完整案例】如何用R实现空间数据可视化

image.png 流行病学的数据讲究“三间分布”,即人群分布、时间分布和空间分布。其中的“空间分布”最好是在地图上展示,才比较清楚。R软件集统计分析与高级...

1.3K70

扫码关注云+社区

领取腾讯云代金券