首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

多线程请求百度接口实现地址转换经纬度

一、背景 最近,碰到了一个业务,是将数据库中所有的地址信息请求百度接口获取经纬度保存起来。有38万多个地址,想到的方案就是查出所有的地址字段加上主键字段,然后导出csv文件,读取这个文件,遍历请求百度api接口,获取经纬度信息,生成一个新的文件,作为一张表导入数据库,使用sql给地址刷一遍经纬度。前面已经写过具体怎么实现了,请查看java实现调用百度接口将大量数据库中保存的地址转换为经纬度,但是由于是单线程效率有点低,20分钟大约跑一万条吧,我需要转换37万,得15个小时左右,太慢了,就想到了可以通过多线程拿到每一条数据请求百度接口,这样速度就上去了,先剧透一下结果,多线程下地址转换经纬度40分钟5万条,大约三个多小时就可以跑完,效率提升了好几倍,这次代码在上一篇的基础上做了一些优化,现在就来看看具体怎么实现吧。

01

GeoHash索引

GeoHash索引是一种基于B树索引,又结合了格网索引的思想的使用广泛的空间索引算法。GeoHash将空间位置编码为一串字符,通过字符串的比较可以得到空间的大致范围。这种编码方法起初被用于以唯一的URL标识地图上的点实体,而点实体一般是以经纬度标识的,所以问题就转变为如何使用URL标识经纬度坐标。下面举例说明GeoHash编码的具体实现步骤。设定武汉大学的经纬度坐标是(114.360734E, 30.541093N),首先,可以通过如下算法对纬度30.54进行逼近编码: (1)对维度区间[-90,90]进行二分为[-90,0)和[0,90],称为左右区间,可以确定30.541093属于右区间[0,90],给标记为1; (2)接着将区间[0,90]进行二分为 [0,45)和[45,90],可以确定30.541093属于左区间 [0,45),给标记为0; (3)递归上述过程30.541093,如果给定的纬度属于左区间,则记录0,如果属于右区间则记录1,这样随着算法的进行会产生一个序列101010110110111,序列的长度跟给定的区间划分次数有关。 (4)同样的方法,对经度区间[-180, 180]进行编码,可以得到一个二进制序列110100010101001。 (5)合并经纬度编码,偶数位放经度编码(第一位从0开始),奇数位放纬度编码,把两串编码组合生成新串11100 11001 00011 10011 01100 10111。 (6)对合成的新的二进制串,每五位转成十进制数得到28,25,3,19,12,23,然后再进行Base32编码得到该经纬度的GeoHash编码为wt3mdr。

03

扫码

添加站长 进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

    运营活动

    活动名称
    广告关闭
    领券