怎样用Python实现地理编码

怎样用Python实现地理编码

专栏作者:时空Drei

时空Drei,德国德累斯顿工业大学在读博士生,个人的擅长领域为:利用Python进行空间数据(遥感GIS)处理分析,掌握常用的机器学习工具。个人公众号:stdrei,分享时空数据分析与德国留学笔记。

引言

今天看到一篇阿里云的文章"天下武功,唯快不破",以物流行业为例,分析了PostgreSQL 与 Greenplum 在地理位置信息处理,最佳路径算法,机器学习等方面的物流行业应用方法。其中提到了地址转换成坐标的问题,更专业些的名词应该是“地理编码”,即知道一个地址,如北京市海淀区上地十街10号,怎么样可以获取到对应的经纬度位置信息(40,116),或者反过来。

地理编码概念

很多地图相关的厂商都提供了相关的API,我们可以直接利用这些API得到这些信息。比如百度的Geocoding API

Geocoding API是一类接口,用于提供从地址到经纬度坐标或者从经纬度坐标到地址的转换服务,用户可以使用C# 、C++、Java等开发语言发送请求且接收JSON、XML的返回数据。Geocoding API包括地址解析和逆地址解析功能:

借用ESRI文档中更直观的一张图

地理编码: 即地址解析,由详细到街道的结构化地址得到百度经纬度信息,例如:“北京市海淀区中关村南大街27号”地址解析的结果是lng:116.31985,lat:39.959836 同时,地理编码也支持名胜古迹、标志性建筑名称直接解析返回百度经纬度,例如:“百度大厦”地址解析的结果是lng:116.30815,lat:40.056885 逆地理编码: 即逆地址解析,由百度经纬度信息得到结构化地址信息,例如:“lat:31.325152,lng:120.558957”逆地址解析的结果是“江苏省苏州市虎丘区塔园路318号”。

不过,需要说明的一点是,若想使用百度的这套API的前提是,有百度账号并申请相应的Key。其实,除了百度之外,谷歌、ESRI、微软的Bing等都有类似的地理编码服务。不过这些服务大多没有专门针对Python的库并且彼此之间的Json结构也不一致。于是乎专治不服的Python大神做了一个专门的地理编码工具geocoder,将这些不同厂商的服务整合统一起来。

地理编码工具geocoder

首先看一下它都支持哪些公司的地理编码服务:

Provider

Optimal

Usage Policy

ArcGIS

World

Baidu

China

API key

Bing

World

API key

CanadaPost

Canada

API key

FreeGeoIP

World

Geocoder.ca

CA & US

Rate Limit

GeocodeFarm

World

Policy

GeoNames

World

Username

GeoOttawa

Ottawa

Google

World

Rate Limit, Policy

HERE

World

API key

IPInfo

World

Mapbox

World

API key

MapQuest

World

API key

Mapzen

World

API key

MaxMind

World

OpenCage

World

API key

OpenStreetMap

World

Policy

Tamu

US

API key

TomTom

World

API key

What3Words

World

API key

Yahoo

World

Yandex

Russia

TGOS

Taiwan

安装
pip install geocoder
地理编码
import geocoderg = geocoder.google("1403 Washington Ave, New Orleans, LA 70130")g = geocoder.arcgis(u"北京市海淀区上地十街10号")g.latlng

输出为

[29.9287839, -90.08421849999999]

也可以查看完整的geojson

g.geojson

输出为

{'bbox': [-90.0855674802915,  29.9274349197085,  -90.0828695197085,  29.9301328802915], 'geometry': {'coordinates': [-90.08421849999999, 29.9287839],  'type': 'Point'}, 'properties': {'accuracy': u'ROOFTOP',  'address': u'1403 Washington Ave, New Orleans, LA 70130, USA',  'bbox': [-90.0855674802915,   29.9274349197085,   -90.0828695197085,   29.9301328802915],  'city': u'New Orleans',  'confidence': 9,  'country': u'US',  'county': u'Orleans Parish',  'encoding': 'utf-8',  'housenumber': u'1403',  'lat': 29.9287839,  'lng': -90.08421849999999,  'location': '1403 Washington Ave, New Orleans, LA 70130',  'neighborhood': u'Garden District',  'ok': True,  'place': u'ChIJGyFHWc2lIIYRYSoneaXAUiw',  'postal': u'70130',  'provider': 'google',  'quality': u'street_address',  'state': u'LA',  'status': 'OK',  'status_code': 200,  'street': u'Washington Ave'}, 'type': 'Feature'}

直接用Google尝试查询中文地址时失败

g = geocoder.google(u"北京市海淀区上地十街10号")g.ok

输出为

False

用百度应该没问题,不过我没有申请相应的key。切换到arcgis,能够成功编码

g = geocoder.arcgis(u"北京市海淀区上地十街10号")g.latlng

输出为

[40.050934, 116.30079]
逆地理编码
g = geocoder.google([29.9287839, -90.08421849999999], method='reverse')print g.addressprint g.cityprint g.stateprint g.country

输出为

1403 Washington Ave, New Orleans, LA 70115, USANew OrleansLAUS

换成中国的地址

g = geocoder.google([40.050934, 116.30079], method='reverse')print g.addressprint g.cityprint g.stateprint g.country

输出为

Bai Du Da Sha, Haidian Qu, Beijing Shi, China, 100193BeijingBeijing ShiCN

用arcgis的服务试试

g = geocoder.arcgis([40.050934, 116.30079], method='reverse')print g.addressprint g.cityprint g.stateprint g.country

输出为

None北京市北京市CHN

Google转换成的是英文,但地址比较全。arcgis虽然是中文,但是详细的地址居然输出为了None,这有个X用。

其他

geocoder 的功能不止于此,它还可以查IP(包括自己的)。

g = geocoder.ip('199.7.157.0')print g.latlngprint g.cityg = geocoder.ip('me')print g.latlngprint g.city

输出为

[43.6934, -79.4857]Toronto[51.05, 13.75]Dresden

查询一个城市的空间包围盒

g = geocoder.arcgis(u"山东")g.bbox

输出为

{'northeast': [38.976997, 121.976998], 'southwest': [33.022997, 116.022998]}

小结

空间信息既可以利用行政区划、自然地理区域等文本信息描述,也可以用坐标系统、数字(邮编等)来标识。利用地理编码技术,可以将空间信息的地理定位要素与相应的文本信息关联起来。本文主要介绍了geocoder地理编码这一小工具,可以方便快捷地利用地图等相关厂商提供的地理编码服务,将文字描述的位置转换成地图上的经纬度,或者通过地图上的某个位置坐标获得相应的位置信息文字描述。

原文发布于微信公众号 - Python中文社区(python-china)

原文发表时间:2016-11-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏云时之间

机器学习资料合计(二)

2017年最后一天,继续把手头的资料分享给大家,希望大家2018都有一个美好的前程! 如果不能使用的,请在评论区告知(ps:最近在刷李飞飞CS231n2017,...

39360
来自专栏linux、Python学习

玩这么久 Python ,这些好玩又实用的库一定不能错过!

21300
来自专栏北京马哥教育

玩这么久 Python ,这些好玩又实用的库一定不能错过!

图片处理 pip install pillow from PIL import Image import numpy as np a = np.array...

48390
来自专栏简书专栏

Python数据持久化-csv、excel篇

2018年7月4日笔记 学习目标: 1.会使用Python第三方模块操作CSV文件 2.会使用Python第三方模块操作EXCEL文件

18920
来自专栏企鹅号快讯

计算机高频知识点详解

重磅!福建农信社招863人,大专/往届均可报考! 福建农信社报考须知:我是笔试类还是免笔试类? 紧急通知 | 农信社笔试内容大变动 01 计算机中的信息表示 1...

19250
来自专栏吉浦迅科技

【阿星的学习笔记(1)】如何在windows安裝Theano +Keras +Tensorflow並使用GPU加速訓練神經網路

今天开始,Lady向各位介绍一个朋友阿星(Ashing)以及他的机器学习读书笔记! ? 阿星也是我们手撕深度学习算法微信群的热心群友!接下来,Lady我也会陆续...

47660
来自专栏雪胖纸的玩蛇日常

Vue+Django2.0 REST framework打造前后端分离的生鲜电商项目(三)设计数据库以及导入原始数据

51350
来自专栏木宛城主

SharePoint 2013 Designer工作流——Parallel Block的应用

参考目录 安装和配置SharePoint 2013 Workflow SharePoint 2013 实现多级审批工作流 在自定义Workflow...

277100
来自专栏NetCore

无尽的忙碌换来幸福的日子

人总是忙碌的,从小要读书,长大了工作,结婚了,有孩子了,一辈子也可能等到孩子成家了才能稍微休息一下下吧,不过有时候想想,忙碌点好,一辈子也就那么长,等闭了后还能...

230100
来自专栏喵了个咪的博客空间

[喵咪软件推荐(2)]全球服务器测速工具speedtest-cli

[喵咪软件推荐(2)]全球服务器测速工具speedtest-cli w-blog博客 ? 前言 在上一篇章中给大家介绍了全球国家信息国旗区号等一些全球国家新的库...

1K70

扫码关注云+社区

领取腾讯云代金券