前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >geopandas,用python画地图原来这么简单!

geopandas,用python画地图原来这么简单!

作者头像
Python大数据分析
发布2022-04-02 19:39:21
2.8K0
发布2022-04-02 19:39:21
举报

pandas应该是大家非常熟悉的Python第三方库,其主要用于数据整理和分析,这次来介绍pandas的一个近亲-geopandas

geopandas是用来处理地理空间数据的python第三方库,它是在pandas的基础上建立的,完美地融合了pandas的数据类型,并且提供了操作地理空间数据的高级接口,使得在python中进行GIS操作变成可能。

先看个示例,我们在python中显示世界地图

代码语言:javascript
复制
import pandas as pd
import geopandas
import matplotlib.pyplot as plt
%matplotlib inline

world = geopandas.read_file(geopandas.datasets.get_path('naturalearth_lowres'))
world.plot()
plt.show()

当然除了上面的平面效果,你还可以做出这样的:

还可以给地图着色:


下面言归正传,正式讲解geopandas是如何工作的

前面说过,geopandas沿用了pandas的数据类型,所以geopandas中也有两种数据类型:

  • GeoSeries
  • GeoDataFrame

它们继承了pandas数据结构的大部分方法。

你可以把这两个数据结构当作地理空间数据的存储器,shapefile文件的pandas呈现。

Shapefile文件用于描述几何体对象:点,折线与多边形。例如,Shapefile文件可以存储井、河流、湖泊等空间对象的几何位置。除了几何位置,shp文件也可以存储这些空间对象的属性,例如一条河流的名字,一个城市的温度等等。

稍作解释:

  • GeoSeries对应Series,只有一列,里面的每个元素都是代表地理空间图形,有可能是点、线或者面。
  • GeoDataFrame是包含GeoSeries的数据结构,它是多列的,但其中一列必然是GeoSeries列,这个GeoSeries列被称作GeoDataFrame中的几何列。
  • GeoDataFrame的其他列,可以是几何图形的名字、属性等信息,比如国家的人口、面积、GDP等等。

解析一下前面的例子中完整代码:

代码语言:javascript
复制
import pandas as pdimport geopandasimport matplotlib.pyplot as plt%matplotlib inlineworld = geopandas.read_file(geopandas.datasets.get_path('naturalearth_lowres'))world.plot()plt.show()

对于下面一行:

代码语言:javascript
复制
world = geopandas.read_file(geopandas.datasets.get_path('naturalearth_lowres'))

geopandas的read_file方法可以读取shape文件,转化为GeoSeries和GeoDataFrame数据类型。

而geopandas.datasets.get_path('naturalearth_lowres')则是从geopandas自带的数据集中获取世界地图的shapefile文件。

你也可以用read_file方法读取自己的shapefile文件

所以说,world变量被赋予了一个GeoDataFrame数据列,它长这样:

这个数据列中,不仅有几何列geometry,还有其它属性列

比如:人口pop_est、大洲continent、国家名字name等

world.plot()则是将GeoDataFrame变成图形展示出来,得到世界地图:

假如说,我只想显示每个地区的中心点,像这样:

代码如下:

代码语言:javascript
复制
import pandas as pd
import geopandas
import matplotlib.pyplot as plt
%matplotlib inline

world = geopandas.read_file(geopandas.datasets.get_path('naturalearth_lowres'))
# 新增一列,每个国家的中心点
world['centroid_column'] = world.centroid
# 将新增列设置为几何列
world = world.set_geometry('centroid_column') 
world.plot()
plt.show()

world.centroid返回一个GeoSeries,里面包含每个地区的中心点空间数据。

.set_geometry函数则是将新增列设置为几何列,这样就会按照新的几何列显示地图。

GeoDataFrame文件的输出形式

前面讲到将shapefile读成GeoDataFrame格式,反过来你也可以将GeoDataFrame格式输出为shapefile文件。

比如前面的world:

代码语言:javascript
复制
world.to_file("countries.shp")

还可以输出为GeoJson、GeoPackage等地理空间文件类型。

代码语言:javascript
复制
world.to_file("countries.geojson", driver='GeoJSON')world.to_file("package.gpkg", layer='countries', driver="GPKG")

按照地区人口数量给世界地图着色

前面的世界地图都是一个颜色,如果我想按照每个地区人口数量给世界地图上色,该怎么办?

代码如下:

代码语言:javascript
复制
import pandas as pd
import geopandas
import matplotlib.pyplot as plt
%matplotlib inline

world = geopandas.read_file(geopandas.datasets.get_path('naturalearth_lowres'))
fig, ax = plt.subplots(1, 1)
world.plot(column= 'pop_est', ax=ax, legend=True)
plt.show()

其实简单,只需要在world.plot(column= 'pop_est', ax=ax, legend=True) 中加上分类参数column,分类标准为人口列:pop_est

你还可以改色系:

代码语言:javascript
复制
world.plot(column='gdp_per_cap', cmap='OrRd');
代码语言:javascript
复制
world.plot(column='gdp_per_cap', cmap='OrRd', scheme='quantiles');

总结:

geopandas是非常有用的地理空间处理工具,它很好的结合了pandas的功能,让你很轻松的探索空间数据,在python上快捷、批量进行gis操作。

geopandas还有许多的功能供爱好者探索,这里不做赘述,大家可以自行去官网学习。

最后展示一些官网案例:

END

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-08-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python大数据分析 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档