该点子来源于一个小作业,作业要求是使用R平台相关绘图工具绘制中国疫情热力图(10分),参考效果如下图:
第一次使用R绘制地图的我,一脸懵逼。于是我开始翻书(《R语言数据可视化之美》,《ggplot2》),《R数据科学》),以及百度搜索。找到了几篇很实在的blog(见文末)。最后我的作业如下:
所需的包
library(mapdata)
library(maptools)
library(ggplot2)
library(plyr)
利用maptools包,可以导入shp格式的中国地图(相当于一个模板),该文件可通过网上获取,为了大家方便实战,我i已经将该文件放在我的github里,尽情下载。
china_map = readShapePoly("bou2_4p.shp")#导入shp格式的中国地图
x<-china_map@data
得到的中国地图数据如下
地图中共计有925个地域信息,并将其转化为数据库,并基于id进行连接。
xs<-data.frame(x,id=seq(0:924)-1)
china_map1<-fortify(china_map) #转化为数据框
china_map_data<-join(china_map1,xs,type="full")#基于id进行连接
a = data.frame(unique(china_map@data$NAME))#省份名称
接下来准备我们的数据,数据主要来自丁香园,是某一天的中国各省数据(ratio表示累计确认人数,people表示当天确认人数,province表示省份)一共31的省份,包括(香港,台湾)。基于两个表格相同属性(NAME)进行合并,这样就可以把模板中的地理信息一起合在一起了,这是关键步骤。
mydata<-read.csv("data_dt.csv",header=T,as.is=T)
china_data <- join(china_map_data, mydata, type="full")#基于NAME字段进行连接,NAME字段来自于地图文件中
绘制地图:
版本一(无省份名称的当日各省确认人数)
ggplot(china_data, aes(x = long, y = lat, group = group, fill = people)) +
geom_polygon(colour="grey40") +
scale_fill_gradient(low="white",high="steelblue") +#指定渐变填充色,可使用RGB
theme( #清除不需要的元素
panel.grid = element_blank(),
panel.background = element_blank(),
axis.text = element_blank(),
axis.ticks = element_blank(),
axis.title = element_blank(),
legend.position = c(0.2,0.3)
)
版本二(有省份名称的当日各省确认人数)
midpos <- function(x) mean(range(x,na.rm=TRUE)) #取形状内的平均坐标
centres <- ddply(china_data,.(NAME),colwise(midpos,.(long,lat)))
ggplot(china_data,aes(long,lat))+
geom_polygon(aes(group=group,fill=people),colour="black")+
scale_fill_gradient(low="white",high="steelblue") +
geom_text(aes(label=NAME),data=centres) +
theme(
panel.grid = element_blank(),
panel.background = element_blank(),
axis.text = element_blank(),
axis.ticks = element_blank(),
axis.title = element_blank()
)
当然如需绘制当日累计各省确诊人数,只需将fill=people换成fill=ratio即可,大家可以自己尝试。代码,数据相关资料与shp格式的中国地图都已放在我的github上了。https://github.com/liangliangzhuang/R_example
参考文献:
https://my.oschina.net/u/2306127/blog/473842
https://site.douban.com/182577/widget/notes/10568279/note/257898418/