ggplot2高阶案例应用——中国家庭金融资产配置变化

今天浏览新闻,看到一个关于美国居民家庭金融资产配置的调查,主要介绍1974年~2016年美国居民和非居民部门家庭金融资产配置比例分布演变的数据。

数据显示,在所统计的现金和活期存款、定期存款、养老基金、保险计划、共同基金和货币基金中。

1974年,一个典型公民把8%的金融资产放在现金和活期存款,35%放在定期存款,0.1%放在货币基金,3%放在共同基金,47%放在养老金。到2016年,这些数字演变为2.5%、22%,2.7%、31%和53%。

在这43年中,活期存款的比重降低了5.5%,银行存款的比重整体下降了8.5%,货币基金的比重超过了活期存款,共同基金和养老金合计增加了34%。

这是一个典型的时间点结构对比数据,我之前曾经用Excel做过一个类似场景的图表,今天使用R语言重新演示此案例。

以下过程我将使用上述案例数据演示制作此类带有连接带的堆积柱形图:

library("ggplot2") library("showtext") library("Cairo") font_add("myfzhzh","方正正粗黑简体.TTF")

#原始数据:

mydata<-data.frame( Class=c("现金和活期存款","定期存款","货币基金","共同基金","养老基金"), Y1974=c(8,35,0.1,3,47), Y2016=c(2.5,22,2.7,31,53) )

mydata$Class<-factor(mydata$Class,levels=c("现金和活期存款","定期存款","货币基金","共同基金","养老基金"),ordered=T)

以上这种案例图,中间的连接带与两侧的柱形图颜色系列是不同的,所以如果按照多边形去构造,需要分成两波来制作,第一波是含有数据信息的两个柱形图,第二波是中间的连接线,为了更好的设置间距,柱形图和中间的链接线都是用ggplot2函数中的geom_rect()图层进行构建。

geom_rect()的规则是根据每一个多边形的边界点进行形状构建,所有我们需要获取15个矩形块中不重复的24个坐标点。

根据以上思路,先构造两侧柱形图的数据源;

bar1<-data.frame( Class=c("现金和活期存款","定期存款","货币基金","共同基金","养老基金"), xmin=rep(0,5), xmax=rep(5,5), ymin=c(0,cumsum(mydata$Y1974)[1:4]), ymax=cumsum(mydata$Y1974), Year="Y1974", ) bar2<-data.frame( Class=c("现金和活期存款","定期存款","货币基金","共同基金","养老基金"), xmin=rep(25,5), xmax=rep(30,5), ymin=c(0,cumsum(mydata$Y2016)[1:4]), ymax=cumsum(mydata$Y2016), Year="Y2016" )

mydata1<-rbind(bar1,bar2) mydata1$Class<-factor(mydata1$Class,levels=c("现金和活期存款","定期存款","货币基金","共同基金","养老基金"),ordered=T)

构造标签:

mydata1$label_x=rep(c(2.5,27.5),each=5) mydata1$label_y=mydata1$ymin+(mydata1$ymax-mydata1$ymin)/2 mydata1$value<-c(mydata$Y1974,mydata$Y2016)

构造中间的连接带数据源:

midrect<-data.frame(Class=mydata$Class)

midrect$id<-1:nrow(midrect)

midrect$ystart<-c(0,cumsum(mydata$Y2016[1:(nrow(mydata)-1)]))

midrect$yend<-cumsum(mydata$Y2016)

midrect$start<-bar1$ymin

midrect$end<-bar1$ymax

转置并构造中间的连接带单个多边形四角坐标点:

midrect_data<-data.frame(t(midrect[,c("start","end","yend","ystart")]),stringsAsFactors=FALSE) names(midrect_data)<-midrect$Class midrect_data$order<-1:4

将这些坐标点数据转成长数据:

midrect_data_final<-gather(midrect_data,Class,lat,-order) midrect_data_final$long<-rep(c(5,5,25,25),5) midrect_data_final$Class<-factor(midrect_data_final$Class,levels=c("现金和活期存款","定期存款","货币基金","共同基金","养老基金"),ordered=T)

#绘图过程:

color<-c("#0579AD","#0899DA","#519F46","#A2D293","#C7C8CC") CairoPNG(file="E:/微信公众号/公众号——数据小魔方/2017年9月/20170922/bump_bar.png",width=1200,height=900) showtext.begin() ggplot()+ geom_rect(data=mydata1,aes(xmin=xmin,xmax=xmax,ymin=ymin,ymax=ymax,fill=Class),colour="white")+ geom_text(data=mydata1,aes(x=label_x,y=label_y,label=paste(value,"%")),family="myfzhzh",size=5,colour="white")+ geom_text(data=NULL,aes(x=c(2.5,27.5),y=c(98,115),label=c(1974,2016)),size=10)+ geom_polygon(data=midrect_data_final,aes(x=long,y=lat,fill=Class),colour="white")+ ylim(0,115)+ guides(fill=guide_legend(title=NULL)) + scale_fill_manual(values=color)+ labs(title="美国居民和非营利部门的金融资产分布与社会融资成本\n(1974年至2016年)", caption="备注:金融资产数据来自于美联储发布的美国国家资产负债表年报,贷款利率数据来自世界银行官网。" )+

theme_void(base_size=18,base_family="myfzhzh") %+replace% theme( legend.position=c(.25,.95), legend.direction ="horizontal", plot.title=element_text(size=35,hjust=0), plot.caption=element_text(size=20,hjust=0), plot.margin=margin(10,0,10,0,unit="pt"), legend.text=element_text(size=20) ) showtext.end() dev.off()

本文分享自微信公众号 - 数据小魔方(datamofang)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-09-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据结构与算法

P1041 传染病控制

题目背景 近来,一种新的传染病肆虐全球。蓬莱国也发现了零星感染者,为防止该病在蓬莱国大范围流行,该国政府决定不惜一切代价控制传染病的蔓延。不幸的是,由于人们尚未...

35950
来自专栏华章科技

全球顶尖公司的烧脑面试题,普通人一道都答不出来!

一些世界知名的企业在招聘时,可能会提供面试智力题,来筛选应聘者。那些越是大牌,越是有名的国内500强,乃至世界500强,给出的面试真是一般人都答不出来。

10320
来自专栏WOLFRAM

一行代码论英雄—2018 Wolfram 语言“一行代码竞赛”结果

在今年刚结束的 Wolfram 技术大会上, 图像和机器学习是One-Liner竞赛的热门主题。One-Liner竞赛要求参赛者用Wolfram 语言实现一个酷...

15210
来自专栏量化投资与机器学习

R语言构建追涨杀跌量化交易模型(附源代码)

作者 张丹(Conan) 来源 http://blog.fens.me Rquant前言最近有读者要求公众号推送几篇关于R语言量化投资的内容。今天推送第一篇。后...

628100
来自专栏量化投资与机器学习

【精选】破解波动性突破实盘系统

1、波动性突破实盘系统介绍 1.1 系统设计思想 波动性突破, 本身带有一定程度自适应市场的特点, 为趋势跟踪系统中的上品, 我们再加入时间清仓、 顺势下轿的...

39670
来自专栏用户2442861的专栏

IT比试概率数学题

http://www.cnblogs.com/renyuan/archive/2012/09/24/2699654.html

14510
来自专栏喔家ArchiSelf

6行python代码的爱心线

前些日子在做绩效体系的时候,遇到了一件囧事,居然忘记怎样在Excel上拟合正态分布了,尽管在第二天重新拾起了Excel中那几个常见的函数和图像的做法,还是十分的...

71520
来自专栏老九学堂

一起来做扩脑运动-逻辑思维题分享(1)

逻辑思维(Logical Thinking),是思维的一种高级形式。是指符合某种人为制定的思维规则和思维形式的思维方式,我们所说的逻辑思维主要指遵循传统形式逻辑...

32240
来自专栏PPV课数据科学社区

“数学之美”系列二:谈谈中文分词

谈谈中文分词 --- 统计语言模型在中文处理中的一个应用 上回我们谈到利用统计语言模型进行语言处理,由于模型是建立在词的基础上的,对于中日韩等语言,首先...

34630
来自专栏程序员的SOD蜜

从编程语言的角度看中医的【藏像】理论

17930

扫码关注云+社区

领取腾讯云代金券