Python 的绘图功能非常强大,如果能将已有的绘图库和各种复杂操作汇总在一个自己写的库/包中,并实现一行代码就调用并实现复杂的绘图功能,那就更强大方便了。所以本博文只强调绘图代码的实现,绘图中的基础统计学知识与 Python 基础库操作(seaborn,matplotlib)并不会提及。
老板发给我有一份北京地区二手房房价的数据,要求帮他按照地区分一下类,每类的学区房与非学区房的占比情况汇报一下,以便能研究各地区的教育资源是否存在倾斜,最好能出个能让毫无统计学与数据分析基础的他一目了然的图。
Step1:预览数据与 pandas 绘图
Step2:尝试用堆叠图表示占比情况,并进行各种标准化
可以看到,为了出一个标准化的堆叠图,需要经过不少努力,如果有封装好的函数能够快捷实现就好了...
如下这个函数不仅能够快速实现标准化的堆叠图,还能根据每个名义变量(横轴)的数据量来调整柱宽。
可知石景山数据两最少,学区房占比也最小