对于描绘名义变量中各类别的占比情况,饼图与树形图都是很不错的选择,它两的介绍与区别如下:
优点 | 缺点 | |
---|---|---|
饼图 | 每块大小反映了占比,可同时显示每类的占比情况与百分比 | 无法显示每类的数量 |
树形图 | 每块大小反映了占比,可同时显示每类的占比情况与数量 | 无法显示每类的百分比 |
让我们来看看图片效果,这里以北京二手房房价数据集为例,探究每个地区的数据量占比情况。
数据读入
绘制饼图
一行代码实现树形图
treemap 是笔者借助轮子封装的一个函数。从上图来看,树形图的配色相对柔和,看起来也更简洁大气,可以作为汇报呈现时使用,因为 pandas 绘图十分迅速,故在探索性数据分析时更常使用饼图;其实普通饼图和树形图是相辅相成,互相映衬的一组图,具体选用还需结合实际需求。