欢迎关注”生信修炼手册”!
seaborn是建立在matplotlib上的一个高度封装的模块,针对数据的统计学描述,统计了一系列相关的可视化功能。
在该模块中,针对常用的统计图表,分为了以下3大类别
1. relplot, 描述数据点之前的关联,可视化形式是散点图和折线图
2. displot, 描述数据点的分布,可视化形式包括直方图,密度曲线等
3. catplot, 描述分类变量的分布,可视化形式包括箱体图,柱状图,小提琴图等
三大类别下面,是各自对应的具体类别。其实三大类别是其子类的更高等级封装,通过三大类别对应的函数,可以灵活调用子类的函数。
来看一个基本的例子
使用relplot函数来可视化x和y变量的关系,kind参数的值为scatter, 表示调用的是scatterplot这个子函数,这也是默认值,输出结果如下
直接调用scatterplot函数,用法如下
输出结果如下
从可视化的效果而言,除了边框样式等展示形式外,坐标系内的元素是完全一致的。需要注意的是,不同level的函数返回的对象是不一样的,relplot函数返回的是FacetGrid对象,而子函数scatterplot函数返回的是axes对象,两者的用法有所区别。
seaborn采用了类似R语言ggplot2的属性映射和分面思想,可以很方便的将数据框的不同列映射为不同的属性,用法如下
1. 属性映射
hue参数用于映射颜色属性,style颜色用于映射形状属性,size参数用于映射点的大小属性,这些参数在大类和子类函数中同时适用,用法如下
输出结果如下
2. 分面
通过row和col参数将数据框的列映射为不同的分面,该方法仅在大类函数中适用,用法如下
输出结果如下
这种属性映射和分面的语法,为数据可视化提供了极大的便利,相同的效果,如果完全用matplotlib的语法来实现,代码量会大大增加。
除此之外,该模块还提供了joint, pair等更加灵活的数据探究方式
1. pairplot
pairplot用于快速可视化数据框各列元素之间的关系,用法如下
输出结果如下
2. jointplot
jointplot是一个组合图,用于探究两个变量间的关系,用法如下
输出结果如下
除了以上功能外,seaborn还有许多其他的功能,后续在详细介绍。
·end·
—如果喜欢,快分享给你的朋友们吧—
原创不易,欢迎收藏,点赞,转发!生信知识浩瀚如海,在生信学习的道路上,让我们一起并肩作战!
本公众号深耕耘生信领域多年,具有丰富的数据分析经验,致力于提供真正有价值的数据分析服务,擅长个性化分析,欢迎有需要的老师和同学前来咨询。
领取专属 10元无门槛券
私享最新 技术干货