前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >seaborn数据总体分布的可视化策略

seaborn数据总体分布的可视化策略

作者头像
生信修炼手册
发布2020-10-19 11:26:50
1.3K0
发布2020-10-19 11:26:50
举报
文章被收录于专栏:生信修炼手册生信修炼手册

在查看一个数据的分布时,常用的可视化形式有直方图,密度分布图等,在seaborn中,相关的函数有以下几个

1. histplot. 通过直方图来展示数据分布

2. kdeplot, 通过密度分布图来展示数据分布

3. ecdfplot. 通过累积分布曲线来展示数据分布

4. rugplot. 通过x轴和y轴的边际分布来展示数据分布

下面通过一些基本的例子来感受下各自的可视化形式,histplot示例如下

代码语言:javascript
复制
>>> df = pd.read_csv('penguins.csv')
>>> sns.histplot(df, x='flipper_length_mm')
>>> plt.show()

输出结果如下

kedplot示例如下

代码语言:javascript
复制
>>> sns.kdeplot(data=df, x='flipper_length_mm')
>>> plt.show()

输出结果如下

ecdfplot示例如下

代码语言:javascript
复制
>>> sns.ecdfplot(data=df, x='flipper_length_mm')
>>> plt.show()

输出结果如下

rugplot示例如下

代码语言:javascript
复制
>>> sns.rugplot(data=df, x='flipper_length_mm')
>>> plt.show()

输出结果如下

在实际使用中,histplot和kdeplot是使用的最高频的,其次是rugplot, 最后是ecdfplot。对于这一类函数而言,有许多的通用参数,以histplot为例,来看下这些参数的作用

1. x和y

数据分布通常是对数据框中的某一列进行查看,通过切换x和y参数,可以将图表倒置,示例如下

代码语言:javascript
复制
>>> sns.histplot(df, y='flipper_length_mm')
>>> plt.show()

输出结果如下

2. color

color参数控制填充的颜色,示例如下

代码语言:javascript
复制
>>> sns.histplot(df, x='flipper_length_mm', color='c')
>>> plt.show()

输出结果如下

3. hue

数据分布也是支持属性映射的,但是可以映射的属性就只有颜色属性了,所以只支持hue参数,示例如下

代码语言:javascript
复制
>>> sns.histplot(df, x="flipper_length_mm", hue="species")
>>> plt.show()

输出结果如下

4. pattle

pattle参数用于指定颜色梯度,示例如下

代码语言:javascript
复制
>>> sns.histplot(df, x="flipper_length_mm", hue="species",palette="crest")
>>> plt.show()

输出结果如下

除了通用参数外,每个函数还有自己专属的一些参数,这些参数很多,无法一一详细描述,可以通过官网的API文档详细查看。

这几个函数对应的高阶函数为displot, 基本用法如下

代码语言:javascript
复制
>>> sns.displot(data=df, x="flipper_length_mm", hue="species", col="sex", kind="kde")
>>> plt.show()

输出结果如下

通过kind参数来指定调用的子函数,通过col和row参数来实现分面的效果。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-09-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档