Seaborn入门系列(三)——boxplot和violinplot

Seaborn是基于matplotlib的Python可视化库。 它提供了一个高级界面来绘制有吸引力的统计图形。Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,不需要经过大量的调整就能使你的图变得精致。但应强调的是,应该把Seaborn视为matplotlib的补充,而不是替代物。

注:所有代码均在IPython notebook中实现

boxplot

箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。它能显示出一组数据的最大值最小值中位数上下四分位数。因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。图解如下:

接下来我们介绍Seaborn中的箱型图的具体实现方法,这是boxplot的API:

seaborn.boxplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, orient=None, color=None, palette=None, saturation=0.75, width=0.8, dodge=True, fliersize=5, linewidth=None, whis=1.5, notch=False, ax=None, **kwargs)

我们从具体的实例出发

本文所使用的数据集是鸢尾花卉数据集

x,y:dataframe中的列名(str)或者矢量数据

data:dataframe或者数组

palette:调色板,控制图像的色调

hue(str):dataframe的列名,按照列名中的值分类形成分类的条形图

order, hue_order (lists of strings):用于控制条形图的顺序

orient:"v""h" 用于控制图像使水平还是竖直显示(这通常是从输入变量的dtype推断出来的,此参数一般当不传入x、y,只传入data的时候使用)

fliersize:float,用于指示离群值观察的标记大小

whis:确定离群值的上下界(IQR超过低和高四分位数的比例),此范围之外的点将被识别为异常值。IQR指的是上下四分位的差值。

width:float,控制箱型图的宽度

violinplot

violinplot与boxplot扮演类似的角色,它显示了定量数据在一个(或多个)分类变量的多个层次上的分布,这些分布可以进行比较。不像箱形图中所有绘图组件都对应于实际数据点,小提琴绘图以基础分布的核密度估计为特征。具体用法如下:

seaborn.violinplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, bw='scott', cut=2, scale='area', scale_hue=True, gridsize=100, width=0.8, inner='box', split=False, dodge=True, orient=None, linewidth=None, color=None, palette=None, saturation=0.75, ax=None, **kwargs)

实例所用的数据集如下:

在这里就不再介绍x,y,hue,data,order,hue_order,palette参数的用法,这些参数的用法和之前介绍的图形的用法是一样的,如有需要可以查看之前的内容。

先来画一个小提琴图:

split:将split设置为true则绘制分拆的violinplot以比较经过hue拆分后的两个量:

scale_hue:bool,当使用色调变量(hue参数)嵌套小提琴时,此参数确定缩放是在主要分组变量(scale_hue = true)的每个级别内还是在图上的所有小提琴(scale_hue = false)内计算出来的。

orient:"v""h" 用于控制图像使水平还是竖直显示(这通常是从输入变量的dtype推断出来的,此参数一般当不传入x、y,只传入data的时候使用)

inner:控制violinplot内部数据点的表示,有“box”,“quartile”,“point”,“stick”四种方式。

scale:该参数用于缩放每把小提琴的宽度,有“area”,“count”,“width”三种方式

cut:float,距离,以带宽大小为单位,以控制小提琴图外壳延伸超过内部极端数据点的密度。设置为0以将小提琴范围限制在观察数据的范围内(即,在ggplot中具有与trim = true相同的效果)

width:float,控制钢琴图的宽度(比例)

这已经是Seaborn入门系列的第三篇文章了,相信大家已经大概了解Seaborn的作图过程,也可以体会到用Seaborn作图相比于matplotlib更加简单。以上内容是我结合官方文档和自己的一点理解写成的,有什么错误大家可以指出来并提提意见共同交流、进步,也希望我写的这些能够给阅读完本文的你或或少的帮助!

关注iPythonistas

一起学数据分析

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180227G0LUBC00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券