前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据可视化(13)-Seaborn系列 | 点图pointplot()

数据可视化(13)-Seaborn系列 | 点图pointplot()

原创
作者头像
数据分析可视化
修改2019-10-08 11:14:10
2.6K0
修改2019-10-08 11:14:10
举报

点图

点图表示通过散点图点的位置对数值变量的中心趋势的估计。

点图用于集中在一个或多个分类变量的不同级别之间的比较,有时比条形图更有用。

注:点图只显示平均值(或其他估计值)。但在许多情况下,显示每个分类变量级别的值分布可能更具信息性。此时,其他方法如一个盒子或小提琴可能更合适。

函数原型

代码语言:txt
复制
seaborn.pointplot(x=None, y=None, hue=None, 
                  data=None, order=None, hue_order=None, 
                  estimator=<function mean>, ci=95, 
                  n_boot=1000, units=None, markers='o', 
                  linestyles='-', dodge=False, join=True, 
                  scale=1, orient=None, color=None, palette=None, 
                  errwidth=None, capsize=None, ax=None, **kwargs)

参数解读

表1
表1
代码语言:txt
复制
x,y,hue:数据字段变量名(如上表,date,name,age,sex为数据字段变量名)
作用:根据实际数据,x,y常用来指定x,y轴的分类名称,hue常用来指定第二次分类的数据类别(用颜色区分)

data: DataFrame,数组或数组列表

order,hue_order:字符串列表
作用:显式指定分类顺序,eg. order=[字段变量名1,字段变量名2,...]

estimator:可回调函数
作用:设置每个分类箱的统计函数

ci:float或者"sd"或None
在估计值附近绘制置信区间的大小,如果是"sd",则跳过bootstrapping并绘制观察的标准差,如果为None,则不执行bootstrapping,并且不绘制错误条。

n_boot:int
计算置信区间时使用的引导迭代次数

markers:字符串或字符串列表
作用:标记符号

案例教程

代码语言:txt
复制
import seaborn as sns
import matplotlib.pyplot as plt
# 设置样式风格
sns.set(style="darkgrid")
# 构建数据
tips = sns.load_dataset("tips")
"""
案例1:
利用catplot()来实现boxplot()的效果(通过指定kind="box")
"""
sns.pointplot(x="time", y="total_bill", data=tips)
plt.show()
代码语言:txt
复制
import seaborn as sns
import matplotlib.pyplot as plt
# 设置样式风格
sns.set(style="darkgrid")
# 构建数据
tips = sns.load_dataset("tips")
"""
案例2:
设置hue来对已分组的数据进行第二次分类(通过颜色区别)
"""
sns.pointplot(x="time", y="total_bill", hue="smoker",
              data=tips)
plt.show()
代码语言:txt
复制
import seaborn as sns
import matplotlib.pyplot as plt
# 设置样式风格
sns.set(style="darkgrid")
# 构建数据
tips = sns.load_dataset("tips")
"""
案例3:
设置dodge=True实现 沿着分类轴分离不同色调级别的点(hue指定的分类)
"""
sns.pointplot(x="time", y="total_bill", hue="smoker",
              data=tips, dodge=True)
plt.show()
代码语言:txt
复制
import seaborn as sns
import matplotlib.pyplot as plt
# 设置样式风格
sns.set(style="darkgrid")
# 构建数据
tips = sns.load_dataset("tips")
"""
案例4:
设置markers=["o", "x"]和线型linestyles=["-", "--"]
"""
sns.pointplot(x="time", y="total_bill", hue="smoker",
              data=tips,markers=["o", "x"],linestyles=["-", "--"])
plt.show()
代码语言:txt
复制
import seaborn as sns
import matplotlib.pyplot as plt
# 设置样式风格
sns.set(style="darkgrid")
# 构建数据
tips = sns.load_dataset("tips")
"""
案例5:
设置调色板palette=Set2,颜色体现在hue的分组数据上
"""
sns.pointplot(x="time", y="total_bill", hue="smoker",
              data=tips, palette="Set2")
plt.show()
代码语言:txt
复制
import seaborn as sns
import matplotlib.pyplot as plt
# 设置样式风格
sns.set(style="darkgrid")
# 构建数据
tips = sns.load_dataset("tips")
"""
案例6:
设置order=["变量名1","变量名2",...]来显示指定分类顺序
"""
sns.pointplot(x="time", y="tip", data=tips,
              order=["Dinner", "Lunch"])
plt.show()
代码语言:txt
复制
import seaborn as sns
import matplotlib.pyplot as plt
from numpy import median
# 设置样式风格
sns.set(style="darkgrid")
# 构建数据
tips = sns.load_dataset("tips")
"""
案例7:
使用中位数作为中心趋势的估计值
"""
sns.pointplot(x="day", y="tip", data=tips, estimator=median)
plt.show()
代码语言:txt
复制
import seaborn as sns
import matplotlib.pyplot as plt
# 设置样式风格
sns.set(style="darkgrid")
# 构建数据
tips = sns.load_dataset("tips")
"""
案例8:
使用catplot()实现pointplot()的效果(通过设置kind="point")
"""
sns.catplot(x="sex", y="total_bill",
            hue="smoker", col="time",
            data=tips, kind="point",
            dodge=True,
            height=4, aspect=.7)
plt.show()

案例地址

案例代码已上传:Github https://github.com/Vambooo/SeabornCN

整理制作:数据分析与可视化学研社

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 点图
  • 函数原型
  • 参数解读
  • 案例教程
  • 案例地址
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档