首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >Python:在一个图形中绘制所有分类子集组合

Python:在一个图形中绘制所有分类子集组合
EN

Stack Overflow用户
提问于 2018-07-16 08:39:20
回答 2查看 574关注 0票数 2

我想生成曲线图,显示不同组和子组的平均速率是如何随时间变化的。我可以手动完成,创建每个分组,定义每个y值集,并手动调用每个图。问题是,对组/子组的所有组合执行此操作是不切实际的。然而,我不确定如何概括这个过程。

我的数据有一个year、几个分类变量和一个数值rate。它看起来像这样,尽管实际上有更多的分类变量:

代码语言:javascript
复制
df.head()
Out [33]:
   year gender   race state  rate
0  2015      F  White    AL  0.01
1  2013      F  White    NC  0.48
2  2013      F  White    IN  0.07
3  2013      M  White    NJ  0.95
4  2013      F  White    NY  0.09

我想覆盖不同的组和子组:

有没有一种更优雅的方法来子化/自动化这个/这些图的生成?

代码语言:javascript
复制
import pandas as pd
import matplotlib.pyplot as plt

raw_data = {'year' : [2015 , 2013 , 2013 , 2013 , 2013 , 2013 , 2014 , 2013 , 2013 , 2013 , 2017 , 2013 , 2016 , 2017 , 2016 , 2015 , 2014 , 2014 , 2013 , 2013 , 2017 , 2014 , 2013 , 2016 , 2014 , 2016 , 2015 , 2013 , 2013 , 2013 , 2013 , 2013 , 2013 , 2013 , 2013 , 2013 , 2013 , 2013 , 2013 , 2013 , 2013 , 2013 , 2013 , 2017 , 2015 , 2015 , 2013 , 2013 , 2014]

, 'gender' : ['F' , 'F' , 'F' , 'M' , 'F' , 'F' , 'F' , 'M' , 'F' , 'M' , 'F' , 'M' , 'F' , 'M' , 'M' , 'M' , 'M' , 'M' , 'M' , 'M' , 'F' , 'M' , 'F' , 'M' , 'M' , 'M' , 'F' , 'M' , 'F' , 'F' , 'F' , 'M' , 'F' , 'M' , 'F' , 'F' , 'F' , 'F' , 'M' , 'M' , 'M' , 'F' , 'M' , 'M' , 'F' , 'M' , 'F' , 'M' , 'F']

, 'race' : ['White' , 'White' , 'White' , 'White' , 'White' , 'White' , 'White' , 'Black' , 'White' , 'White' , 'White' , 'White' , 'White' , 'White' , 'White' , 'White' , 'Black' , 'White' , 'White' , 'White' , 'White' , 'White' , 'White' , 'White' , 'Hispanic' , 'White' , 'Multiple' , 'White' , 'White' , 'Black' , 'Asian/Hawaii/PI' , 'Asian/Hawaii/PI' , 'Black' , 'Black' , 'Black' , 'Hispanic' , 'Black' , 'Black' , 'Black' , 'Black' , 'White' , 'White' , 'White' , 'White' , 'Black' , 'Multiple' , 'White' , 'White' , 'Black']

, 'state' : ['AL' , 'NC' , 'IN' , 'NJ' , 'NY' , 'NY' , 'NY' , 'ME' , 'MD' , 'NC' , 'NC' , 'NC' , 'AL' , 'IN' , 'MD' , 'MD' , 'ME' , 'IN' , 'AL' , 'NC' , 'IN' , 'NJ' , 'NY' , 'AL' , 'IN' , 'MD' , 'MD' , 'ME' , 'IN' , 'AL' , 'NC' , 'IN' , 'NJ' , 'ME' , 'MD' , 'NC' , 'NC' , 'NC' , 'AL' , 'IN' , 'MD' , 'ME' , 'MD' , 'NC' , 'NC' , 'NC' , 'AL' , 'IN' , 'MD']

, 'rate' : [0.01 , 0.48 , 0.07 , 0.95 , 0.09 , 0.09 , 0.08 , 0.89 , 0.55 , 0.38 , 0.23 , 0.66 , 0.46 , 0.24 , 0.07 , 0.75 , 0.67 , 0.60 , 0.36 , 0.18 , 0.56 , 0.27 , 0.98 , 0.89 , 0.17 , 0.72 , 0.23 , 0.10 , 0.81 , 0.04 , 0.41 , 0.16 , 0.39 , 0.12 , 0.95 , 0.99 , 0.16 , 0.52 , 0.74 , 0.31 , 0.36 , 0.16 , 0.02 , 0.22 , 0.33 , 0.30 , 0.90 , 0.14 , 0.16]}

df = pd.DataFrame(raw_data, columns= ['year', 'gender', 'race', 'state', 'rate'])

gb_overall = df.groupby(['year'])['rate'].mean()
gb_gender = df.groupby(['year', 'gender'])['rate'].mean()
gb_gender_race = df.groupby(['year', 'gender', 'race'])['rate'].mean()

x = gb_overall.index

y_overall = gb_overall.values
y_f = gb_gender.xs('F', level=1)
y_m = gb_gender.xs('M', level=1)
y_f_r = gb_gender_race.xs(('F', 'White'), level=['gender', 'race'])

fig = plt.subplots(figsize=(12, 8))
plt.plot(x, y_overall, marker = 'o')
plt.plot(x, y_f, marker = 'o')
plt.plot(x, y_m, marker = 'o')
plt.plot(x, y_f_r, marker = 'o')

axes = plt.gca()
axes.set_xlim(left=2012.5)
axes.set_title('Year vs. Average Rate', fontsize= 24)
axes.set_xlabel('Year', fontsize= 16)
axes.set_ylabel('Average Rate', fontsize= 16)
axes.legend(['Overall', 'F', 'M', 'White F'], fontsize=14, loc= 'best', frameon= True, edgecolor= 'black')

plt.show()
EN

回答 2

Stack Overflow用户

发布于 2018-07-16 09:08:14

我喜欢为使用熊猫图而构建一个形状和组织的单一数据框架。

代码语言:javascript
复制
white_f = gb_gender_race.xs(('F','White'), level=['gender','race']).rename('White F')
gender = gb_gender.unstack()
overall = gb_overall.rename('Overall')
df_chart = pd.concat([white_f, gender, overall], axis=1)
axes = df_chart.plot(marker = 'o')
axes.set_xlim(left=2012.5)
axes.set_title('Year vs. Average Rate', fontsize= 24)
axes.set_xlabel('Year', fontsize= 16)
axes.set_ylabel('Average Rate', fontsize= 16)
axes.legend(['Overall', 'F', 'M', 'White F'], fontsize=14, loc= 'best', frameon= True, edgecolor= 'black')

输出:

票数 3
EN

Stack Overflow用户

发布于 2018-07-16 09:37:35

使用字典,可以半自动打印各种条件。我省略了代码中的图形样式部分,将重点放在了要点上。

代码语言:javascript
复制
# overall plot
df.groupby('year').rate.mean().plot(label='Overall', marker='o')

# a dictionary to store various labels(keys) and conditions(values).
# by editing/adding conditions, you can customise your plots.
conds = {}
conds['F'] = (df.gender == 'F')
conds['M'] = (df.gender == 'M')
conds['White F'] = (df.gender == 'F') & (df.race == 'White')

# plot for each condition
for key, value in conds.items():
    df.loc[value].groupby('year').rate.mean().plot(label=key, marker='o')
plt.legend()
plt.show()
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51353314

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档