Python Pandas由多列组成,意思是另一列 - 没有按对象分组

内容来源于 Stack Overflow,并遵循CC BY-SA 3.0许可协议进行翻译与使用

  • 回答 (1)
  • 关注 (0)
  • 查看 (86)

我有一些看起来像这样的数据,并称为'test_df'

  ID  Year  Value  Value2
0  A  2012      1       4
1  A  2012      2       5
2  A  2013      4       6
3  A  2013      5       7
4  B  2014      6       8
5  B  2014      7       4
6  B  2013      8       8

我希望它看起来像这样:

ID Year  Value_avg  Value2_avg
A  2012  1.5        4.5
A  2013  4.5        6.5
B  2013  8.0        8.0
B  2014  6.5        6.0

但是,当我尝试按多列分组时,它们最终成为按对象分组:

         Value_avg  Value2_avg
ID Year
A  2012        1.5         4.5
   2013        4.5         6.5
B  2013        8.0         8.0
   2014        6.5         6.0

这是我试过的代码:

out_df = pd.DataFrame()
out_df['Value_avg'] = test_df['Value'].groupby([test_df['ID'], test_df['Year']]).mean()
out_df['Value2_avg'] = test_df['Value2'].groupby([test_df['ID'], test_df['Year']]).mean()

我尝试添加:

out_df['Value_avg'] = test_df['Value'].groupby([test_df['ID'], 
test_df['Year']], as_index=False).mean()

但得到了这个错误:

"TypeError: as_index=False only valid with DataFrame"
提问于
用户回答回答于

add_suffix+reset_index

df.groupby(['ID','Year']).mean().add_suffix('_avg').reset_index()
Out[337]: 
  ID  Year  Value_avg  Value2_avg
0  A  2012        1.5         4.5
1  A  2013        4.5         6.5
2  B  2013        8.0         8.0
3  B  2014        6.5         6.0

所属标签

可能回答问题的人

  • 西风

    renzha.net · 站长 (已认证)

    7 粉丝1 提问9 回答
  • 四无君

    0 粉丝0 提问3 回答
  • o o

    3 粉丝490 提问2 回答
  • Dingda

    Dingda · 站长 (已认证)

    4 粉丝0 提问2 回答

扫码关注云+社区

领取腾讯云代金券