我有一个多列和数千行的数据框架。一列包含分段分类(ScoreSeg)。其他列包含与该行中的项相关的不同值。我想在“ScoreSeg”( 'PredMbrs‘一栏之和)/ (sum列b:'EstMbrs')上分组
我尝试了以下几点:
pr.groupby('ScoreSeg')['PredMbrs'].sum()/pr['EstMbrs'].sum()
实际结果如下:
ScoreSeg
1-3 0.131708
4-5 0.060665
6-6 0.609900
7-8 0.167228
9-11 0.100284
名称: PredMbrs,dtype: float64
预期结果如下:
1-3 0.954568997
4-5 1.011131346
6-6 1.056760686
7-8 1.176788844
9-11 1.211452952
发布于 2019-03-27 19:11:22
不应该用两个单独的函数链接groupby
s=(pr.groupby('ScoreSeg')['PredMbrs','EstMbrs'].sum())
s['PredMbrs']/s['EstMbrs']
发布于 2019-03-27 19:19:15
我认为可以在groupby()上使用():
df.groupby(''ScoreSeg'').apply(lambda x: x['PredMbrs'].sum()/
float(x['EstMbrs'].sum()))
https://stackoverflow.com/questions/55384786
复制相似问题