我有一个数据帧,有4个变量除法,QTR,MODEL_SCORE,MONTH,变量X的总和由这4个变量聚合而成。
我想通过划分,QTR和模型分数来有效地划分数据,并保持一个运行的总顺序,从月字段顺序最小到最大。这个想法是,如果它达到了其他3列的新排列,它将被重置
df = df.groupby(['DIVISION','MODEL','QTR','MONTHS'])['X'].sum()我在努力
df['cumsum'] = df.groupby(level=3)['X'].cumsum()在尝试了所有数字之后,我可以在level参数中思考。它似乎能够以任何方式工作,而不是我想要的。
编辑:我知道下面的格式不是理想的,但基本上只要唯一的变量变化是月份,累积和将继续,但任何其他变量将导致它重置。
DIVSION QTR MODEL MONTHS X CUMSUM
A 1 1 1 10 10
A 1 1 2 20 30
A 1 2 1 5 5发布于 2021-10-13 20:43:06
我为所有的麻烦感到抱歉,我相信答案比我想象的要简单得多。
之后
df = df.groupby(['DIVISION','MODEL','QTR','MONTHS'])['X'].sum()我应该重置索引,我不想要多索引,但这似乎起作用了。
df = df.reset_index()
df['cumsum'] = df.groupby(['DIVISION','MODEL','QTR'])['X'].cumsum()https://stackoverflow.com/questions/69561670
复制相似问题