我想计算RollingGroupby对象的加权平均值。不幸的是,我得到了一个错误:
only integers, slices (`:`), ellipsis (`...`), numpy.newaxis (`None`) and integer or boolean arrays are valid indices
这是我的代码:
np.random.seed(9999)
df = pd.DataFrame(np.random.random(20).reshape(10, 2), columns = ['val1', 'val2'])
df['id'] = np.repeat([1, 2], 5)
df['wt'] = [1, 2] * 5
def weighted_average(data, value, weight):
return np.average(data[value], weights = data[weight], axis = 0)
dfwavg = df.groupby('id')[['val1', 'wt']]\
.rolling(window=2, min_periods=1)\
.apply(weighted_average, 'wt')
有人知道问题出在哪里吗?谢谢。
编辑
如果一个解决方案使用现有的结构(使用group.by.rolling.apply),那就更好了。换句话说,最好的选择可能是在apply()
中嵌套一个修改过的函数。
发布于 2018-06-07 05:07:50
像这样吗?
pd.concat([(x.val1*x.wt).rolling(window=2,min_periods=1).sum()/x.wt.rolling(window=2,min_periods=1).sum() for _,x in df.groupby('id')])
Out[592]:
0 0.823389
1 0.295437
2 0.072459
3 0.333050
4 0.445683
5 0.913049
6 0.704820
7 0.317114
8 0.325059
9 0.179366
dtype: float64
https://stackoverflow.com/questions/50729425
复制相似问题