我想要为DataFrame中的一些时间序列数据计算扩展的z得分,但我想使用多列的平均值和标准差来标准化数据,而不是使用每列中单独的平均值和标准差。我相信我想要使用groupby和DataFrame.expanding的组合,但我似乎无法弄清楚。以下是一些示例数据:import numpy as np
np
np.random.normal(size=(N,m))**3indx = np.random.randint(0,3,size=N).astype(np.int32)import pandas as pd columns=['a%s'% k for k in range(m)] + [ 'indx'])
我可
我试图对一列的切片进行中间(减去平均值)。因此,在下面的示例中,我将按超例进行搜索(分组的变量取其平均值,然后在相同的位置分配旧值减去平均值)。我正在使用一个更大的dataframe (477行×85列),所以我做了一个测试df来说明我的观点。import random as rd
# 10 row by 3 columns dataf