我希望在数据帧上执行滚动平均值,但滚动平均值必须覆盖时间戳中的列的长度。 例如,在time1中,计算所有列行(1)的滚动平均值,然后在time2上,对所有行(2)执行相同的计算,依此类推。随着时间戳的进展而对窗口进行进展。 此外,这是按组完成的。因此,如果它在组A上执行此操作,则必须进行某种重置,因为它会转到组B 它有点像这个主题:Computing rolling mean in data.table with adaptive window lengths 但是在python上,考虑到时间戳。 此外,数据集很大,因此它必须是最优的,迭代和循环将需要数年时间
我想在Pandas中查看每个客户端在不同时间段的TimeSeries数据。import pandas as pdimport randomdatesgroupby函数,但当我应该使用TimeSeries时,这似乎是一项额外的工作。我已经阅读了文档,并查看了Wes的TimeSeries演示,但是我没有看到一种方法来为客户端创建一个groupby,然后在我试图构建的时间段
我知道有一些关于这个主题的问题(比如Pandas: Cumulative sum of one column based on value of another),但是它们都不能满足我的要求。我想按月计算成本分组的累积和,避免考虑当前值,以便使用groupby和cumsum获得所需的column.By。我获得列CumSum ? 。