我想获得过去1到10个事件的滚动平均值,按多列的一列进行分组。我还希望它非常快,比如在dplyr或data.table中,因为我想在1,000,000 x 1,000数据帧上运行它。1: bill 1 2 4 3: bill 1 9 1 5: bill 3 4 3所需的df
我只希望b和c的滚动平均值<e
我有一个数据帧,结构如下: 索引: DatetimeIndex列:客户、业务、余额 我的数据跨越了很多年。我正在尝试获得按年滚动余额的平均值。我也按客户和业务进行分组。我得到了一个错误: ValueError: <YearBegin: month=1> is a non-fixed frequency 从文档中,我认为滚动可以接受和补偿可变长度的窗口,但他们一年一次,
我希望在数据帧上执行滚动平均值,但滚动平均值必须覆盖时间戳中的列的长度。 例如,在time1中,计算所有列行(1)的滚动平均值,然后在time2上,对所有行(2)执行相同的计算,依此类推。随着时间戳的进展而对窗口进行进展。 此外,这是按组完成的。因此,如果它在组A上执行此操作,则必须进行某种重置,因为它会转到组B 它有点像这个主题:Computing rolling mean in data.tab
这是获得基于星期几的时间的标准差和平均值的最首选方法吗?另外,如何将一系列标准差和均值转换为适当的时间格式?我尝试在这个系列中循环,并成功地做了datetime.timedelta(seconds=item),但我更喜欢用更多的熊猫方式来进行操作。感谢您的反馈。dict of days of week ie 0