是否可以通过某种方式获取重采样操作的行,以应用自定义函数:
让我们假设我们有一个DataFrame df
,它包含例如孩子的生日、他们的名字和他们的朋友数量:
birthday name friends
datetime_1 Alice 10
datetime_2 Bob 5
... ... ...
datetime_n Tom 12
如果我们现在按某个时间频率重新采样,并尝试应用自定义函数:
df.resample("w").apply(my_func)
它只会将输入作为单独的序列传递,而不是作为行传递。在Resampler.apply
的情况下没有axis
参数。那么有没有什么方法可以达到我想要的效果呢?或者,是否有另一种内置方法可用于在缩减部分中构建自定义行为?例如,如果我想要返回最频繁的名字,该名字在给定时间间隔内与该名字关联的朋友数量加权。
https://stackoverflow.com/questions/56769678
复制相似问题