这是我的问题。我不知道如何描述它,所以我只举一个例子。
a b k
0 0 0
0 1 1
0 2 0
0 3 0
0 4 1
0 5 0
1 0 0
1 1 1
1 2 0
1 3 1
1 4 0
这里,"a“是用户id,"b”是时间,"k“是二进制指示符标志。"b“肯定是连续的。我想得到的是:
a b k diff_b
0 0 0 nan
0 1 1 nan
0 2 0 1
0 3 0 2
0 4 1 3
0 5 0 1
1 0 0 nan
1 1 1 nan
1 2 0 1
1 3 1 2
1 4 0 1
因此,diff_b是一个时间差变量。它显示当前时间点与上一个具有操作的时间点之间的持续时间。如果以前从未执行过操作,则返回nan。此diff_b按a分组。对于每个用户,此diff_b是独立计算的。
任何人都可以修改我的标题吗?我不知道如何用英语来描述它。如此复杂。
谢谢!
https://stackoverflow.com/questions/50594852
复制相似问题