我需要计算数百万用户每月的流失率。
月流失率=前一年12月月的流失用户数/总用户数
如果用户处于基准状态(2016年12月),并且当月销售额小于1,则该月份的用户被视为“搅动”月份。
我有一个简单的数据框架YearMonth,用户和销售。
注意,在这个简单的例子中,这个月可以有新的用户'D‘,但是由于'D’不是在前一年的12月,所以在计算搅动率的基线中不考虑它。
YearMonth User Sales Year Month
201612 A 2 2016 12
201612 B 2 2016 1
我正在尝试从包含customer_id、group、date的数据中计算流失率。聚合将按id、组和日期进行。流失公式是(customers in previous cohort - customers in last cohort)/customers in previous cohort
前一个队列中的客户是指28天前的队列最后一个队列中的客户是最近28天内的队列
我不确定如何通过日期范围聚合它们来计算流失率。
下面是我从复制的示例数据:
Date Group Customer_id
2014-03-01 A 1
2014-04-02 A