这个问题看起来很容易解决,但我找不到任何提示--也许我没有问谷歌正确的问题。
假设你拥有一家互联网公司。您有当前月份的客户总消费量、上个月和前一个月的消费量。您想要创建一个名为"month_consumption_variation“和"2month_consumption_variation”的特性,首先是当前月份的消费除以上个月的消费量,然后从结果中减去一个。对于第二个特性,也是这样做的,但是在最后一个特性的前一个月(~延迟2)。
基本上,我认为,如果客户在减少或增加其消费,这是一个迹象,他改变它的互联网供应商或不。但是,这里有两种情况:(1)客户上个月或-前一个月没有消费任何东西,尽管他已经是客户;(2)客户当时不是我的客户。我的意思是我的分母可以是零,也可以是零。如果我使用分母,我将得到一个错误消息。
在这里可以应用什么样的解决方案?(1)和(2)的解有什么不同吗?
发布于 2022-02-25 22:22:55
您正在描述时间序列数据。滞后值通常不被分割。滞后值通常被减去,因此零值是一个问题。
时间序列的变化通常用自回归积分移动平均(ARIMA)建模。
https://datascience.stackexchange.com/questions/108538
复制相似问题