Python 3中有一个时间序列数据,如下所示:
Date `Weekly_Sales`
2010-05-02 3400
2010-05-02 5600
2010-05-02` 4590
2010-05-02 5800
2010-05-12 2380
2010-05-12 6700
2010-05-12 3700
时间序列是不连续的,因为同一日期有多个观测结果。我试图用ARIMA预测python的销售额,但是我的ACF和PACF图显示,如果我运行dickly测试来测试平稳性,我的系统会结冰,那么lags.Also之间就没有相关性。
我怎么才能解决这个问题?
发布于 2019-02-09 09:21:02
看起来您在该数据集中丢失了一些信息。对于一个变量,您不应该有一个时间步长的4个度量--您如何知道要为2010-05-02
使用的前四行中的哪一行?
我建议检查您的数据源,或者想出一种方法来解释这四个值的含义。它们有什么不同(使用其他信息)吗?
您是如何在该日期索引上创建延迟的?每天平均多少次?根据用于Dickey-Fuller测试(和其他方法)的包,它们可能无法处理与输入相同的时间步骤.所以可以解释为什么会话会崩溃。
发布于 2020-03-05 18:14:42
一种选择是采用贝叶斯方法,并将数据建模为随时间变化的可能值的分布。每周都是状态空间模型的一部分。最常见的名称/框架是贝叶斯结构时间序列(BSTS)。
https://datascience.stackexchange.com/questions/45293
复制相似问题