我有多个部门(零售领域)的每周时间序列数据,并且基于一些研究,我正在自动化为每个时间序列寻找模型参数的过程。到目前为止,我已经在for循环中为每个时间序列实现了以下模型:
1) ARIMA (R中的auto.arima)
2) stlf (不能使用R的ets函数,因为我有每周数据)
3) TBATS
4) ARIMA误差回归(使用傅立叶项)
5)基线模型:朴素&均值
我想了解如何为每个时间序列选择模型。我有多种方法来解决这个问题:
1)在测试数据上选择RMSE最低的模型(风险:对测试数据过度拟合)
2)选择均方根值最低的模型进行时间序列的交叉验证(tsCV)
3)为所有时间序列选择一个模型家族,根据该家族在所有时间序列中的平均RMSE得分最低。
有什么方法可以改进我的方法吗?上述任何一种方法有什么缺点吗?还有更好的方法吗?
非常感谢!
发布于 2020-04-15 18:46:33
用上面提到的所有预测方法预测你的数据,然后计算MAPE并检查哪个模型给出了最好的结果,然后使用该模型预测你的数据。也尝试检查不同的不同数据转换,如对数,逆等。用于您的输入数据。
https://stackoverflow.com/questions/61167018
复制相似问题