我理解,将数据分离为培训和测试提供了一种方法,可以评估模型对未见数据的性能。
我正在训练一个阿里玛模型,从10月1日到11月22日我每天都有数据。我有兴趣预测12月14日的某个指标。我是不是
我希望我的问题是有意义的,如果你觉得这令人困惑的话,我很乐意澄清。
谢谢!
发布于 2017-07-03 20:33:51
如果您使用您的所有数据进行培训,那么您将没有任何方法来预测您的模型概括到无形的数据有多好。这是一个不使用测试集的问题。
另一个问题是,除非您决定如何进行交叉验证,否则您将无法尝试不同的配置或模型超级参数。
数据序列预测对于交叉验证来说特别棘手,但我会遵循this post's关于前向链接的建议。如果您有6个星期的数据,您可以将数据分成以下几个部分:
https://stackoverflow.com/questions/44893400
复制相似问题