文章/答案/技术大牛

发布

社区首页 >问答首页 >时间序列Python (测试、培训和预测数据中的过去日期)

问时间序列Python (测试、培训和预测数据中的过去日期)
EN

Stack Overflow用户

提问于 2017-07-03 20:22:32

回答 1查看 1.1K关注 0票数 0

我理解，将数据分离为培训和测试提供了一种方法，可以评估模型对未见数据的性能。

我正在训练一个阿里玛模型，从10月1日到11月22日我每天都有数据。我有兴趣预测12月14日的某个指标。我是不是

培训所有可用数据和使用预测(“2015-11-23”、“2015-12-14”)或
将数据分成训练和测试，以获得性能指标，并使用在培训集上培训的模型(10月1日)。进行预测，包括测试数据以及未来日期，例如预测(“2015-11-8”、“2015-12-14”)。

我希望我的问题是有意义的，如果你觉得这令人困惑的话，我很乐意澄清。

谢谢!

python

pandas

forecasting

回答 1

Stack Overflow用户

发布于 2017-07-03 20:33:51

如果您使用您的所有数据进行培训，那么您将没有任何方法来预测您的模型概括到无形的数据有多好。这是一个不使用测试集的问题。

另一个问题是，除非您决定如何进行交叉验证，否则您将无法尝试不同的配置或模型超级参数。

数据序列预测对于交叉验证来说特别棘手，但我会遵循this post's关于前向链接的建议。如果您有6个星期的数据，您可以将数据分成以下几个部分：

第1部分:培训w1，测试w2
第2部分:培训w1 w2，测试w3
第3部分:培训w1 w2 w3，测试w4
第4部分:培训w1 w2 w3 w4，测试w5
第5部分:培训w1 w2 w3 w4 w5，测试w6

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/44893400

复制

相似问题

问时间序列Python (测试、培训和预测数据中的过去日期)
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问时间序列Python (测试、培训和预测数据中的过去日期)EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问时间序列Python (测试、培训和预测数据中的过去日期)
EN