首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >时间序列预测.滑动窗口法

时间序列预测.滑动窗口法
EN

Data Science用户
提问于 2018-03-16 20:36:20
回答 1查看 12.4K关注 0票数 2

我一直在试图理解这种滑动窗口技术,但没有效果,而且真的不确定我将如何实现它。

我的数据集:我有一年电力负荷的小时值(超过8700个数据点)-下图。我将把数据集分成训练集(1月1日至9月30日)和测试集(10月1日至12月31日)。

我将使用有监督的学习技术,如回归树和随机森林(基本上是我在科学知识学习中可以得到的任何东西),在训练集上训练它们,然后对测试集进行预测。

我知道我需要使用历史已知的值作为输入特性来输入到模型中。因此,我创建了"Load_lagN“。

我说得对吗?因为我创建了10个滞后变量(Xt-1到Xt- 10 ),这相当于使用大小为10?

的滑动窗口。

,那么我如何简单地在训练集上训练模型并在不使用滑动模型的情况下对测试集进行预测呢?

对于滑动窗口模型,这是否假设过去的n值(在我的例子中是10)是相关的?

如果我已经将我的数据集分割成一个训练和测试集,那么回归树是如何被训练的,然后在测试集中进行预测(现在我将坚持提前一步预测),同时实现这种滑动窗口技术?

http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.TimeSeriesSplit.html#sklearn.model_selection.TimeSeriesSplit我遇到了这个方法-- TimeSeriesSplit --这是我需要使用的滑动窗口技术,还是仅仅是一个交叉验证器?

我对滑动窗口方法的理解:正如您在下面的图像中所看到的,我使用10:00到19:00的值来预测20:00的值,移动窗口以便现在包含这个新的值,然后预测21:00的值。这种情况一直在发生,直到训练结束。然后我做预测。

你的想法是什么?

EN

回答 1

Data Science用户

发布于 2019-03-27 12:51:41

尝试如下:

  1. 使数据稳定(去除趋势和季节性)。
  2. 对标签数据(例如: Load)进行PACF分析,找出最优的滞后值。通常,您需要知道如何解释PACF图。
  3. 将滑动窗口应用于整个数据(t+o,t+o),其中o是最优滞后值。
  4. 应用步行验证对模型进行训练和测试。

避免滑动窗口的方法是使用递归神经网络,但相信我,我建议的方法是值得的。

如果您想要代码:https://machinelearningmastery.com/time-series-forecasting-supervised-learning/

这也会有帮助:硕士论文研究适用于你的问题

票数 6
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/29173

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档