我一直在试图理解这种滑动窗口技术,但没有效果,而且真的不确定我将如何实现它。
我的数据集:我有一年电力负荷的小时值(超过8700个数据点)-下图。我将把数据集分成训练集(1月1日至9月30日)和测试集(10月1日至12月31日)。
我将使用有监督的学习技术,如回归树和随机森林(基本上是我在科学知识学习中可以得到的任何东西),在训练集上训练它们,然后对测试集进行预测。
我知道我需要使用历史已知的值作为输入特性来输入到模型中。因此,我创建了"Load_lagN“。
的滑动窗口。
对于滑动窗口模型,这是否假设过去的n值(在我的例子中是10)是相关的?
如果我已经将我的数据集分割成一个训练和测试集,那么回归树是如何被训练的,然后在测试集中进行预测(现在我将坚持提前一步预测),同时实现这种滑动窗口技术?
http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.TimeSeriesSplit.html#sklearn.model_selection.TimeSeriesSplit我遇到了这个方法-- TimeSeriesSplit --这是我需要使用的滑动窗口技术,还是仅仅是一个交叉验证器?
我对滑动窗口方法的理解:正如您在下面的图像中所看到的,我使用10:00到19:00的值来预测20:00的值,移动窗口以便现在包含这个新的值,然后预测21:00的值。这种情况一直在发生,直到训练结束。然后我做预测。
你的想法是什么?

发布于 2019-03-27 12:51:41
避免滑动窗口的方法是使用递归神经网络,但相信我,我建议的方法是值得的。
如果您想要代码:https://machinelearningmastery.com/time-series-forecasting-supervised-learning/
这也会有帮助:硕士论文研究适用于你的问题
https://datascience.stackexchange.com/questions/29173
复制相似问题