前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >时间序列预测中的八大挑战

时间序列预测中的八大挑战

作者头像
VachelHu
发布2023-02-28 15:51:16
1.3K0
发布2023-02-28 15:51:16
举报
文章被收录于专栏:时序人

本文转载自知乎

时间序列是一系列按时间排序的值,预测时间序列在很多真实工业场景中非常有用,有非常多的应用场景。预测时序的关键是观察时序之间的时间依赖性,发现过去发生的事情是如何影响未来的。然而这其中有不少挑战。

本文作者归纳历年来时序领域的研究论文,总结出以下八大挑战。这八大挑战几乎是能影响时序预测准确性的主要原因,解决这些问题对研究设计出好的时序预测模型非常有意义。

下面将为大家介绍。

非平稳性

平稳性是时间序列中的一个核心概念。如之前文章所介绍的,时序的统计量(比如均值,方差等)不随时间变化,则该时序是平稳的,因为其取值不依赖于时间位置。

许多现有的时序预测方法都假设时间序列是平稳的,但真实场景中趋势或季节性等因素都会破坏平稳性。一般我们需要转换时间序列,以减少这个问题,比如对时序进行差分、取对数等等。同时,也可通过几种方法检验时间序列是否平稳,如单位根检验(ADF)、KPSS-test 等。

预测步长过长

一般场景中,时序预测通常被定义为预测时序的下一个值。但提前预测多个步长在真实场景中有更重要的实际意义,帮助到真实的决策场景。

然而,预测更远的未来必然会增加不确定性,因此,预测更长的时间段,增加确定性,是预测任务中的一大挑战。

对罕见事件的关注

通常,我们会对时序数据中的罕见情况更加关注,这些一般处于分布的尾部。以能源生产为例,预测用电高峰对于管理电网的供需至关重要。

通常情况下,罕见的事件会带来重大的长期后果,典型的例子是股市崩盘,这些事件会导致许多投资者的财务破产。罕见的事件可能会影响数据分布,从而使当前的模型失效。关于这些情况以及它们是如何发生的信息很少,因此很难预测它们。

有几种方法可以改进极值的预测:

  • 使用成本敏感模型;
  • 利用面向极端情况的统计分布;
  • 重新采样训练数据的分布。

额外的依赖

除了数据本身的时间依赖之外,时间序列通常还有额外的依赖关系。比如时空数据,这是一个常见的例子,每个观察值在二维上是相关的,有自己的时间依赖性和附近位置空间依赖性。

这些时序由多个变量表示,额外变量可能包含宝贵的信息。因此,对它们进行建模对于提高预测性能可能至关重要。

变点

事物会随着时间的推移而变化,代表这些事物的时间序列的数据分布也是如此, 重大变化被称为变点。当它们突然发生时,这些变化被称为结构断裂。有时变化点是已知的,比如市场崩溃或战争爆发,这深刻影响了组织的运作方式。

随着时间的推移,分布已经改变了,那么旧的观察对新的状态就没有了指导意义,同时关于新分布所能获得的信息又很少。检测和适应变化对于保持模型最更新很重要。

低信噪比

直观地讲,信噪比量化了时间序列的可预测性。

信号是数据的相关部分,也是试图建模和理解的东西。但是,这个信号经常被噪音或看似随机的、不可预测的波动所掩盖。

有时候这种噪音可能是我们缺乏领域知识,不知道哪些因素影响了数据,或者这些因素很难量化。所以真实时间序列的变化看起来比较随机。典型的例子就是金融数据,低信噪比数据在真实世界中是普遍存在的。

噪声和缺失

噪声可能源于数据采集不足或错误。比如噪声、缺失值可能是由于设备故障引起的,传感器故障导致数据丢失或者存在干扰,导致错误读数。

噪声也可能是由于错误的标签而产生的,当注释者给数据分配了错误的标签时就会出现这种情况。噪音和缺失值会比较严重的影响模型的准确性,适当的预处理步骤可以帮助增强序列的信号,比如卡尔曼滤波器或指数平滑。

小样本量

有些时候,我们需要对拥有较少数据的时序进行分析,比如极端天气,患病记录等。这种情况下,算法可能没有足够的数据来建立适当的模型。

这个问题一方面是由于采样频率低所造成的。例如,时序只按月或按年观测,或者它们所代表的事物很少发生,是离散的数据点,比如极端天气事件。

数据的缺乏另一方面可能是由于变点引起的,如果发生重大变化,历史数据就会过时,需要反映新分布的新数据。又如零售行业的冷启动问题,新推出的产品信息没有历史的信息积累,数据很少但同样需要进行客群的定位和推送。

数据缺乏的问题一般可以通过全局预测模型来缓解,比如 Lightgbm,这些模型会利用许多同类型的时间序列来构建一个整体模型,用于对小样本数据情况进行分析预测。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-12-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 时序人 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档