首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >ROSE(玫瑰):基于分解频率学习的寄存器辅助通用时间序列预测

ROSE(玫瑰):基于分解频率学习的寄存器辅助通用时间序列预测

作者头像
时空探索之旅
发布2024-11-19 16:50:49
发布2024-11-19 16:50:49
4090
举报
文章被收录于专栏:时空探索之旅时空探索之旅

论文标题:ROSE: REGISTER-ASSISTED GENERAL TIME SERIES FORECASTING WITH DECOMPOSED FREQUENCY LEARNING

下载地址https://arxiv.org/abs/2405.17478

1 背景

时间序列预测基础模型近年来备受关注。尽管当前提升模型泛化能力的常见方法之一是增加训练数据量和模型参数,但该文章提出,除了这种途径之外,探索模型设计的优化,特别是在预训练任务和下游任务适应性方面,同样能够在较小规模的模型中实现与大模型相当甚至更优的效果。

基于以上两点,作者提出了基于频率分解学习与时间序列寄存器的通用时间序列预测模型ROSE。ROSE通过多重频域掩码和重构,分解时间序列中耦合的语义信息,获得跨领域的统一表征。时间序列寄存器在预训练期间捕捉领域特定的信息,并在下游任务中自适应选择相关领域的信息,由此实现高效迁移。因此,相较于现有时序预测基础模型,ROSE在使用更少参数和更短推理时间的情况下,仍展现出了卓越的预测性能。

2、模型结构

ROSE整体基于Encoder-Decoder架构。值得注意的是,重构解码器和预测解码器采用与 Transformer Encoder相同的结构,它们分别用于重构和预测任务。模型采用通道独立的方式,在多领域的大规模时序数据上进行预训练。

时间序列寄存器:作者将多领域数据集中的领域特异信息进行聚类,并在预训练时将这些领域特异信息存储在时间序列寄存器中。在下游,通过 Top-K选择策略,自适应地从寄存器中选择特定领域的信息,以提高在目标领域的预测性能。此外,作者还通过一种新颖的可学习低秩矩阵来在微调阶段补充下游数据集的特定信息。

频率分解学习:时间序列数据由多个叠加的频率分量组成,导致不同时间变化相互重叠。低频成分包含整体趋势和较长尺度变化的信息,而高频成分通常包含短期波动和较短尺度变化的信息。因此,分别从低频和高频理解时间序列有利于一般时间序列表示学习。基于上述观点,作者提出了多重频域掩码,根据多个采样阈值,对频域中的时间序列随机进行低频/高频掩码,然后将其转换回时域进行重构。

双任务预训练:ROSE在0.8B的时间序列样本点上进行预训练,文中作者将预测任务与重构任务联合对模型进行预训练,前者是为了提高模型在零样本和少样本环境下的预测能力,后者使用多重频域掩码来学习更适用于下游预测任务的统一特征。

3、实验效果

文中在多个数据集上比较了ROSE与当前SOTA模型在full-shot设置下的表现,结果显示ROSE取得了显著的优势。值得一提的是,即使在10%的few-shot设置下,ROSE的表现仍优于SOTA模型在full-shot设置下的效果。

进一步观察ROSE在不同fine-tune比例下的表现,可以发现多领域数据的预训练赋予了ROSE出色的泛化能力,且仅需少量fine-tune样本即可达到SOTA性能。

与其他时序预测基础模型在zero-shot设置下的对比中,ROSE也展现出了极具竞争力的表现。

END

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-10-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 时空探索之旅 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档