我读过一些关于PCA应用于时间序列的文章,但仍然有些困惑,我有以下问题(假设我正在处理50个行业返回的时间序列,我想使用聚类算法将它们分成几个组):
欢迎任何暗示或想法,谢谢。
发布于 2021-03-19 12:56:02
通常,在Stack溢出或任何其他姐妹网站上询问任何问题的标准是,除非它们非常相似,否则只能问一个问题,而在这种情况下似乎并非如此。
为了回答您的问题,X^TX被称为样本协方差(或相关)矩阵,其中X是维数(m,d)的数据矩阵。因此,生成的矩阵具有(d,d)维数,其中d是特征空间的维数。
正如您所说的,这个矩阵是通过一个内胚层得到w\cap w^{-1},其中\cap是一个特征值的对角线矩阵,按递减顺序排列,w是根据相应的特征值叠加的归一化特征向量。人们可能想选择一些k维数的原因是为了降低维数。
降维带来了多方面的好处--降低空间复杂度,加快计算速度等。当你专门谈论时间序列时,问题就出现了。PCA、ICA不考虑可能导致数据存在次优预测的时间相依性。解决这一问题的方法有很多种,人们可能希望使用可预测分量分析、自动编码器等来确保它们不仅获得PCA所提供的好处,而且还能确保避免PCA的问题。
为了回答第二个问题,我不确定原因,但是人们可能想要放弃第一个主体,因为它是在最大方差的方向,也就是说,它在这个方向上变化最大。
https://datascience.stackexchange.com/questions/90871
复制相似问题