本期作者:Andrea Leccese
本期翻译:1+1=6 | 公众号翻译部成员
正文
近年来,机器学习得到了很大的发展和兴趣,在语音和图像识别方面取得了可喜的成果。本文分析了一种深度学习方法——LSTM在以标普500指数为代表的美国股市中的应用效果。结果表明:LSTM在语音识别等其他领域取得了良好的效果,但在金融数据应用中效果不佳。事实上,它的特点是高噪声信号比,这使得机器学习模型很难找到模式来预测未来价格。
什么是LSTM?
LSTM神经网络是一种特殊的深度学习模型。特别地它是一种可以学习数据长期依赖关系的递归神经网络,因此通常用于时间序列预测。
下图显示了LSTM层的体系结构:
如图所示,它由一个重复的核心模块组成。这种结构使得LSTM能够学习长期依赖关系。第一个LSTM块获取序列X(1)的网络初始状态和第一个时间步长,计算第一个输出h(1)和更新后的cell状态c(1)。在时间步t,屏蔽网络的当前状态 (c(t−1), h(t−1)) 和序列的下一个时间步X(t)和计算输出ht和更新后的细胞状态ct。
图2显示了LSTM的架构,它由4个主要组件组成:
为了了解建模任务的特性并进行预测,需要对LSTM进行训练。这个过程包括通过最小化一个目标函数(通常是RMSE),通过一些优化算法来计算LSTM的权重和偏差。一旦模型在初始训练数据集上训练并在验证集上验证,它就会在真实的样本外测试上进行测试。这确保了模型实际上学习了有用的特性,并且没有在训练集上过度拟合,对新数据的预测能力很差。下面我们将分析用标普500指数测试LSTM的性能。
LSTM在股市中的验证
使用的数据集由1950年1月3日至2019年1月4日以标准普尔500指数为代表的美国股市收盘价组成。60%用于训练,20%用于验证,20%用于测试。
下图显示了在日级别上用于分析的数据。
在我们的分析中,我们训练了一个由1个隐含层,20个神经元,20个值的时间序列长度组成的LSTM神经网络。我们尝试了不同组合的神经网络参数和架构,发现了相似的结果。
下图展示了实际价格与经过训练的LSTM预测的第二天价格的比较。
从图中可以看出,预测值与实际价格非常接近,无法很好地看到实际的基础价格。因此,LSTM似乎在预测所考虑的时间序列的下一个值方面做得很好。
表1告诉了LSTM在预测第二天价格时的性能统计数据。
这些数据证实了我们从上图中所看到的。RMSE中较低的值和R2中较高的值表明LSTM可以很好地预测考虑的时间序列的下一个值。
下图显示了从2018年8月13日到2019年1月4日,与预测价格相比的100个实际价格样本。
这个数字使我们得出一个不同的结论。总的来说,LSTM似乎可以有效地预测第二天的值,但实际上,对第二天的预测与前一天的实际值非常接近。如下图所示,实际价格与预测价格相比滞后了1天。
如图所示,这两个级数几乎相同,验证了我们之前的结论。
这些结果表明,LSTM不能预测第二天股市的价值。实际上,该模型所能做出的最佳猜测是一个几乎与当前价格相同的值。
结论
诚然,新的机器学习算法,尤其是深度学习算法,在不同领域取得了相当成功,但它们无法很好的预测股市。正如前面的分析所证明的,LSTM只是使用一个非常接近前一天收盘价的值来预测第二天的价值。这是一个没有预测能力的模型所期望的。
这也突显出尽管一些机器学习技术可能在金融领域有用,但针对对冲基金必须走另一条路,拿出能够为客户提供Alpha的策略。