前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >来,我们告诉你:为什么不该使用LSTM预测股市

来,我们告诉你:为什么不该使用LSTM预测股市

作者头像
量化投资与机器学习微信公众号
发布2019-02-26 16:42:51
7.3K1
发布2019-02-26 16:42:51
举报

本期作者:Andrea Leccese

本期翻译:1+1=6 | 公众号翻译部成员

正文

近年来,机器学习得到了很大的发展和兴趣,在语音和图像识别方面取得了可喜的成果。本文分析了一种深度学习方法——LSTM在以标普500指数为代表的美国股市中的应用效果。结果表明:LSTM在语音识别等其他领域取得了良好的效果,但在金融数据应用中效果不佳。事实上,它的特点是高噪声信号比,这使得机器学习模型很难找到模式来预测未来价格

什么是LSTM?

LSTM神经网络是一种特殊的深度学习模型。特别地它是一种可以学习数据长期依赖关系的递归神经网络,因此通常用于时间序列预测。

下图显示了LSTM层的体系结构:

如图所示,它由一个重复的核心模块组成。这种结构使得LSTM能够学习长期依赖关系。第一个LSTM块获取序列X(1)的网络初始状态和第一个时间步长,计算第一个输出h(1)和更新后的cell状态c(1)。在时间步t,屏蔽网络的当前状态 (c(t−1), h(t−1)) 和序列的下一个时间步X(t)和计算输出ht和更新后的细胞状态ct。

图2显示了LSTM的架构,它由4个主要组件组成:

  • Input gate:控制单元状态更新
  • Forget gate:控制单元状态重置
  • Cell candidate:向单元格状态添加信息
  • Output gate:控制添加到隐藏门的单元格状态

为了了解建模任务的特性并进行预测,需要对LSTM进行训练。这个过程包括通过最小化一个目标函数(通常是RMSE),通过一些优化算法来计算LSTM的权重和偏差。一旦模型在初始训练数据集上训练并在验证集上验证,它就会在真实的样本外测试上进行测试。这确保了模型实际上学习了有用的特性,并且没有在训练集上过度拟合,对新数据的预测能力很差。下面我们将分析用标普500指数测试LSTM的性能。

LSTM在股市中的验证

使用的数据集由1950年1月3日至2019年1月4日以标准普尔500指数为代表的美国股市收盘价组成。60%用于训练,20%用于验证,20%用于测试。

下图显示了在日级别上用于分析的数据。

在我们的分析中,我们训练了一个由1个隐含层,20个神经元,20个值的时间序列长度组成的LSTM神经网络。我们尝试了不同组合的神经网络参数和架构,发现了相似的结果。

下图展示了实际价格与经过训练的LSTM预测的第二天价格的比较。

从图中可以看出,预测值与实际价格非常接近,无法很好地看到实际的基础价格。因此,LSTM似乎在预测所考虑的时间序列的下一个值方面做得很好。

表1告诉了LSTM在预测第二天价格时的性能统计数据。

这些数据证实了我们从上图中所看到的。RMSE中较低的值和R2中较高的值表明LSTM可以很好地预测考虑的时间序列的下一个值。

下图显示了从2018年8月13日到2019年1月4日,与预测价格相比的100个实际价格样本。

这个数字使我们得出一个不同的结论。总的来说,LSTM似乎可以有效地预测第二天的值,但实际上,对第二天的预测与前一天的实际值非常接近。如下图所示,实际价格与预测价格相比滞后了1天。

如图所示,这两个级数几乎相同,验证了我们之前的结论。

这些结果表明,LSTM不能预测第二天股市的价值。实际上,该模型所能做出的最佳猜测是一个几乎与当前价格相同的值。

结论

诚然,新的机器学习算法,尤其是深度学习算法,在不同领域取得了相当成功,但它们无法很好的预测股市。正如前面的分析所证明的,LSTM只是使用一个非常接近前一天收盘价的值来预测第二天的价值。这是一个没有预测能力的模型所期望的

这也突显出尽管一些机器学习技术可能在金融领域有用,但针对对冲基金必须走另一条路,拿出能够为客户提供Alpha的策略

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-01-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量化投资与机器学习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档