在金融市场,一个简单的问题是,不同国家的交易日历各不相同。例如,瑞典庆祝瑞典国庆节,挪威星期一庆祝瑞典国庆节。通常情况下,股票市场的一个时间序列因为假日的“休市”而赶上了第二天市场再次开放的时间序列。
例如:
+-----------------+------------+------------+------------+------------+
| Date | SEK 1 | SEK 2 | NOK 1 | NOK 2 |
+-----------------+------------+------------+------------+------------+
| Date 1 | + 0.2% | +0.4% | +0.3% | +0.6% |
| Date 2 | + 1.1% | +0.7% | +0.3% | +2.1% |
| Date 3 | -3.2% | -2.9% | NaN | NaN |
| Date 4 | +0.1% | -0.2% | -2.8% | -1.6% |
+-----------------+------------+------------+------------+------------+
我的模型的目标是调整日期3和4的NOK回报,因为NOK的日期3和4已经被NOK假期扭曲了。为了做到这一点,我将使用尽可能多的好日期,例如日期1,并通过随机删除一些数据、调整后续日期和使用删除的调整作为输入来构建一个大型数据集,显然我知道有监督的输出是真实的数据。
我觉得这很适合神经网络,但我从来没有构造过一个输入退出的神经网络。
在缺少的输入数据点对这一轮的权重没有影响的情况下,建立网络是否合适?在默认情况下,是否有任何神经网络(或全部)可以做到这一点?
发布于 2020-08-13 07:48:53
没有什么特别的理由认为神经网络是合适的,如果有的话,它可能会太多(取决于你的时间序列的复杂性)。
在任何情况下,你都需要处理你的南值,如果你想要一个快速的模型,这是自动的,我建议lgbm。因为它会将最大限度地减少折叠损失的值归责于NAN (作出高度最优的估算)。
发布于 2020-08-13 11:34:04
我不认为这个银行假日在你的数据应该被视为失踪或南。在那些日子里,市场实际上是“不交易”。这本身就是数据集的固有信号,模型可能会更好地进行推理。因此,应该显式地将其设置为零。
如果有足够大的数据集,并且就神经网络而言,LSTM模型可以很好地为您提供服务,以便捕获其他许多您可能无法确定的漂移。本教程可能是您的用例利弊的一个极好的起点。
https://datascience.stackexchange.com/questions/80201
复制相似问题