我为我的论文做了一些预测(股票)。我只使用了固定数量的600个样本(这是无法改变的)。由于数据集较小,我只做了训练和测试拆分(没有验证等)。我发现一些设置在训练和测试中都获得了非常好的结果(MAPE和R2)。但我只有列车组的损失曲线。我想知道这是否足够了,还是必须同时具有训练和验证损失曲线?
由于这个想法,我把它分成三部分(10%的坚持测试),70%的训练和20%的验证。在那里,我有两条损失曲线,并且我在训练Val和测试中获得了良好的MAPE分数(这三个分数都在3-5%左右),只有R2在val集(0,7和训练/测试0,95)中很差。
那么,我可以使用第一个选项,并且只使用列车损失曲线吗?
发布于 2020-06-16 01:38:53
如果您只在一个数据模型上进行训练,我认为在这种情况下不需要验证集。据我所知,如果你在多个不同的模型上训练,验证集会更有用,这将帮助你决定哪一个是最合适的。
https://machinelearningmastery.com/difference-test-validation-datasets/
https://stackoverflow.com/questions/58816165
复制相似问题