当我运行我的三个不同的神经网络,我得到以下的学习曲线使用MSE。

我相信我的模型库是好的,不过分适合或不适合。此外,我认为我的模型小是由于高训练误差和高验证误差不适合。不过,我不太确定大模特儿。取MSE的平方根,模型大的训练集和验证集的RMSE均低于模型库。但从图片上看,从我在课堂上学到的知识来看,它仍然不适合吗?
这是正确的吗?我只是不明白模型如何表现良好,但它没有学习看图片。
提前谢谢你。
发布于 2021-12-16 04:44:13
根据学习曲线,当训练误差和验证误差都随着时间的增加而减小时,最好的模型是基模型。
现在你的小模特和大模特都不合身。这一点很明显,因为这两条曲线并不像它们在基本模型中所做的那样收敛。我想说,你构建的神经网络有问题。你可能在你的结构中遗漏了一些重要的东西(可能是交叉验证)。
发布于 2021-12-16 07:24:00
原则上,我同意model small和model big是不合适的。如果您提供更多关于数据的信息(样本数、目标变量的范围、预测器的数量、目标变量的数量、目标变量的分布和预测器的分布)来全面分析您所提供的图表,将会很有帮助。
要比较你展示的情节并不容易:
model base到底在哪里收敛。mean和std.dev.为每个模型绘制了三次运行图,那么分析就会更加可靠。另外,loss和mean_squared_error有什么区别?他们看起来是一样的。
https://datascience.stackexchange.com/questions/105136
复制相似问题