文章/答案/技术大牛

发布

社区首页 >问答首页 >学习曲线的解释-神经网络

问学习曲线的解释-神经网络
EN

Data Science用户

提问于 2021-12-15 07:07:14

回答 2查看 134关注 0票数 0

当我运行我的三个不同的神经网络，我得到以下的学习曲线使用MSE。

我相信我的模型库是好的，不过分适合或不适合。此外，我认为我的模型小是由于高训练误差和高验证误差不适合。不过，我不太确定大模特儿。取MSE的平方根，模型大的训练集和验证集的RMSE均低于模型库。但从图片上看，从我在课堂上学到的知识来看，它仍然不适合吗？

这是正确的吗？我只是不明白模型如何表现良好，但它没有学习看图片。

提前谢谢你。

machine-learning

neural-network

回答 2

Data Science用户

发布于 2021-12-16 04:44:13

根据学习曲线，当训练误差和验证误差都随着时间的增加而减小时，最好的模型是基模型。

现在你的小模特和大模特都不合身。这一点很明显，因为这两条曲线并不像它们在基本模型中所做的那样收敛。我想说，你构建的神经网络有问题。你可能在你的结构中遗漏了一些重要的东西(可能是交叉验证)。

票数 0

Data Science用户

发布于 2021-12-16 07:24:00

原则上，我同意model small和model big是不合适的。如果您提供更多关于数据的信息(样本数、目标变量的范围、预测器的数量、目标变量的数量、目标变量的分布和预测器的分布)来全面分析您所提供的图表，将会很有帮助。

要比较你展示的情节并不容易：

首先，y的范围在所有三个地块中都是不一样的。在第一幅图中，y范围上升到4.000.000，在另两幅图中，它在125.000到2.500之间，这使得很难判断model base到底在哪里收敛。
第二，您只提供一次运行。这可能是因为这次跑步特别幸运。如果他用mean和std.dev.为每个模型绘制了三次运行图，那么分析就会更加可靠。
最后，第一个模型是针对20时代训练的，而另外两个模型是为15训练的。

另外，loss和mean_squared_error有什么区别？他们看起来是一样的。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/105136

复制

相似问题

问学习曲线的解释-神经网络
EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问学习曲线的解释-神经网络EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问学习曲线的解释-神经网络
EN