首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >学习曲线的解释-神经网络

学习曲线的解释-神经网络
EN

Data Science用户
提问于 2021-12-15 07:07:14
回答 2查看 134关注 0票数 0

当我运行我的三个不同的神经网络,我得到以下的学习曲线使用MSE。

我相信我的模型库是好的,不过分适合或不适合。此外,我认为我的模型小是由于高训练误差和高验证误差不适合。不过,我不太确定大模特儿。取MSE的平方根,模型大的训练集和验证集的RMSE均低于模型库。但从图片上看,从我在课堂上学到的知识来看,它仍然不适合吗?

这是正确的吗?我只是不明白模型如何表现良好,但它没有学习看图片。

提前谢谢你。

EN

回答 2

Data Science用户

发布于 2021-12-16 04:44:13

根据学习曲线,当训练误差和验证误差都随着时间的增加而减小时,最好的模型是基模型。

现在你的小模特和大模特都不合身。这一点很明显,因为这两条曲线并不像它们在基本模型中所做的那样收敛。我想说,你构建的神经网络有问题。你可能在你的结构中遗漏了一些重要的东西(可能是交叉验证)。

票数 0
EN

Data Science用户

发布于 2021-12-16 07:24:00

原则上,我同意model smallmodel big是不合适的。如果您提供更多关于数据的信息(样本数、目标变量的范围、预测器的数量、目标变量的数量、目标变量的分布和预测器的分布)来全面分析您所提供的图表,将会很有帮助。

要比较你展示的情节并不容易:

  1. 首先,y的范围在所有三个地块中都是不一样的。在第一幅图中,y范围上升到4.000.000,在另两幅图中,它在125.000到2.500之间,这使得很难判断model base到底在哪里收敛。
  2. 第二,您只提供一次运行。这可能是因为这次跑步特别幸运。如果他用meanstd.dev.为每个模型绘制了三次运行图,那么分析就会更加可靠。
  3. 最后,第一个模型是针对20时代训练的,而另外两个模型是为15训练的。

另外,lossmean_squared_error有什么区别?他们看起来是一样的。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/105136

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档