首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >所有的分类模型在理论上和理想场景中的表现都是相似的吗?

所有的分类模型在理论上和理想场景中的表现都是相似的吗?
EN

Data Science用户
提问于 2021-08-06 22:51:41
回答 1查看 17关注 0票数 1

假设我们依靠无限的计算能力,无限的数据,我们有无限的时间等待一个模型的学习。在这种情况下,我们希望对一些数据二进制进行分类。

我的问题是:所有的分类模型(我们可以省略线性模型,因为它们无法学习非线性边界)是否都有类似的效果?换句话说,每个(非线性)分类算法的所有(原则上)可解问题都是相同的吗?你可以假设神经网络中任意数量的层和神经元,任意数目的树,任意深度的随机森林,等等。

我知道这个问题在现实、现实的世界里可能没有用,但我想知道,从理论上讲,有些模型会遇到一些其他模型不会遇到的具体障碍。

EN

回答 1

Data Science用户

发布于 2021-08-07 15:47:43

首先,这种理想的场景是有缺陷的,因为如果有无限数量的标签数据,并且有无限的时间可用,那么构建一个分类器就没有意义了:对于任何输入实例,人们迟早都可以在标记的数据中找到它的真正标签。

这个问题中的第二个问题是关于使ML模型有用的常见混淆:它的泛化能力。ML模型的目标不是对每个实例尽可能精确,而是提取所有实例的通用模式。这意味着简化数据,即忽略细微的变化,以便集中注意大趋势。一个没有泛化的模型是一个简单的实例集合,它没有真正了解任何东西。

这有什么关系?因为一个模型越复杂,它的泛化性就越小。例如,具有无限深度且没有最小实例数的决策树成为实例的集合。它仍然可以预测一个新的实例,但是它很可能会比一棵减少的树更适合并产生更多的错误。因此,如果将模型推向其最大的细节水平,那么在某一时刻,它的性能就会开始下降。

在某种程度上,人们可以将ML培训看作是在表示细节和泛化之间找到最佳平衡。不同类型的模型以不同的方式做到这一点,所以我认为不可能有任何理想的条件让它们都执行相同的操作。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/99803

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档