首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >修剪枝条树

修剪枝条树
EN

Stack Overflow用户
提问于 2015-09-18 06:39:19
回答 1查看 769关注 0票数 0

我试图使用R中的rpart包创建一个决策树,以达到我使用plotcp函数的树的最佳深度。当我使用printcp分析交叉验证的结果时,除其他细节外,我得到以下消息:

根节点错误: 3599.8/14399 = 0.25

我的课不平衡( 1-75%,2-25%).因此,rpart似乎正在做的是,使用默认的阈值0.5。而且,由于没有一个节点对于类C2有一个prob > 0.5,所以它们都被归类为C1。

难道我不可能指定概率阈值吗?例如,对于C2,如果prob > 0.35,将其归类为C2。

EN

回答 1

Stack Overflow用户

发布于 2016-08-01 11:36:22

您收到的信息是:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Root node error: 3599.8/14399 = 0.25

不是一个错误。它是“printcp”标准输出的一部分,只是简单地显示了数据中每个观测值的平均误差。你大概有14,399个观测结果。如果您正在进行分类,那么所使用的错误度量可能是GINI。您的树可能做得很好-我们看不到,因为您还没有张贴您的CP表的其余部分。

同样,如果您使用的是分类(例如,您的公式中的主题是一个因素,或者您使用了书面方法= 'class'),那么属于每个节点的观测数据的分类是根据大多数。事实上,如果所有的叶节点都在同一个类中占大多数,那么发送到树下的所有东西都将按照这个类进行分类。你可以用体重来鼓励不同的行为。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/32654716

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文