首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >fancyRpartPlot决策树中节点顶部的数字是什么意思?

fancyRpartPlot决策树中节点顶部的数字是什么意思?
EN

Stack Overflow用户
提问于 2017-08-08 21:54:26
回答 3查看 2.3K关注 0票数 4

fancyRpartPlot决策树中节点顶部的数字是什么意思?我已经在下面的图片中突出显示了它们。

我的猜测是它们是节点的顺序/等级,但我无法解释数字中的跳跃(在本例中,缺少9-11 )。

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2017-08-10 16:19:46

树中每个节点顶部的数字对应于默认print()方法生成的树的文本表示形式中的分支编号。要确认:

代码语言:javascript
运行
复制
> dt <- rpart::rpart(Species ~ ., iris)
> print(dt)
n= 150 

node), split, n, loss, yval, (yprob)
      * denotes terminal node

1) root 150 100 setosa (0.33 0.33 0.33)  
  2) Petal.Length< 2.45 50   0 setosa (1.00 0.00 0.00) *
  3) Petal.Length>=2.45 100  50 versicolor (0.00 0.50 0.50)  
    6) Petal.Width< 1.75 54   5 versicolor (0.00 0.91 0.093) *
    7) Petal.Width>=1.75 46   1 virginica (0.00 0.022 0.98) *
> rattle::fancyRpartPlot(dt)

“跳转”是由于rpart()调优树以删除一些分支而产生的,这些修剪后的分支不会出现在最终的树中。

票数 5
EN

Stack Overflow用户

发布于 2017-08-08 22:06:32

fancyRpartPlot只是prp的一个包装器。查看prp的源代码,它看起来像是由以下人员创建的节点号:

代码语言:javascript
运行
复制
  if(nn || ni)
        draw.node.numbers(nn, ni, draw.shadows1, type, branch,
                Margin, xflip, yflip, cex,
                main, sub, col.main, cex.main, col.sub, cex.sub,
                xlim, ylim, node.xy, is.leaf, nodes,
                node.labs, font,  family, box.col, border.col, shadow.col,
                under.cex, under.font, under.ygap, ygap,
                split.labs, split.cex * cex, split.font, split.family, split.box.col,
                split.border.col, split.shadow.col,
                nn.cex, nn.font, nn.family, nn.col, nn.box.col,
                nn.border.col, nn.lty, nn.lwd, nn.round,
                split.adj, split.space, split.yspace, split.yshift,
                yshift, adj, space, yspace, shadow.offset,
                nn.adj, nn.yshift, nn.space, nn.yspace, bg)

list(node.boxes=node.boxes, split.boxes=split.boxes)

https://github.com/cran/rpart.plot/blob/master/R/prp.R

您还可以在代码中找到关于这一点的一些注释

票数 0
EN

Stack Overflow用户

发布于 2018-04-11 16:08:00

每个节点的顶部数字表示大多数类别/类id。在您的示例中,起始节点0.4 (或40%)是类别值"2“。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45570298

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档