我试图用rpart
包绘制一个决策树,并将其与其输出相混淆。值得注意的是,在第三个节点,如何从城市生产农业和矿业类?
我认为应该是农业和城市,而不是农业和采矿。这是我的密码
df<-read.csv("https://raw.githubusercontent.com/tuyenhavan/Statistics/Dataset/Landsat_Data.csv")
library(rpart)
library(rpart.plot)
set.seed(123)
dt<-rpart(Land_cover~., data=df)
rpart.plot(dt,cex=0.35)
请帮我解释一下。谢谢
发布于 2017-09-18 23:43:38
节点显示所有响应类别的相对频率以及多数表决,即最频繁的响应类别。在有联系的情况下,第一个最常见的类别显示为多数票(当然,这在某种程度上是武断的选择)。
因此,在根节点上,所有类别都以20%的相同频率出现,“农业”被显示为多数投票,因为它是第一类别。
同样,在节点3(对于Band1 >= 0.03599656)中,“城市”和“水”仍然是最常见的类别(200个观测值= 24.969%)。因此,“城市”被列为多数票。
https://stackoverflow.com/questions/46259455
复制相似问题