p=14056
本文为了说明回归树的构造(使用CART方法),考虑以下模拟数据集,
> set.seed(1)
> n=200
> X1=runif(n)
> X2=runif(n)
> P=.8*...要计算基尼系数
我们只需构造列联表,然后计算上面给出的数量。首先,假设只有一个解释变量。我们将样本一分为二,并使用所有可能的分割值
然后,我们为所有这些值计算基尼系数。结是使基尼系数最大化的值。...我们通过寻找最佳第二选择来重申:给定一个根节点,考虑将样本一分为三的值,并给出最高的基尼系数,
也就是说,我们在上一个结的下方或上方分割。然后我们进行迭代。...等,现在,让我们将代码与标准R函数进行比较,
node), split, n, deviance, yval
* denotes terminal node
1) root 200 49.8800...,mg,pch=19,col="red")
+ segments(u1[which.max(gini[,1])],mg,u1[which.max(gini[,1])],-100000)