p=17950 
在本文中,我们使用了逻辑回归、决策树和随机森林模型来对信用数据集进行分类预测并比较了它们的性能。...让我们将分类变量转换为因子变量,
> F=c(1,2,4,5,7,8,9,10,11,12,13,15,16,17,18,19,20)
> for(i in F) credit[,i]=as.factor...i_test=sample(1:nrow(credit),size=333)
> i_calibration=(1:nrow(credit))[-i_test]
我们可以拟合的第一个模型是对选定协变量的逻辑回归...不出所料,与逻辑回归相比,模型性能较低。一个自然的想法是使用随机森林优化。...在这里,该模型(略)优于逻辑回归。