在本文中,我们使用了逻辑回归、决策树和随机森林模型来对信用数据集进行分类预测并比较了它们的性能
数据集是
credit=read.csv("gecredit.csv", header = TRUE, sep...1,2,4,5,7,8,9,10,11,12,13,15,16,17,18,19,20)
> for(i in F) credit[,i]=as.factor(credit[,i])
现在让我们创建比例为1:2 的训练和测试数据集...> i_test=sample(1:nrow(credit),size=333)
> i_calibration=(1:nrow(credit))[-i_test]
我们可以拟合的第一个模型是对选定协变量的逻辑回归...Purpose +
Length.of.current.employment +
Sex...Marital.Status, family=binomia
基于该模型,可以绘制ROC曲线并计算AUC(在新的验证数据集上...、决策树和随机森林对信贷数据集进行分类预测》。