前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >R语言拟合决策树模型分析

R语言拟合决策树模型分析

作者头像
R语言数据分析指南
发布2023-09-11 08:52:58
2260
发布2023-09-11 08:52:58
举报
文章被收录于专栏:R语言数据分析指南

❝本节来介绍如何使用R语言来进行「逻辑回归与决策树模型分析」,下面小编通过一个案例来进行展示,结果仅供展示用,希望各位观众老爷能够喜欢。。❞

加载R包

代码语言:javascript
复制
library(tidyverse)
library(caTools)

导入数据

代码语言:javascript
复制
creditcard_data <- read_csv("creditcard.csv")

数据清洗

代码语言:javascript
复制
creditcard_data$Amount = scale(creditcard_data$Amount) # 对Amount列进行标准化处理
NewData = creditcard_data[, -c(1)]

构建模型

代码语言:javascript
复制
set.seed(123) # 设置随机种子,以确保可重复性
# 使用sample.split函数对数据进行分割,80%用于训练,20%用于测试
data_sample = sample.split(NewData$Class, SplitRatio = 0.80)

train_data = subset(NewData, data_sample == TRUE) # 创建训练数据集
test_data = subset(NewData, data_sample == FALSE) # 创建测试数据集

# 使用逻辑回归模型进行训练,并将模型存储在Logistic_Model变量中
Logistic_Model = glm(Class ~ ., test_data, family = binomial())
summary(Logistic_Model) # 显示逻辑回归模型的摘要信息
plot(Logistic_Model) # 绘制逻辑回归模型的图形

绘制ROC曲线评估模型有效性

代码语言:javascript
复制
library(pROC)
lr.predict <- predict(Logistic_Model,test_data, probability = TRUE)
auc.gbm = roc(test_data$Class, lr.predict, plot = TRUE, col = "blue")

构建决策树

代码语言:javascript
复制
library(rpart) 
# install.packages("rpart.plot")
library(rpart.plot) # 用于决策树的可视化
代码语言:javascript
复制
# 使用决策树模型进行训练,并将模型存储在decisionTree_model变量中
decisionTree_model <- rpart(Class ~ . , creditcard_data, method = 'class')
# 使用决策树模型进行预测,将预测值存储在predicted_val变量中
predicted_val <- predict(decisionTree_model, creditcard_data, type = 'class')
# 计算预测的概率,并存储在probability变量中
probability <- predict(decisionTree_model, creditcard_data, type = 'prob')
rpart.plot(decisionTree_model) # 使用rpart.plot函数绘制决策树模型
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-09-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 R语言数据分析指南 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 加载R包
  • 导入数据
  • 数据清洗
  • 构建模型
  • 构建决策树
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档