前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >R分类算法-Logistic回归算法

R分类算法-Logistic回归算法

作者头像
Erin
发布2018-01-09 10:58:52
8860
发布2018-01-09 10:58:52
举报
文章被收录于专栏:大数据风控大数据风控

逻辑回归 Logistic Regression

所谓LR,就是一个被Logistic方程归一化后的线性回归,可以将非线性的问题转化为线性问题。 优点: 算法易于实现和部署,执行效率和准确度高 缺点: 离散型的数据需要通过生产虚拟变量的方式来使用。 R API glm(formula,data)

  • formula 建模表达式
  • data 训练数据

glm会自动帮我们把变量离散化,不需要自己设置虚拟变量了。

代码实现:

代码语言:javascript
复制
data <- read.csv("customers.csv")
data <- data[data$Gender!='NULL' & data$Marital.Status!='NULL',]
data <- data[, colnames(data)!='CustomerID']

formula <- Home.Ownership ~ .;

total <- nrow(data)
index <- sample(1:total, total*0.7)

data.train <- data[index, ]
data.test <- data[-index, ]

data.train.glm = glm(
  formula = formula, 
  data = data.train,
  family='binomial'
)

data.test.predict <- predict(
  data.train.glm, 
  newdata = data.test,
  type="response"
)

data.test.predict <- ifelse(data.test.predict>0.5, "Rent", "Own")

table(data.test$Home.Ownership, data.test.predict)
data.test.predict
       Own Rent
  Own  537   93
  Rent  87  227
prop.table(table(data.test$Home.Ownership, data.test.predict), 1)
 Own      Rent
  Own  0.8523810 0.1476190
  Rent 0.2770701 0.7229299
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017年07月24日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 逻辑回归 Logistic Regression
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档