前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据分析之Logistic回归

数据分析之Logistic回归

作者头像
黄成甲
发布2018-09-12 15:06:54
7920
发布2018-09-12 15:06:54
举报
文章被收录于专栏:黄成甲

所有的线性回归分析中,因变量的类型都是连续变量,如果需要预测的变量类型为分类变量,则需要采用回归分析中的Logistic回归。

文/黄成甲

Logistic回归是针对因变量为分类变量而进行回归分析的一种统计方法,属于概率型非线性回归。在线性回归中,因变量是连续变量,那么线性回归能够根据因变量和自变量之间存在的线性关系来构建回归方程。但是,一旦因变量是分类变量,那么因变量与自变量之间就不存在这种线性关系了。这个时候就需要通过某种变换来解决这个问题,这个变换称为对数变换。

对数变换的目的就是将非线性问题转换为线性问题,这样就能够使用线性回归相关理论和方法来解决非线性回归的问题。

分类变量包括二分类和多分类。

(1)二分类:就是两个分类状态,例如用户是否购买商品、用户是否流失等都属于二分类;

(2)多分类:就是具有多个类别的状态,例如客户价值分类,可分为高价值客户、中价值客户、低价值客户。

二分类Logistic回归,也就是因变量只有两个分类值:1和0,对应“是”和“否”,或者“发生”,和“未发生”这样的状态。在模型预测中,我们不是直接得到分类值1和0,而是以发生的可能性大小来衡量。换句话说,就是得到一个介于0和1之间的概率值P,我们使用这个概率值P来进行预测因变量出现某个状态的可能性。

当概率值P大于等于0.5,且小于等于1,则因变量对应的分类值1,即“是”或“发生”;

当概率值P小于0.5,且大于等于0,则因变量对应的分类值0,即“否”或“未发生”。

Logistic回归应用场景

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018.09.01 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档