首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【应用】信用评分卡:逻辑回归

【应用】信用评分卡:逻辑回归

作者头像
陆勤_数据人网
发布2018-10-08 15:58:13
8110
发布2018-10-08 15:58:13
举报

笔者邀请您,先思考:

1 您理解逻辑回归分析?

逻辑回归入门 - 你快乐吗?

几年前,我和妻子在英格兰和苏格兰度过了几个星期的假期。就在登上英国航空公司的飞机之前,一名空姐告诉我们,我们已升级为商务舱。快乐!度假真是一个美好的开始。一旦我们登上飞机,我们又获得了另一个诱人的提议,可以进一步升级到头等舱。然而,这一次,有一个问题 - 只有一个座位可用。当然,这是一种耻辱,我们无法接受这个提议。在提供头等舱优惠之前,商务舱座位非常棒 - 顺便说一下,所有免费升级。这是行为经济学家描述为相对论和锚定的情况 - 用简单的英语比较。锚定或比较是企业定价策略的根源,也是所有人类悲伤的根源。然而,最终度假心情接管了,我们彻底享受了商务舱。人类在适应最终情况方面非常擅长并享受它。在最困难的情况下,你会发现一些最快乐的面孔。以下是亨利米勒的一句话:“我没有钱,没有资源,没有希望。我是最幸福的人“。人类的行为充满了异常 - 充满了谜题。以下是加强本论文的一个例子。

Lennon, McCartney, Harrison, 和 Best 是这个星球上最着名的乐队 - 甲壳虫乐队的成员。 好的,我知道你发现了这个错误。 到现在为止,你必须说出正确的名字:John Lennon,Paul McCartney,George Harrison和Ringo Starr,而不是Pete Best。 实际上,Ringo Starr是Pete Best的替代品,Pete Best是甲壳虫乐队的原始常规鼓手。 皮特一定是被摧毁了,看到他的伙伴们在落后的时候冉冉升起。 错了,在Google上搜索他 - 他是所有人中最快乐的披头士乐队。 现在这是违反直觉的,我想我们不知道是什么让我们开心。

正如在前一篇文章中所承诺的那样,在本文中,我将尝试使用逻辑回归来探索幸福 - 这种技术广泛用于记分卡开发。

Logistic回归 - 一个实验

我是一位彻底的经验主义者 - 支持基于事实的管理。 因此,让我设计一个快速而肮脏的实验来生成数据来评估幸福感。 我们的想法是确定影响我们整体幸福感的因素/变量。 让我列出一个生活在城市中的工作成年人的代表性因素列表:

现在,在上面的列表中加入一些其他因素,例如 - 善意的随机行为或对朋友的无计划访问。 如您所见,上面的列表可以很容易地扩展(回想一下关于变量选择的文章 - 文章3)。 这是一个代表性的清单,您必须创建自己的清单,以找出影响您的幸福水平的因素。

实验的第二部分是收集数据。 这就像维护日记只有这一个将在Microsoft Excel中。 每天晚上睡觉之前,你可以评估你的一天,并填写电子表格中的数字以及当天的整体幸福水平(如下图所示)。

经过几年的数据收集,您将有足够的观察来创建模型 - 在这种情况下的逻辑回归模型。 我们试图在上面的数据集中用其他列(C到I)模拟幸福感(B列)。 如果我们在Y轴上绘制B并且在X轴上绘制C到I的加法组合(我们将其称为Z),它将看起来像下面所示的图。

逻辑回归背后的想法是以这样的方式优化Z,使得我们在快乐和悲伤面孔之间得到最佳区分,如上图所示。这是一个曲线拟合问题,其中sigmoid函数(紫色曲线)作为函数的选择。

我建议在我们的模型中使用观察日期(A栏);这可能会给季节带来有趣的影响。

银行和金融业的应用

这正是我们在分析记分卡(例如信用评分卡,行为评分卡,欺诈评分卡或购买倾向模型)的情况下所做的事情。用来替换快乐和悲伤的面孔

  • 好的和坏的借款人
  • 欺诈和真实案件
  • 买家和非买家

对于相应的情况,你有模型。如果您记得上一篇文章4,我已经展示了一个简单的信用记分卡模型:信用评分=年龄+贷款与价值比率(LTV)+分期付款(EMI)与收入比率(IIR)

Sigmoid函数的直接转换将帮助我们得到线的上述等式。这是到达所需评分卡的最后一个链接。

信用评分卡中的变量转换

我喜欢电影Kill-Bill这两部分。 在第一部分中,当Uma Thurman的角色去日本从传说中的剑士HattoriHanzō手中拿剑时,我很享受。 在了解了她的动机之后,他同意为她做出最好的剑。 然后电影导演昆汀·塔伦蒂诺(Quentin Tarantino)简要介绍了制作剑的过程。 HattoriHanzō将一块普通的铁片变成了神话般的剑 - 这真是一个工匠。 这与分析师如何将S形函数转换为线性方程非常相似。 不同之处在于,分析师使用数学工具而不是锤子,并不像HattoriHanzō那样具有传奇色彩。

拒绝推理

拒绝推断是信用或应用记分卡的一个显着方面,它与所有其他分类模型不同。 对于应用记分卡,由于拒绝贷款缺乏绩效,开发样本存在偏差。 拒绝推断是一种纠正这一缺点并消除样本偏差的方法。 我们将在后面有关您的CANalytics的文章中详细讨论拒绝推断。

总结

现在我们已准备好评分卡,下一个任务是验证评分卡的预测能力。 这正是我们将在下一篇文章中做的。 再见。

参考资料

  1. Credit Risk Scorecards: Developing and Implementing Intelligent Credit Scoring – Naeem Siddiqi
  2. Credit Scoring for Risk Managers: The Handbook for Lenders – Elizabeth Mays and Niall Lynas

作者:Roopam Upadhyay

原文链接

http://ucanalytics.com/blogs/credit-scorecards-logistic-regression-part-5/

版权声明:作者保留权利,严禁修改,转载请注明原文链接。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-08-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据科学与人工智能 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 逻辑回归入门 - 你快乐吗?
  • Logistic回归 - 一个实验
  • 银行和金融业的应用
  • 信用评分卡中的变量转换
  • 拒绝推理
  • 总结
  • 参考资料
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档