前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【应用】信用评分卡:分类问题

【应用】信用评分卡:分类问题

作者头像
陆勤_数据人网
发布2018-10-08 15:57:58
5790
发布2018-10-08 15:57:58
举报

笔者邀请您,先思考:

1 什么是有监督学习?

2 如何解决分类问题?

3 信用评分卡和分类问题的关系?

统计与数据挖掘中的分类问题

我必须说,当三岁以上的女孩Amishi宣布,她只是与我妻子的朋友而不是我交往时,我感到震惊。 分手的原因是我是男孩,女孩只能是女孩的朋友。 她从幼儿园的朋友那里学到了这种社会规范。 我还记得她几个月前在她的泳装和雨伞中为我塑造的方式。 她甚至意识到男孩女孩的差异,现在只是她学会了这个奇怪的社会规范。 这里的要点是,幼儿可以毫不费力地区分性别。 大自然为我们提供了一个内置的方程式,通过高度的精确性来进行性别分类。 想象一下类似的机制来区分好的和坏的借款人。 你在谈论每个银行家的梦想。

正如我在前面的文章中提到的,记分卡在统计和数据挖掘的分类问题上有其根源。 大多数分类问题的想法是创建一个数学方程来区分二元变量。 这些变量只能采用两个值,例如

  • 男性/女性
  • 好坏
  • 是/否
  • 上帝/魔鬼
  • 快乐/悲伤
  • 销售/无销售

名单可以继续直到永恒。 大多数商业问题试图模拟二分法的原因是它很容易理解我们人类。 我们必须认识到,二分法绝不是绝对的,并且对它们有着程度。 例如,我80%好,20%差 - 至少我想相信这一点。 我将保持帕累托的80-20原则远离这一点,即我的20%不好对我80%的行为负责。

信用记分卡开发 - 问题陈述和抽样

在信用记分卡的情况下,问题陈述是在好的和坏的借款人之间进行分析。因此,第一个任务是定义一个好的和不好的借款人。对于大多数贷款产品,信用良好和不良以下列方式定义

  • 1.良好的贷款:不错过EMI支付
  • 2.不良贷款:连续3次错过EMI(即90天过期)

此外,为了标记好人或坏人,你需要在很长一段时间内观察他或她的行为。根据贷款期限的不同,这个时间长度因产品而异。对于房屋贷款,期限为20年,2 - 3年是合理的观察期。 但是,对于上述定义没有什么神圣不可侵犯的,可以由分析师自行决定修改。Roll-rate analysis和vintage analysis是您在构建上述定义时可能需要考虑的两个分析工具。

信用评分卡抽样策略

几年前,我为孟买的一家大型德国航运和货运公司举办了为期一天的统计推断研讨会。在问答环节时,运营副总裁提出了一个棘手的问题,即获得良好精度的样本量是多少?他正在寻找一个通用的答案,我希望这很简单。样本量取决于相关人群的相似性或同质性程度。例如,你认为如何回答以下两个问题是一个很好的样本量?

1.什么是太平洋的盐度? 2.宇宙中有另一个智慧生命的星球吗?

就人口规模而言,宇宙中海洋和行星的数量下降是相似的。由于海洋的盐度相当稳定,几滴水足以回答第一个问题。另一方面,第二个问题是黑天鹅问题。你可能需要访问每一颗行星来统治我们的智能生命形式的可能性。

对于信用评分卡的开发,样本量的可接受经验法则是至少1000条好的和不良贷款的记录。没有理由不能建立样本量较小的记分卡(比如500条记录)。然而,分析师需要小心谨慎,因为在小数据样本中随机性程度越来越高。此外,建议保持样本窗口尽可能短,即在计分卡开发时保持一个或两个财政季度。此外,样品分为两部分 - 通常70%用于开发,剩余用于验证样品。我们将在本系列的后续章节中详细讨论开发和验证示例。

注意

在下一篇文章中,我们将讨论信用评分卡的变量分类和粗分类的一个重要主题。 下回见。

上一篇:信用评分卡:简介 下一篇:信用评分卡:变量选择

作者:Roopam Upadhyay 原文链接: http://ucanalytics.com/blogs/credit-scorecards-classification-problem-part-2/

版权声明:作者保留权利,严禁修改,转载请注明原文链接。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-08-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据科学与人工智能 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 统计与数据挖掘中的分类问题
  • 信用记分卡开发 - 问题陈述和抽样
  • 信用评分卡抽样策略
  • 注意
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档