前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【应用】信用评分卡:模型验证

【应用】信用评分卡:模型验证

作者头像
陆勤_数据人网
发布2018-10-08 15:59:51
8970
发布2018-10-08 15:59:51
举报

笔者邀请您,先思考:

1 信用评分卡如何做模型验证?

过上你的生活只有两种方式。 一个好像什么都不是奇迹。 另一个就好像一切都是奇迹。- 艾尔伯特爱因斯坦

好奇心评论

我认为欣赏和享受琐事的最佳方式是旅行。当我说琐碎的时候,它包括门把手,海报,信箱,涂鸦以及我们从未在我们自己的城市中转过头来做的一切。上周我与妻子一起在佛罗伦萨和托斯卡纳旅行时经历了同样的经历。我认为一个人的意识水平和好奇心在旅行时会增加很多倍。在佛罗伦萨,我们住在Fiorenza,它可爱并有早餐。早餐很好,人们甚至更好。在那里,我们遇到了这个来自英国的友好家庭,一个名叫Owen的婴儿和他7岁的妹妹Kyra。欧文和凯拉在吃早餐时玩捉迷藏。凯拉反复躲在同一把椅子后面,跳出来向她的弟弟透露自己。欧文在这个过程中每次都感到惊喜。所有人都天生好奇。然而,随着年龄的增长和熟悉事物,他们会失去它。这种现象可能是我们永远不会为自己城市中的琐事而烦恼的原因。

好奇心与数据科学事业

充满好奇和意识需要不断的精力和努力。也许,人类有自然倾向于陷入低能量状态。尽管如此,这对分析师来说尤其危险,因为他们的工作需要在对他人而言看似平凡的事情中找到意义。在我看来,分析的最大挑战不是统计算法的复杂性和计算能力的提高,而是让其从业者保持好奇并不断提出问题。禅宗佛教徒试图通过生活在当下来实现宇宙意识。如果这太难了,我建议把你的工作当作一个很棒的旅游目的地,做个好游客 - 好奇又有意识。

好的,所以这与我们对评分卡的最初讨论有点迂回。但是,有几个原因告诉你上面的内容:主要是告诉你为什么我在发布这个系列的这一部分时迟到了。其次,我希望我们讨论一般对工作和生活充满好奇的重要性和挑战。我已经有一些例子,即路易斯巴斯德和爱德华洛伦兹,但这是为了以后。

现在,让我们继续讨论这个部分的主题,即模型评估

模型验证和评估

当我在高中时,我在暑假期间加入了板球学院。 Cricket是一款与棒球非常相似的游戏。我将在括号中使用棒球术语,让每个人都能理解。训练营的设计是训练大约一个月,然后与来自另一个俱乐部的相同技能水平的孩子进行完整的比赛。在营地里有一个高大瘦弱的孩子和我们在一起;在训练期间,他一直是明星投手(投手)。他过去常常把一些最好的Yorkers(曲线球)弄成一团糟。我们非常肯定他会在游戏中胜过每个人。我们要求他打开bowling,他的第一个bowling去了六个(本垒打),然后是几个。也许这是混合比赛压力,期望和人群,但他的表现是绝对的灾难。后来教练告诉我们发生的事情并不罕见,他以前曾多次见过这件事。在更高的级别,游戏不是在地面上播放,而是在耳朵之间的空间播放。显然,他指的是球员的思想和气质。

模型验证的抽样策略

正如俗名所说,布丁的考验就在于吃。一个人可能是训练场上的明星,但在比赛情况下完全失败了。对于分析模型也是如此。经过一轮训练(系列的第5部分)后,模型经过了几轮测试。

1.样本外测试:记住第2篇文章,我们将样品分成培训和测试样品。第一级测试发生在保持或测试样本上。测试样本需要与训练样本一样好。让我们在下一节回到这一点,我将讨论性能和ROC曲线的措施。

2.时间外样本测试:由于该模型是基于合理年份的投资组合样本(参见第2部分),因此分析师希望测试最近投资组合的表现。在这段时间样本中,不良借款人(90+ DPD)的数量肯定会减少,但是对比分的好/坏比率的整体趋势仍将是模型表现的良好指标。此外,分析师可以放松不良贷款的条件,并认为30+ DPD是坏的。同样,整体趋势应该与记分卡估计相匹配。

3.现场测试:这是布丁测试的地方;分析师需要完全了解银行自开发记分卡以来所经历的任何信贷政策变化,更重要的是,变更将对评分卡产生的影响。永远记住不是每个政策变化都会影响记分卡 - 良好的商业理解和一些常识在这里真的很有帮助。定期监控并相应地校准记分卡是保持更新的好方法

模型验证的性能测试

有几种方法可以测试记分卡的性能,例如混淆矩阵,KS统计,基尼系数和ROC曲线下面积(AUROC)等.KS统计量是记分卡开发中广泛使用的度量标准。 但是,相对其他,我个人更喜欢AUROC。 我必须添加Gini是AUROC的变种。 我喜欢AUROC的原因可能是我在物理和工程方面的正式培训。 我认为这是一个更全面的衡量标准,让分析师可以直观地分析模型的表现。相对原始数字,我更喜欢图形和视觉统计。

相邻的图表显示了ROC。曲线上的两个轴是真实和误报率。正如预期的那样,该图表通知了该模型的预测水平。一个完美的模型将完美地隔离好的和坏的案件。因此,您将在开始时获得100%真实的正数(即绝对提升),如图中的绿色曲线所示。但是,生活中的任何事物都不存在完美。正如他们所说 - 如果真是太好了,那可能就是这样。另一个极端是一个毫无价值的模型,曲线标记为红色。任何靠近或低于红色曲线的东西都和投掷硬币一样好,那么为什么要费心去打造一个模型。最后,典型的记分卡ROC看起来像蓝色曲线。通常的信用评分模型的AUROC在70到85之间,越高越好。但是,对于某些欺诈和保险模式,略高于60的是可接受的ROC。同样,分析师应该在最终确定ROC之前确保评分卡的业务收益。在最终确定模型并将其报告给最高管理层之前,简单的成本收益分析可以显着提供帮助。

总结

我希望在阅读完之后,你会拿起你的相机并参观街角的未开发的角落 - 并准备好迎接一些奇妙的惊喜!

参考资料

  1. Credit Risk Scorecards: Developing and Implementing Intelligent Credit Scoring – Naeem Siddiqi
  2. Credit Scoring for Risk Managers: The Handbook for Lenders – Elizabeth Mays and Niall Lynas

作者:Roopam Upadhyay

原文链接

http://ucanalytics.com/blogs/credit-scorecards-model-validation-part-6/

版权声明:作者保留权利,严禁修改,转载请注明原文链接。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-08-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据科学与人工智能 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 好奇心评论
  • 好奇心与数据科学事业
  • 模型验证和评估
  • 模型验证的抽样策略
  • 模型验证的性能测试
  • 总结
  • 参考资料
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档