【应用】信用评分:第5部分 - 评分卡开发

笔者邀请您,先思考:

1 信用评分卡如何开发?

评分卡开发描述了如何将数据转化为评分卡模型,假设数据准备和初始变量选择过程(过滤)已完成,并且已过滤的训练数据集可用于模型构建过程。 开发过程包含四个主要部分:变量转换,使用逻辑回归的模型训练,模型验证和缩放。

图1.标准评分卡开发过程

变量转换

“如果你长时间折磨数据,它会承认任何事情。” (罗纳德科斯,经济学家) - 基于逻辑回归的标准计分卡模型是一个可加模型; 因此,需要特殊的变量转换。 通常采用的转换 - 精细分类,粗分类,以及虚拟编码或证据权重(WOE)转换 - 形成了一个顺序过程,提供了一个易于实施并向企业解释的模型结果。 此外,这些转换有助于将独立变量和因变量之间的非线性关系转化为线性关系 - 业务往往要求的客户行为。

精细的分类

适用于所有连续变量和具有高基数的离散变量。这是通常在20到50个细颗粒箱子中初始装箱的过程。

粗分类

如果将分箱过程应用于细粒仓,以合并具有类似风险的箱子并创建较少的箱子,通常最多为10个箱子。其目的是通过创建更少的箱子来实现简单化,每个箱子都具有明显不同的风险因素,同时最大限度地减少信息损失。然而,为了创建一个可适应过度拟合的稳健模型,每个箱子应包含来自总账户观察值的足够数量(5%是大多数从业人员推荐的最小值)。这些目标可以通过最优分箱形式的优化来实现,该分类在粗分类过程中最大化变量的预测能力。最优分箱使用与变量选择相同的统计量度,例如信息价值,基尼和卡方统计。尽管两种或更多种措施的结合通常是有益的,但最普遍的措施也是信息价值。如果缺失值包含预测信息,则应该是单独的类别或合并到类似风险因素的分类中。

虚拟编码

为参考类以外的所有粗糙类创建二进制(虚拟)变量的过程。这种方法可能存在问题,因为额外的变量需要更多的内存和处理资源,并且偶尔会由于自由度降低而出现过度拟合。

证据权重(WOE)转换

替代的,更受青睐的虚拟编码方法,用每个粗糙类代替风险值,然后将风险值折叠成单个数值变量。数字变量描述了独立变量和因变量之间的关系。 WOE框架非常适合逻辑回归建模,因为它们都基于对数可能性计算。此外,WOE转换将所有独立变量标准化,因此可以直接比较后续逻辑回归中的参数。这种方法的主要缺点是只考虑每个箱子的相对风险,而不考虑每个箱子的账户比例。信息值可以用来评估每个箱子的相对贡献。

虚拟编码和WOE转换都给出了类似的结果。 选择哪一个主要取决于数据科学家的偏好。

但需要注意的是,当手动执行时,优化分箱,虚拟编码和WOE转换是耗时的过程。 用于装箱,优化和WOE转换的软件包因此非常有用并且强烈推荐。

图2.自动最优分箱和WOE转换

模型训练和缩放

Logistic回归是用于解决二元分类问题的信用评分中常用的技术。在模型拟合之前,变量选择的另一次迭代对于检查新的WOE变换变量是否仍然是好的模型候选是有价值的。首选候选变量是信息价值较高(通常在0.1到0.5之间)的变量与因变量具有线性关系,在所有类别中具有良好的覆盖率,具有正态分布,包含显着的总体贡献,并且与业务相关。

许多分析供应商在其软件产品中包含逻辑回归模型,通常具有广泛的统计和图形功能。例如,WPS中SAS语言PROC LOGISTIC的实现为自动化变量选择,模型参数限制,加权变量,获得不同分段的单独分析,在不同数据集上评分,生成自动化部署代码,仅举几例。

一旦模型一致,下一步就是将模型调整到业务所需的规模。这被称为缩放。缩放是一种衡量工具,可提供不同评分卡上分数的一致性和标准化。最低和最高分数值和分数范围有助于风险解释和应该报告给企业。通常,业务要求是对多个评分卡使用相同的分数范围,因此它们都具有相同的风险解释。

一种流行的得分方法以对数形式创建离散得分,其中可能性在预定数量的点处加倍。这需要指定三个参数:基点,例如600点,基本赔率,例如50:1,指向双倍赔率,例如20.得分点对应于模型变量的每个单元,而模型截距是翻译成基点。带有列表分配点的缩放输出代表实际的评分卡模型。

图3.评分卡缩放

模型性能

模型评估是模型构建过程的最后一步。 它由三个不同的阶段组成:评估,验证和接受。

评估准确性 - 我是否建立了正确的模型? - 是为了测试模型而问的第一个问题。 评估的关键指标是统计指标,包括模型准确性,复杂性,错误率,模型拟合统计,变量统计,显着性值和胜算比。

验证稳健性 - 我建立了正确的模型吗? - 当从分类准确性和统计评估转向排序能力和业务评估时,是下一个问题。

验证度量标准的选择取决于模型分类器的类型。二元分类问题最常见的指标是收益图,提升图,ROC曲线和Kolmogorov-Smirnov图。 ROC曲线是可视化模型性能的最常用工具。它是一种多用途工具,用于:

  • 冠军挑战者方法论来选择最佳表现模型;
  • 测试不可见数据的模型性能并将其与训练数据进行比较;
  • 选择最佳阈值,使真阳率最大化,同时最小化假阳率。

ROC曲线是通过将灵敏度与不同阈值下的错误警报概率(误报率)作图而创建的。评估不同阈值下的性能指标是ROC曲线的理想特征。基于业务战略,不同类型的业务问题将具有不同的阈值。

ROC曲线下面积(AUC)是指示分类器预测能力的有用指标。在信用风险中,0.75或更高的AUC是行业公认的标准和模型验收的先决条件。

图4.模型性能度量

接受有用性 - 模型是否会被接受? - 为了测试该模型是否有利于业务发展,这是要问的最后一个问题。 这是数据科学家必须将模型结果回放到业务并“维护”其模型的关键阶段。 关键的评估标准是模型的商业利益,因此,利益分析是介绍结果的核心部分。** 数据科学家应尽一切努力以简明的方式呈现结果,因此结果和发现很容易理解和理解。 如果未能实现此目标,可能会导致模型拒收,从而导致项目失败。**

系列之前:信用评分:第4部分 - 变量选择

系列之前:信用评分:第6部分 - 分割和拒绝推断

作者: Natasha Mashanovich, Senior Data Scientist at World Programming, UK 原文链接:https://www.worldprogramming.com/blog/credit_scoring_pt5

版权声明:作者保留权利,严禁修改,转载请注明原文链接。

原文发布于微信公众号 - 数据科学与人工智能(DS_AI_shujuren)

原文发表时间:2018-06-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器学习之旅

理论:SVD及扩展的矩阵分解方法

svd是现在比较常见的算法之一,也是数据挖掘工程师、算法工程师必备的技能之一,这边就来看一下svd的思想,svd的重写,svd的应用。 这边着重的看一下推荐算...

33930
来自专栏鸿的学习笔记

Yoshua Bengio关于深度学习结构的综述

深度学习方法旨在学习特征层次,其具有由较低层特征的组合形成的较高层级的特征。在多个抽象级别自动学习特征允许系统去学习将输入直接从数据映射到输出的复杂函数,而不完...

7010
来自专栏量子位

实录 | 旷视研究院解读COCO2017物体检测夺冠论文(PPT+视频)

主讲人:彭超 | 旷视研究院研究员 屈鑫 整理编辑 量子位 出品 | 公众号 QbitAI 12月6日晚,量子位·吃瓜社联合Face++论文解读系列第一期开讲,...

453160
来自专栏深度学习自然语言处理

什么是迁移学习 (Transfer Learning)?这个领域历史发展前景如何?

在SMP会议上,感觉到了迁移学习的前景很乐观,感觉这个也是以后必学的知识,所以这里小编先放了这篇文章,即使现在看不懂的,也可以收藏,反正以后必须要了解哒!

21410
来自专栏达观数据

干货分享丨基于半监督学习技术的达观数据文本过滤系统

社交、直播、论坛、电商等各类平台每天都会产生海量UGC(User Generated Content),其中不可避免地混杂有大量垃圾文本。这些内容不但严重影响用...

38170
来自专栏新智元

LeCun 推荐!50 行 PyTorch 代码搞定 GAN

【新智元导读】Ian Goodfellow 提出令人惊叹的 GAN 用于无人监督的学习,是真正AI的“心头好”。而 PyTorch 虽然出世不久,但已俘获不少开...

37970
来自专栏机器学习算法原理与实践

用tensorflow学习贝叶斯个性化排序(BPR)

    在贝叶斯个性化排序(BPR)算法小结中,我们对贝叶斯个性化排序(Bayesian Personalized Ranking, 以下简称BPR)的原理做了...

24920

超级网络

在这篇文章中,我将介绍一下我们最近的文章[1609.09106] HyperNetworks。我作为Google Brain Resident工作在这篇论文上-...

36970
来自专栏人工智能

十种深度学习算法要点及代码解析

谷歌董事长施密特曾说过:虽然谷歌的无人驾驶汽车和机器人受到了许多媒体关注,但是这家公司真正的未来在于机器学习,一种让计算机更聪明、更个性化的技术。 也许我们生活...

27780
来自专栏华章科技

大神Hinton的Capsule论文终于公开,神经网络迎来新探索

今年9月的一次大会上,大神Geoffrey Hinton再次号召展开一次AI革命。

10030

扫码关注云+社区

领取腾讯云代金券