如果时光能倒推三十多年前,那时的我们很难想象,我们的世界靠智能连接世界的各个角落,智能手机不仅仅能够打电话,还能帮助我们实现商业经济行为,如购物、信贷、交通、教育等等。
判断信用是人类最难的数学题!人类一直想通过算法和数据提炼人的信用等级,从而让一切更简单便捷,成为新的商业模式的基石!
目前人们获得贷款可以说已经很便捷,一部智能手机,授权相应的数据,就可以在几秒内获得信用贷,高信用低利息。
新的商业模式,催生新的经济商业行为。世界素不相识的人可以跨越时间和地域的限制相识相知;任何角落里发生的事情都可以在几分钟内传遍全球。高度发达的移动互联网在人与人之间、人与物之间、人与经济之间等等,建立起一道道虚拟经济,将素不相识的人、貌似毫不相干的物,连接在了一起,缩短了时空的距离。金融服务全球化,有闲钱就可以借给有需要贷款的人,找到有信用的客户成为必然的选择。
数据驱动了人工智能的大发展,人工智能让机器具有了自己的行为动作,帮助人类解决现实的问题。
看看我们的周边,我们在慢慢被改变,便利店里的物品可以随便挑选,没有谁在对你说这不让挑那不让挑,一切随你所愿!
信用评分卡模型是信用效能的等级体现,正如你在支付宝里看到的自己的芝麻分!
信用评分卡主要分类:
A卡(Application score card)申请评分卡
B卡(Behavior score card)行为评分卡
C卡(Collection score card)催收评分卡
1.申请评分卡
对新贷款申请进行筛选并判断其违约风险,俗称A卡。
申请评分卡被用来对新贷款申请进行一次性信用评分,其评分结果将决定以下几个方面:
估计信用状况,即正常还是违约、并据此决定批准还是拒绝该笔贷款申请;
为获得审批通过需要提供的抵押物;
贷款金额(信用额度);
贷款定价(利率水平)。
2.行为评分卡
对审批通过的贷款客户进行覆盖整个贷款周期的管理
行为评分卡被用来对已经通过审批并进入执行阶段的账户,即已经进行了一定交易的账户,进行信用评分,评分过程将反复进行,以监测和管理业务账户,其评分结果将用于:
审查信用重建;
审查信用额度 ;
制定清收策略(如果违约或逾期付款);
审查贷款定价和贷款条件。
3.催收评分卡
对审批通过的贷款客户进行覆盖整个贷款周期的管理
催收评分卡是申请评分卡和行为评分模型的补充,用于预测和评估对某一笔坏账所采取的措施的有效性,诸如客户对警告信件反映的可能性,银行可以根据模型的预测,对不同状况的逾期贷款采取不同的有效措施进行处理。
催收评分解决的问题就是预测催收成功的可能性,结合催收评分和催收成本,来决定哪些违约客户应该进行什么样的催收顺序。
国内银行的催收方式主要有电话催收、信函催收、上门催收、司法催收、委外催收,一般的顺序是先进行短信或者电话催收;如果催收不成功,则采用信函催收;如果还没有反馈,则上门催收;最终采用司法催收和委外催收。催收本身是需要成本的,催收的目的是在于减少损失,而不是增加成本,所以实施催收前要考虑的第一个问题应该是催收的成本是不是小于催收减少的损失。
1.使用的时间不同。分别侧重贷前、贷中、贷后;
2.数据要求不同。A卡一般可做贷款0-1年的信用分析,B卡则是在申请人有了一定行为后,有了较大数据进行的分析,一般为3-5年,C卡则对数据要求更大,需加入催收后客户反应等属性数据。
3.每种评分卡的模型会不一样。在A卡中常用的有逻辑回归,而在后面两种卡中,常使用多因素逻辑回归,精度等方面更好。
假设评分卡用到的三个特征变量:
用户基本属性数据X1:年龄、性别、学历、城市等级等
信息验真数据X2:手机是否实名等
职业数据X3:就业状况
标准评分卡格式如下:
将评分卡中每个变量的贡献加总得到一个账户的总信用评分,这使得最终分支对普通大众来说更加透明。
比率(odds),依据可计算得到的比率,信用状况时正常或违约的概率与总的评分直接相关;
信用评分卡模型评估指标
一般信用评分卡模型评估指标大致可以分成两类:
预测能力指标,用于评估模型对违约事件的预测能力,比如:
WOE/IV;
ROC/AUC;
K-S指标;
GINI系数;
稳定性指标,用于评估模型在训练样本和测试样本中预测能力的一致性,如PSI指标。
对这些指标定义进行基础的解释:
1.WOE&IV
WOE(Weight of Evidence)叫做证据权重,IV(Information Value)叫做信息价值,是一组评估变量的预测能力的指标。也就是说,当我们想要拿出证据证明“年龄”这个变量对于违约概率是否有影响的时候,可以使用这个指标评估年龄到底对违约概率的影响有多大。
下面表格展示的就是年龄、性别及婚姻状况三个变量相关的好坏样本数据以及计算出的对应的WOE及IV值。WOE的计算公式是:ln[(违约/总违约)/(正常/总正常)]。比如对于年龄18~25的组别,WOE=In[(131/总违约样本数)/(1016/总正常样本数)]。根据WOE值,可以进一步计算出IV值。
在此不对具体计算公式和逻辑进行解释,大家可以理解成,WOE和IV都是使用样本好坏比例的数据转换成的指标。
2.ROC/AUC
ROCreceiver operating characteristic curve),中文叫“接受者操作特性曲线”。
这里需要补充的基础知识是关于经典的混淆矩阵(confusion matrix)的内容。这个分析的经典之处在于,它超出了我们以往理解“正确率”的限制,使得我们有更多的维度去评价一个模型的预测能力(涉及到了机器学习的内容)。
以下的表格就是混淆矩阵的内容。怎么来理解呢?在使用一个模型去判断一个样本是“正样本”还是“负样本”的时候,模型会输出“正”或者“负”两种预测,叫做预测值;而实际上这个样本会有正样本或者负样本两种情况,称为实际值(类似我们利用模型预测“好人”及“坏人”)。预测值和实际值各有两种情况,这两种情况的交叉组合就形成了以下的混淆矩阵。
3. K-S
对于模型而言,当然希望这个模型能够帮我们挑选到最多的好客户,同时不要放进来那么多坏客户。K-S值就是一个这样思路的指标。比如,在完成一个模型后,将测试模型的样本平均分成10组,以好样本占比降序从左到右进行排列,其中第一组的好样本占比最大,坏样本占比最小。这些组别的好坏样本占比进行累加后得到每一组对应的累计的占比。好坏样本的累计占比随着样本的累计而变化(图中Good/Bad两条曲线),而两者差异最大时就是我们要求的K-S值。
KS值的取值范围是[0,1]。通常来说,值越大,表明正负样本区分的程度越好。一般,KS值>0.2就可认为模型有比较好的预测准确性。
4.GINI系数
经济学中著名的基尼系数。将一个国家所有的人口按最贫穷到最富有进行排列,随着人数的累计,这些人口所拥有的财富的比例也逐渐增加到100%,按这个方法得到图中的曲线,称为洛伦兹曲线。基尼系数就是图中A/B的比例。可以看到,假如这个国家最富有的那群人占据了越多的财富,贫富差距越大,那么洛伦茨曲线就会越弯曲,基尼系数就越大。
同样的,假设我们把100个人的信用评分按照从高到低进行排序,以横轴为累计人数比例,纵轴作为累计坏样本比例,随着累计人数比例的上升,累计坏样本的比例也在上升。如果这个评分的区分能力比较好,那么越大比例的坏样本会集中在越低的分数区间,整个图像形成一个凹下去的形状。所以洛伦兹曲线的弧度越大,基尼系数越大,这个模型区分好坏样本的能力就越强。
5. PSI
PSI(Population Stability Index)叫做群体稳定性指标,用于衡量两组样本的评分是否有显著差异。PSI = sum(实际占比-预期占比)*ln(实际占比/预期占比)。