【风控】催收评分和不良贷款市场的机会

陆勤_数据人网

发布于 2018-07-30 15:53:38

1.3K0

发布于 2018-07-30 15:53:38

文章被收录于专栏：数据科学与人工智能数据科学与人工智能

笔者邀请您，先思考：

1 催收评分解决什么问题？

2 如何设计和实现催收评分？

编者按：最近在研究催收评分，发现相关资料不多。这篇论文全面地介绍了催收评分和商业应用策略，很有借鉴价值。

摘要：

本研究的目标是在一家专门从事不良贷款组合的巴西公司254,914名客户的样本中开发一个催收评分模型，使用Logistic回归来识别那些更倾向于偿还不良贷款的客户。此外，本文还提出了商业应用的建议。

关键词：不良贷款，收集评分，Logistic回归，统计模型

介绍

1994年，在金融稳定后，巴西市场开始利用大规模信贷分析模型，自动评估大量信贷申请。

巴西的金融机构为新客户已经大量使用信用评分模型，因为1994年中期开始的Plano Real实现了货币稳定性，并导致消费者信贷量的高增长率。

除了用于分析新贷款授予的模型（称为信用评分）之外，还增加了对其他两个模型的使用：在第一个模型（行为评分模型）中，目的是评估银行客户是否是能够获得新的贷款;第二个模型（催收评分）评估已经违约的且需要做催收行动的客户的还款可能性（Sadatrasoul等人2013）。

本研究旨在为不良贷款组合（NPL）建立一个催收评分模型，寻求通过评估每种类型客户的还款状况，定义最佳收集策略。此外，我们还将根据分析中确定的客户画像提供催收策略。

文献评论

不良贷款

不良贷款是逾期90天以上的贷款准备金。金融机构中不良贷款数量的增加导致该公司破产的风险（Makri等人，2014年）。

Toledo（2013）指出，自从90年代中期以来，在Plano Real实现稳定之后，巴西经济一直在经历由贷款增加所带来的增长过程，因此，据几位作者称，快速扩张已经导致贷款质量恶化，导致违约增加（Kauko 2012; Makri等人2014; Barseghyan 2010; Lu等人2007），导致贷款逾期超过90天。 Toledo（2013）指出，在2002年至2012年间，信贷额度从GDP的25％增加到约50％。

催收政策

催收的职责是为公司的现金带来资金。该领域的目的是加速催收，使公司最大限度地减少对信贷设施的需求（Gitman 2006）。

催收政策旨在确定寻求收到应收款项的公司采用的各种可能的标准和程序（Assaf Neto和Lima，2011），即公司在到期日收到应收款项的策略。使用的基本程序是：通过信件，电话，法庭，访问等（Machado和Barreto，2011）。

根据Hoji（2014），催收政策应与信贷政策一起实施。信贷授予不能太一以至于随后在催收中要求严格的申请，反之亦然。如果在授予信贷的行为中已经预期到催收的困难，则信用评分应该更加严格。

评分模型

根据Crook等人的说法。（2007年），评分模型旨在衡量投资组合在其期限内的风险。最常见的是使用逻辑回归作为构建模型的工具; 然而，研究人员使用其他技术，例如：决策树（Olson等人，2012），神经网络（Olson等人，2012），遗传算法（Gouvêa等人，2012）和生存分析（Andreeva，2003）。

Gouvêa等。（2012）提出了建立信用评分模型的七步循环，可用于制作任何类型的评分模型：

调查历史客户群：有必要假设客户随着时间的推移具有相同的行为模式; 基于此，收集过去的信息用于构建模型。在此阶段，有必要定义模型的目标受众，将使用哪些信息以及收集数据的频率以构建模型。
根据行为模式和响应变量的定义进行客户分类：在此阶段，定义要建模的客户群组。 一般而言，使用两种类型的客户分类，称为良好债务人和坏债务人。一般而言，除了好的和坏的债务人之外，还可能有被排除的客户（具有特定特征且不应被视为例如在该机构工作的个人）和不确定的客户（那些在所谓的“灰色区域”并不能被归类为好或坏，例如，新客户）。无论是在市场实践还是在学术论文中，趋势都只适用于好坏债务人（Olson et al.2012）。
从历史数据中随机选择代表性样本：为避免因（样本）大小而产生任何偏差，重要的是在预定义的组中对采样进行均等分层。抽样的客户数量取决于几个因素，例如样本规模和获取数据的便利性，样本的同质性等; 然而，Lewis（1992）提出，对于每种类型的响应，对于1,500个样本客户，已经可以获得稳健的结果。通常，研究使用两个样本集，第一个用于构建模型，第二个用于验证和测试模型。
描述性分析和数据准备：在此阶段，使用统计标准分析模型中使用的每个变量。
选择和应用用于构建模型的技术：在本研究中，我们将使用Logistic回归。 Gouvêa等。（2012）对评分模型进行了文献综述，并确定了在这些模型中使用的以下技术：线性回归，Logistic回归，分类树，线性规划，遗传算法，神经网络，判别分析和REAL。学术研究的结果证实，没有任何技术被证明总是优于其他技术，因为根据要建模的数据，某个技术可能胜过其他技术。
模型比较标准的定义：在这一步中，我们确定了模型比较的标准; 最常用的工具是基尼系数，ROC曲线，Kolmogorov-Smirnov（KS）测试和命中率。
选择和实施最佳模型：所有涉及的领域应该汇聚在一起以确定实施计划：所有相关人员都应明确截止日期，阶段和预期影响，以避免在整个过程中出现意外。

催收评分模型

催收评分模型旨在估计已经违约的客户的还款概率。这意味着催收模型的目标受众包括未能在与债权人商定的最后期限内履行义务的客户。这种类型的模型是一种有助于根据已经违约的客户还款概率来估算损失的工具。将具有不同程度破产的客户分成小组，将需要进一步催收行动的人与不需要立即收费的人分开（Sadatrasoul等人，2013年）。由于在这种情况下，模型是与已经与机构建立关系的客户建立的，因此建模中使用的变量可以分为两组：

登记数据：客户的年龄，性别，婚姻状况，地址等，以及从信用局获得的信息（抗议，不良检查，纠纷和财务限制）。
与公司的客户关系：前几个月的延迟付款，与公司的关系长度，客户在以前的交易中花费的金额，以前与客户的联系等。

方法方面

下面我们介绍一些有关本研究开发的信息; 我们使用适用于Windows v.21的SPSS软件。

数据

一家专门从事不良贷款催收的公司提供了254,914名个人客户的样本，这些客户来自于2013年5月在六个月内组建的投资组合，此样本仅包括公司实际联系的客户。未联系的客户不包括在样本中，因为他们无法将其归类为好或坏的债务人。这类公司以低于债务价值的价格从一个机构（金融或非金融）购买投资组合（在本研究中，平均价格是债务价值的5％）。

响应变量的定义

定义的响应变量将基于客户还款（或不还款）。被定义为良好债务人的客户是那些已经接受催收公司协议并且至少支付了一笔金额。所谓坏账者的定义是那些没有接受任何协议的人或者接受了协议的人，但是他们没有向催收公司支付任何分期付款而违反了他们的承诺。

样本集

选择了两个样本：一个用于构建模型，一个用于验证模型。在用于构建模型的样本中，我们选择了90,000个按响应变量分层的客户，其中45,000个客户被认为是良好的债务人，45,000个是坏账者; 其他客户仍然在模型的验证和测试样本中，我们发现了良好债务人的普遍性。

自变量

可用的客户端注册变量以及观察到的行为变量用于构建模型。它们如下：

客户的年龄
债务值
默认天数
居住地区（北部，东北部，中西部，东南部和南部）
注册中的住宅电话数量
注册中的商务电话数量
注册中的电子邮件数量
以前通过电话联系的人数
以前通过电子邮件联系的数量
对外部信贷局的限制（抗议，不良支票，Refin或Pefin）
由外部信贷局计算的分数
此客户在该公司收集的投资组合中出现的次数

所有变量都被分类到范围，变成有序变量，以减少异常值的影响并使估计更加稳健。

Logistic回归

如上所述，Logistic回归是用于此类问题的最广泛使用的技术; 它基于客户被分类到每个组中的概率的计算。根据Gouvêa等人的说法。（2012年），采用这种技术有三个前提，如下：

没有异常值：异常值应该从它在总体中的代表性的角度来看待，研究者应该评估它是否应该被保留或消除，以防它对结果产生不正当的影响。
低多重共线性：多重共线性意味着变量不是线性独立的。 “高度的多重共线性可能会导致错误估计自变量的系数，甚至会产生错误的信号。”（Gouvêa等人，2012）
样本量：样本量应足以允许结果的推广，这可以根据测试的统计显着性进行验证。根据Hair等人的说法。（2010），样本的推荐最小尺寸应按每个预测变量至少10个观察值的方式计算，每个组（好的和坏的），样本的总大小应高于400个观察值。

在本研究中，我们对寻求减少异常值影响的变量进行了分类; 为了防止多重共线性，选择Logistic回归模型变量的技术是向前逐步的; 该模型建立了90,000个案例，远远超过Hair等人提出的数量。（2010年）。

性能评估标准

使用的第一个性能评估标准是验证样本的选择; 如果验证样本的结果接近开发样本的结果，则意味着该模型适合用于其它情况。其他两个标准将用于评估模型的性能：命中率和Kolmogorov-Smirnov检验。

命中率

根据Crook等人的说法。（2007），命中率是通过将正确分类的客户总数除以属于该模型的客户数来衡量的。必须对根据模型分析的每个客户组（Good，Bad）进行相同的计算，以了解模型是否比其他模型更准确地识别客户类型。

Hair等人。（2010）建议将最低可接受命中率定义为实现分类的标准至少比单独偶然获得的准确率高出25％; 在这项研究中，偶然正确地对任何随机客户进行分类的概率为50％; 因此，最低可接受的准确率为62.5％（50％x 1.25）; 如果样本量不同，我们应该根据最大的组进行权重。

Kolmogorov-Smirnov测试

Kolmogorov-Smirnov（KS）检验是一种非参数统计技术，旨在确定两个样本是否来自同一群体（Siegel 1975）; 就本研究而言，我们寻求区分好债务人和坏债务人。为了应用该测试，为每个观察样本建立累积频率分布，对两个分布使用相同的间隔。对于每个间隔，从从一个函数值减去另一个函数值，测试注重观察到的最大偏差。根据Crook等人的说法。（2007年），这是一个重要的区分度量; 在模型中获得的KS越高，模型就能越好地区分坏债务人和坏债务人。

结果

下面，给出并分析了逻辑回归处理中获得的结果。最后，制定了催收公司经理的行动计划方案。

Logistic回归

在本文中，最初，包含所有变量以构建模型; 但是，在最终的逻辑模型中，只会选择一些变量。变量将使用前向逐步方法选择，这是逻辑回归模型中最广泛使用的方法（Norusis 2011）。由此产生的模型由29个变量组成，客户分类最重要的变量是违约期间，外部信用局的分类以及客户之前是否通过电子邮件联系，如表1所示。。

Omnibus测试测量模型是否能够以所需的准确度进行预测（O'Connell 2006; Menard 2002）。该分析的结果表明，显着性检验证实该模型能够正确地进行预测。接下来，我们测试了模型的命中率。表2显示该模型的命中率在开发样本中为83.9％，在验证样本中为83.4％。好坏债务人的准确率百分比彼此接近，从开发样本转换到验证样本时没有变化，这表明该模型的结果良好。

根据Sicsú（2010），KS高于0.70的模型被认为具有极好的辨别力，而KS在0.60和0.70之间的模型具有非常好的辨别力。对于这些数据，对于开发样品实现的KS测试的结果是0.680，而在验证样品中它达到0.679，表明，与开发样品的结果良好且非常接近的命中率一样。

拟议的行动

为了提出行动，我们将使用整个投资组合（包括开发和验证样本），其中每个客户收到由逻辑模型确定的分数。客户分为20个同等大小的范围（每个范围约占人口的5％）; 在这些范围的每一个中，客户端都会突出显示为好或坏。如果模型调整得很好，坏账的最高集中度将在较低的范围内，而所谓的良好债务人应该更频繁地位于更高的范围内（Lewis 1992; Mays 2001）。下表3显示了20个范围内的分布。

由于良好债务人的比例在每个范围内增加，因此开发的催收评分模型实现了良好的划分。可以通过更灵活的催收政策来处理14到20之间的客户，例如较低价值的折扣; 另一方面，范围1到5之间的客户可能是更积极的催收政策的焦点（例如更高的折扣）。

最后的考虑因素

本研究的目的是使用逻辑回归将催收评分模型应用于不良贷款组合，结果是恰当的。

本研究提出了一个关于如何使现有报价适应所开发模型所确定的客户概况的方案，因为在具有定制产品的市场中，允许客户概况差异化的模型能够帮助管理者基于受众确定报价和目标策略。

这项研究提出了一些限制。第一个是使用公司提供的二手数据;所以不可能确保所有用于开发模型的变量都可用;同样，催收公司之前已经将客户归类为好或坏债务人。第二个限制是文献中关于催收评分的学术研究数量很少;根据Sadatrasoul等人的说法。（2013年），难以获得此类研究的数据库，这阻碍了进一步研究的发表。

未来的研究可以集中于开发此类投资组合模型的其他技术，例如神经网络或遗传算法;深化研究的另一个机会是更广泛地了解公司的报价范围，并根据现有政策建立盈利预测。

作者：Eric Bacconi Gonçalves

本文参与腾讯云自媒体分享计划，分享自微信公众号。

原始发表：2018-07-10，如有侵权请联系 cloudcommunity@tencent.com 删除

其他

本文分享自数据科学与人工智能微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体分享计划，欢迎热爱写作的你一起参与！

其他

登录后参与评论

0 条评论

热度