前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >信用卡违约预测模型的开发思路

信用卡违约预测模型的开发思路

作者头像
许卉
发布2019-07-15 17:15:57
1.3K0
发布2019-07-15 17:15:57
举报
文章被收录于专栏:Data Analyst

评分模型的数据多维性

目前以金融业为代表的各行各业使用的评分模型的原型都是基于美国FICO公司开发的评分模型,每个企业会将FICO的模型做些变形,从而形成自己需要的模型。

一般FICO的评分模型会基于四方面的信息:

  • 样本基本信息
  • 样本业务行为
  • 样本还款行为
  • 样本外部征信数据

当前,以阿里的蚂蚁分为代表的评分体系还包含社会网络相关的非金融行为的数据。

信用卡违约预测模型

---数据准备

信用卡违约预测模型构建的第一步是进行数据处理,即:

  • 缺失值处理:

构建逻辑回归模型的过程中,如果一条观测包含缺失值,则该条观测会被排除在模型样本之外,故构建逻辑回归模型的第一步需要进行缺失值的处理。建模样本中缺失值的产生一般有两个原因:针对因无行为而造成的缺失直接补0即可、针对分母为0而造成的缺失需要依据实际业务情况进行补充,例如可考虑取均值或中位数

  • 哑变量的处理
  • 极值的处理

信用卡违约预测模型

---变量筛选

建模样本缺失值处理完后,需要进行变量的筛选,即找出预测能力较强的变量,即识别好坏客户能力较强的变量。

以原始建模样本中入模变量数量200个为例,一般,我进行变量筛选的基本思路为

  • 单变量分析:删除缺失值过多或无实际业务含义的变量,经过此环节后剩余变量约为170个;
  • 变量初步选择:进行变量间相关性分析,删除预测能力差或R方极小的变量,经过此环节后剩余变量约为110个;
  • 变量交互式分组:进一步探索变量间关系,经过此环节后剩余变量个数约为50个;
  • 逐步回归技术介入进一步选择变量,从而选出最终入模的最优变量,此时变量个数约为15个左右。

信用卡违约预测模型

---构建模型与模型评估

开始构建信用卡违约预测模型,得到每个观测样本的违约概率;利用ROC曲线等进行模型评估并完成模型调优。

哪里会有人喜欢孤独,只是不愿意失望罢了。——渡边彻《挪威的森林》

信用卡违约预测模型

---业务应用

依据样本的违约概率曲线,将客户划分为极高风险、高风险、中风险与低风险等不同层级,并针对每一层级用户制定不同的审批策略。一般,建议低风险客户自动通过、中风险客户自动审批、极高风险客户自动拒绝,高风险客户也可以自动拒绝也可以人工介入,可依据实际业务情况灵活制定。

如果业务较多,大量的工作需要人工审批,则工作效率低下,目前部分小贷公司、汽车金融、银行以及互联网企业追求的模型的性能之一是:尽量让工作自动化,即自动通过或自动拒绝,从而降低人工审批比率,提高工作效率。但是我认为这样做也会存在一定隐患,可能出现或风险特高或通过率特低的情况

信用卡违约预测模型

---模型部署及监控

模型建好后并非大功告成,模型效果还可能受到多重因素的影响,如消费行为的变化、整体经济环境的变化、新的市场营销策略、新法令法规的出台等等,故为确保信用评分模型的正确使用,实时监控模型的性能是否下降、定期验证模型的适用性以便做出调整优化就变得尤为重要,模型监控环节必不可少。模型需双端监控:

  • 前端监控: 主要监控模型的稳定性,涉及评分稳定性监控与特征分布稳定性监控。其中评分稳定性可以通过稳定性指标PSI去检测不同评分区间评分的评分分布波动,特征分布稳定性可以通过每一个入模变量的PSI去检测不同评分区间该变量评分分布的波动。
  • 后端监控: 主要监控模型的正确性与入模变量的有效性,涉及模型正确性指标与变量有效性指标。其中模型正确性监控指的是某个评分区间上模型对好坏样本的区分能力。变量有效性监控即监控并评估变量在模型中是否显著,如果监控发现原来模型中显著的变量变的不再显著则需要重新构建模型
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-03-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Data Analyst 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
区块链
云链聚未来,协同无边界。腾讯云区块链作为中国领先的区块链服务平台和技术提供商,致力于构建技术、数据、价值、产业互联互通的区块链基础设施,引领区块链底层技术及行业应用创新,助力传统产业转型升级,推动实体经济与数字经济深度融合。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档