首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

年度宽客 (2000 - 2019)

前几天看到了 Quant of the Year 2019 颁布的新闻,回想从 2015 年开始自学机器学习时就没关注这个了,因为这个奖项通常都是 Q-quant (即在风险中性测度下玩转的 quant) 所拿,而我开始对机器学习感兴趣,已经向 P-quant 靠拢了。关于 P-quant 和 Q-quant 的区别可参照我之前写的这个帖子。但今天这个奖项是颁给一个渣打银行 (SCB) 的数据分析执行董事,他用 P-quant 的机器学习方法来解决银行实际的问题。心血来潮把从 2000 年到 2019 年的这 20 年的新闻读了,论文也从 Risk 网站上下载了。(Risk 网站下载这些论文需注册会员,因此有些论文上有水印不让传播,为了尊重知识产权,我只在公众号后台分享那些没打水印的论文,望理解)

06

评分卡模型开发-定量指标筛选

本文介绍了在模型开发中,如何从数据中筛选出对违约状态影响最显著的指标。首先介绍了违约状态的数据特点,然后给出了五种定量指标筛选方法,包括随机森林法、计算变量间的相对重要性、基于自变量的逐步回归法、基于自变量的广义交叉验证法和基于变量的“Boruta”法。最后,综合这五种方法,筛选出了对违约状态影响最显著的四个入模指标,分别为:账户状态、是否逾期、是否申请提高额度和申请额度是否获批。对于定性指标,则通过文本挖掘的方法提取了“是否逾期”和“是否申请提高额度”两个入模指标。通过这些指标,可以更好地预测客户的违约状态,为金融机构提供更精准的风险评估和决策依据。同时,在筛选指标的过程中,要注意指标的可解释性和稳定性,以确保模型的预测效果和泛化能力。

06
领券