信贷风控是数据挖掘算法最成功的业务场景,简单来说就是判断一个人的还款能力及还款意愿,并以此为信任依据提高金融业务效率。
业界通常的做法是基于挖掘多维度的特征建立一套规则及风控模型,一个好的特征,对于模型和规则都是至关重要的,验证中经常可以发现,如果踢掉某类特征模型也就废了。本文就梳理总结下信贷风控常用的特征,可以总结到以下3句话:
(信贷交易类的特征重要程度往往是最高的,少了这部分历史还款能力及意愿的信息,风控模型通常直接就废了。)
(基本资料主要是从还款能力上面考量,需要注意的是,还需要多方核验资料的真伪以鉴别欺诈风险。另外的,像性别、肤色、地域、种族、宗教信仰等类型特征使用要谨慎,可能模型会有效果,但也会导致算法歧视问题。)
(这类特征通常缺失度比较高,对模型贡献一般,更多的是从还款意愿、欺诈维度的考虑)