笔者邀请您,先思考:
1 如何进行信用评分卡建模?有哪些建模方法?
伟大的设计通过简单化来呈现其丰富性。(M. Cobanli)
作为数据科学家,我的责任是设计和开发一个准确,有用和稳定的信用风险模型。我还需要确保其他数据科学家和业务分析师能够评估我的模型或重复相同的步骤并产生相同或类似的结果。
在模型开发过程中,我尝试从业务中找到答案,以解决一些问题。这些答案有时需要主观判断。只要我能记录我的问题和相应的答案,这种主观主义就没有错。很显然,如果我不断将这些问题和答案添加到列表中,那么就有一个难以遵循的巨大列表的结局的危险。我也可能会以一些重复的问题或甚至矛盾的答案而终结。
我怎么能确定:(1)我不会错过对重要问题的回答; (2)我的模型将成功通过同行评审或审核流程;或(3)我的同事将能够复制模型结果?
为了满足以上几点,我需要:
一旦我确定了这些重要的元素,我就可以开始在我的理论框架的正确方面填充我的问题,并着手设计和构建模型。 该过程可能如下所示:
等等… 随后的部分将更详细地介绍评分卡建模方法。
任何商业,研究或软件项目都需要合理的方法,通常采用理论或概念框架的形式。框架的目的是描述步骤的顺序及其相互作用。这确保了所有重要阶段的实施,提供了对项目本身的理解,制定了重要的里程碑并建立了项目利益相关方之间的积极协作。
通常可以采用不止一种既定方法。数据挖掘项目是多个概念框架可用的典型示例。数据挖掘通常涉及用于商业目的的预测模型的开发。数据挖掘项目具有多学科性质,需要从不同角度进行考虑,其中包括:
每个观点可能需要独立的方法,但至少需要两个才能适应上述观点。两种流行方法的例子有Agile-scrum和CRISP-DM(用于数据挖掘的跨行业标准过程);前者用于解决业务和软件开发需求,后者则用于构建商业模式。
Agile-scrum方法是一种时间框的迭代式软件开发方法,逐步构建软件,并具有为业务提供价值的关键目标。 该方法促进用户积极参与,利益相关者之间的有效互动和频繁交付。 因此,它非常适合数据挖掘项目,这些项目通常在短时间内完成,需要经常更新以应对不断变化的经济环境。
CRISP-DM是数据挖掘过程模型的主要行业方法。 它由六个主要相互关联的阶段组成:(1)业务理解,(2)数据理解,(3)数据准备,(4)建模,(5)评估和(6)部署。
图1.CRISP-DM数据挖掘框架
预测模型的最终目标是满足特定业务需求,以改善业务和业务流程的性能。 业务和数据理解都是CRISP-DM的关键阶段。 这两个阶段的结果应该是一个完善的理论框架和模型设计。
理论框架是一个帮助识别(假设)预测模型(如信用风险模型)中的重要因素及其关系的建模基础。目标是制定一系列假设,并决定用于测试这些假设的建模方法(如逻辑回归)。然而,更重要的是要建立重复/验证研究结果的方法,以获得对模型严谨性更强的信心。
该框架的主要内容是:(1)如因变量(标准),“信用状态”,(2)自变量或预测变量,如年龄,居住和就业状况,收入,银行账户信息,支付记录,或坏账历史,以及(3)可测试的假设,例如“房主不太可能违约”。
模型设计应遵循研究设计方法学的公认原则,这是数据收集,测量和数据分析的蓝图,因此可以对模型进行可靠性和有效性测试。前者测试模型产生稳定和一致结果的程度,后者测试模型是否真实地代表了我们试图预测的现象,即“我们构建了正确的事情吗?”
一个好的模型设计应该记录以下内容:
图2.利用历史数据预测未来结果
观察和表现窗口的长度取决于正在设计模型的工业部门。例如,在银行部门,与电信部门相比,这两个窗口通常较长,因为电信部门频繁更换产品需要较短的观察时间和表现窗口。
申请评分卡通常应用于新客户,并且没有观察窗口,因为客户使用申请时已知的信息进行评分。诸如信用局数据之类的外部数据主宰这类评分卡的内部数据。行为评分卡具有利用内部数据的观察窗口,并且倾向于具有比申请评分卡更好的预测能力。
从实施活动开始,可以在整个客户旅程中应用不同的评分卡,以预测客户响应营销活动的可能性。在申请阶段,客户可以针对多种预测模型进行评分,例如信用责任违约的可能性或预测欺诈性客户。将一系列行为评分卡模型应用于现有客户,以预测违约概率,以设定信用额度和利率或计划追加销售和交叉销售活动;保留活动投放的概率或预测偿还债务金额的可能性或为收集目的“自我治疗”的可能性。
一旦明确了理论框架和模型设计,我们就可以为CRISP-DM的下一步做好准备。 在不同情况下进行轻微修改后,信用评分卡开发流程的典型步骤如下表所示。
表1.建立标准信用风险评分卡模型的典型步骤
系列之前:信用评分:第1部分:为什么要进行信用评分?
系列之后:信用评分:第3部分 - 数据准备和探索性数据分析
作者: Natasha Mashanovich, Senior Data Scientist at World Programming, UK 原文链接:https://www.worldprogramming.com/blog/credit_scoring_pt2
版权声明:作者保留权利,严禁修改,转载请注明原文链接。