笔者邀请您,先思考:
1 信用评分卡如何做高级分析?
上一篇:信用评分卡 : 变量选择
当一位年轻的商业分析师向我们讲述他最近回家的事件时,充满分析师的房间爆发出一阵响亮的笑声。 一位遥远的阿姨询问了他的新职业。 他的回答 - 我正在进行建模。 她兴高采烈地问道 - 它只是在坡道上还是我会在电视上看到你? 开玩笑,这让我想知道建模或模型这个词的根源。 什么是模型?
模型被定义为现实的简化表示。 现实的表现,嗯,照片是现实的代表 - 在卷轴上捕捉现实的瞬间 - 这使它成为一个模型。 我想是的。 同样,报道一个事件并将其作为突发新闻的报纸记者也是一个模型 - 描述性模型。 现在,让我们尝试将模型与Google Analytics相关联。
由于信息技术的出现,分析得到了巨大的推动。我们生活在大数据时代。在业务流程的每个阶段收集的大量数据都需要从信息中提取知识。这整个过程有三个方面
随着数据量的呈指数增长,Hadoop和大数据技术正在取代数据仓库。但是,商业智能和预测分析的思维过程 - 本文的重点 - 不会发生太大变化。让我尝试使用我在专业剧院学到的东西来区分商业智能和预测分析。
几年前我加入了一个专业剧团。 为了理解表演的细微差别,我们从即兴剧开始。 这种形式的剧没有预定义的剧本,但演员在表演时建立了故事。 大多数人都认为我是一个很好的即兴演员。 然而,在表演时记住对话的风格对我来说并不是很好,因此它是我戏剧演出的结束。 但是,我从整个经历中学到了一些好的教训。 其中一个是解读一个角色来制作戏剧的五个W.
显然,前四个问题试图报告现实的现实版本 - 描述性模型。 这正是商业智能专业人员试图通过花哨的报告平台和软件实现的目标。 第五个问题是最棘手的问题。 让科学家和好奇的头脑在深夜醒来的问题。
一棵苹果从树上掉下来。 回答前四个问题有多难? 我们大多数人都可以借助时钟和地图来回答这些问题。 然而,Isaac Newton回答了第五个问题和他的回答 - Gravity。 如果他已经停在那里,那么在他出生后近四百年后,没有人会想起他。 他给出了一个数学模型来解释这种现象。
用任何其他物体替换苹果和地球,你就可以得到模型的一般公式。 阿尔伯特爱因斯坦确实粉碎了牛顿的重力概念。 然而,这种模型仍然适用于所有实际问题,并广泛用于火箭科学。
高级分析试图通过预测建模来回答第五个问题,即为什么会发生某些事情。 高端统计和数据挖掘技术与分析师的商业敏锐度相结合,可以生成帮助组织做出明智决策的模型。 请记住,这只是一个开始,因果关系仍然是一个公平的距离!
信用记分卡是预测借款人违约贷款概率的模型。 以下是具有三个变量的信用评分的简化版本
信用评分=年龄+贷款与价值比率(LTV)+分期付款(EMI)与收入比率(IIR)
一名28岁男子的LTV为75,IIR为60,他的得分为10 + 50 + 5 = 65,因此信用风险很高。
现在的问题是,我们是如何得出存储分数和相关风险表的? 到目前为止,在完成系列的前三篇文章之后,你必须知道我们将如何去做。 我们有一个好/坏借款人的历史清单(文章2),我们希望使用预测变量来区分(文章3)。 有几种统计和数据挖掘技术可以帮助我们实现我们的目标,例如
Logistic回归是最常用的技术。 我们将在下一篇文章中探讨有关逻辑回归的更多信息。
我必须在结束本文时说,优秀的分析师找到了一个很好的数学模型,就像模特走在T台上一样漂亮。
作者:Roopam Upadhyay
原文链接:
http://ucanalytics.com/blogs/credit-scorecards-advanced-analytics-part-4/
版权声明:作者保留权利,严禁修改,转载请注明原文链接。