00 Index 01 什么是拒绝推断? 02 为什么要做拒绝推断? 03 什么时候做拒绝推断? 04 做拒绝推断都有哪些方法?...04 做拒绝推断都有哪些方法 这里的方法介绍,我在知乎上看到汪哥的相关文章,写得真的是太棒了!我比较难超越了,就把他的原文链接贴过来,大家可以去看看哦。...《风控建模中的样本偏差与拒绝推断》https://zhuanlan.zhihu.com/p/88624987 不过我也还是把他文章里的分类体系在这里重点再次分享一下。...06 总结一下 本文算是一个对拒绝推断的入门介绍了,让初涉风控模型的同学有一个相对来说比较清晰的全局认识,这里面涉及到的很多算法模型上的细节并没有展开来讲,因为我觉得这也会让阅读带来比较大的负担,公众号的文章还是要控制在几分钟内读完比较合适...Reference [1] 异常检测算法分类及经典模型概览 https://blog.csdn.net/cyan_soul/article/details/101702066 [2] 风控建模中的样本偏差与拒绝推断
比如下面是其中一个xx类的规则,它在线上已有的判断逻辑是:>=4时命中拒绝,否则未命中通过。...制定策略方案 制定策略优化的方案是一个分析的过程,确定好之后需将策略用代码在当前离线分析环境下执行。...理论上来说,做规则阈值收紧的D类调优后,通过率和逾期率会同步下降,如何去评估调优后的效果呢? 可以“对比通过率和逾期率下降的幅度”来评估是否有效。...因为通过率和逾期率的量纲不一致,对比绝对值是没有意义的,因此可对比相对值。...此外还要注意,如果是日常策略调整(微调),业务上不允许大幅度的下降通过率,这会直接导致业务不稳定;如果是做大规模的收紧调整,通过率下降幅度较大的情况,则需要更详细的效果测算。
本篇来介绍下风控中的拒绝回捞策略,内容节选自《100天风控专家》第65期。 1. 什么是拒绝回捞? 拒绝回捞是指 “被拒绝的客户重新通过的过程”。 广义理解上等同于做A类调优,涵盖各类调优方法。...狭义理解上,是决策流程中的一个回捞动作,或者回捞节点,如下图所示。 从图形化更形象的角度解释,相当于在已经策略规则拒绝客户中上再切出一刀进行通过,且通过的大部分需为好客户。 2....1)什么是明显的好客户特征呢? 可以参考白名单的筛选规则,比如,客户是公务员、事业单位或者500强集团企业员工;再比如客户公积金缴存基数大于xxx,等等。...下面是一个并行回捞规则集的示例: 公司前期一直对白户拒绝,当下想要下探客群对白户进行适当放开。那么在征信数据全无的情况下,可以借助三方数据来补充信息。...下面是一个基于三方数据源的融合模型分,基于以往贷后表现分箱并统计了分箱下的区间坏账率bad rate。
我们这做风控模型的时候,经常是会用KS值来衡量模型的效果,这个指标也是很多领导会直接关注的指标。今天写一篇文章来全面地剖析一下这个指标,了解当中的原理以及实现,因为这些知识是必备的基本功。...,后面怎么地就用到了风控模型的区分度评估就不知道咯。...不过这不影响我们去使用它,我们只需要知道在风控中是怎么实现的,并且在实际场景中怎么去使用它就可以了。就如上面我们说的,KS在风控主要是用于评估模型的好坏样本区分度高低的。什么是区分度?...可以看下图: 从业务上来说,就是越往后的箱子,客户的质量越差,rate整体上呈现单调性,从而可以把大多数的坏人,直接从箱的维度上就可以区分开来了,在后续的风控策略使用体验上十分友好。...03 KS的效果应用 KS的值域在0-1之间,一般来说KS是越大越有区分度的,但在风控领域并不是越大越好,到底KS值与风控模型可用性的关系如何,可看下表: 004 KS的实现 首先我们来对上面展示的例子进行
本篇来介绍下风控中的策略收紧,内容节选自《100天风控专家》第67期。 1. 什么是策略新增? D类调优可分为宏观和微观两个层面的。...制定策略&效果测算 在策略调优的需求下,新策略开发只是其中一环,能否融入旧策略中,还需要测算整体策略的效果,主要的关注点是新策略能否带来增益,一是额外命中的比例有多少?...可能二者的相关性较高,或者重叠度较大,大部分是重复命中的,那么新增后也不会有多大提升效果。...因此,该部分的数据分析流程:可先进行相关性的分析,或者做二维交叉的决策矩阵,看分布下是否“互有单调性”,最后再通过命中率的测算来看最终效果。...以上来自原创课程中的节选,“Python代码实操视频讲解” 的完整内容(如下示例),在《100天风控专家》中进行视频更新。
大数据领域就没有不做数据分析的,大数据风控也不例外。 我的观点是风控和其他互联网业务都是互通的,本文介绍下风控中必做的数据分析,用以说明数据分析是一通百通的。 工欲善其事,必先利其器。...01 业务理解 如果一家金融机构聘请你给他们的风控业务做咨询,你知道怎么办吗? 别告诉我,你想硬搬风控建模比赛的那套东西。不要掉价。 解决方案一定是针对当前业务和用户客群独家定制的。...需要说明的是,对于业务的理解,需要分析的绝不止以上内容。 通过KYC,你可以大致知道发力的方向在哪里,是拓展新户还是挖掘存户,是提升风控能力还是优化产品设计,等等。...vintage分析把不同期的样本放在了一起,可以用来观察不同期客群风险的变化,然后确定是流量本身的变化,还是宏观形形势的变化,还是风控策略的变化等等。...如大家所见,在风控领域所在的数据分析,应该和其他互联网领域的数分并无本质区别。 因为风控和其他业务一样,本质都是用户生命周期管理。基于相同的底层逻辑,数据分析必然也并无二致。
风控定义 风控是风险控制的简称,在百度百科中是这么定义风险控制的。 风控在我们日常生活中随时可见,小到账户登录验证码,都可以算是一种风控的手段。...这里我们着重了解下信贷下的风控,结合了场景的风控,则赋予了更多的意义。...信贷风控的目标是「利益最大化」,而不是没有风险,在风险和利润之间找到平衡,是信贷风控的核心。...,以及在信贷场景下的风控如何实现,风控的目标永远是降风险,但不是一味地降,在不同场景下有不同的考虑。...文章例子参考《智能风控平台:架构、设计与实现》
「风控ML」系列文章,主要是分享一下自己多年以来做金融风控的一些事一些情,当然也包括风控建模、机器学习、大数据风控等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步!...第一次接触这两个名词是在做风控模型的时候,老师教我们可以用IV去做变量筛选,IV(Information Value),中文名是信息值,简单来说这个指标的作用就是来衡量变量的预测能力强弱的,然后IV又是...:第i组的IV值 :等于 :等于 可以看看下面的表格理解一波,变量A是一个连续型变量,值域是v1-vx,当前根据某些分箱方式分成了m组,具体的分组情况如下所示: 01 WOE...的原理 WOE是weight of evidence的缩写,是一种编码形式,首先我们要知道WOE是针对类别变量而言的,所以连续性变量需要提前做好分组(这里也是一个很好的考点,也有会说分箱、离散化的,变量优化也可以从这个角度出发...对于上面的公式我们还可以 简单做一下转化: 所以,WOE主要就是体现组内的好坏占比与整体的差异化程度大小,WOE越大,差异越大。
信贷工厂模式的特点是效率高,可以进行量化审核。过程之间环环相扣,对每个环节都有专人把控具体的把控。正因为这样,意味着需要消耗大量的人力成本,每个流程都需要对口的人员做支撑。...2.评分卡的意义 在互联网金融风控体系中,量化分析需要贯穿始终,评分卡模型是其中非常重要的一环。...一开始我们的技术人员对这个“少量逾期”这个分类很疑惑,不能理解这个分类到底是好还是坏。直到我们和某P2P公司的风控经理实际交流后才明白这其中的含义。...另外,很多金融公司的风控模型的设计不管是对于最终高评分的用户还是对于存疑的进见,都需要最后的人工进行确认。...所以说,风控模型的计算策略和机制在一个公司属于绝密,规则除了核心的员工,其他人是不能知道风控规则的。 四、风控的核心 如果说金融产品的核心是风控,那么风控的核心是什么?
「风控ML」系列文章,主要是分享一下自己多年以来做金融风控的一些事一些情,当然也包括风控建模、机器学习、大数据风控等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步!...01 机器学习模型不可解释的原因 前些天在同行交流群里,有个话题一直在群里热烈地讨论,那就是 如何解释机器学习模型 ,因为在风控领域,一个模型如果不能得到很好的解释一般都不会被通过的,在银行里会特别的常见...比如A模型的特征X1的重要度是10,那么如果我们在模型里给特征X2加些权重以增大其重要度,重新计算重要度后,特征X1的重要度仍是10。...4)Gain:即增益,由Breiman等人提出的一种全局的特征重要度计算方法,在XGBoost、scikit learn等包中都可以调用,它是给定特征在分裂中所带来的不纯度的减少值,经常会被用来做特征选择...03 SHAP可能是出路,SHAP到底是什么 SHAP(Shapley Additive exPlanation)是解释任何机器学习模型输出的统一方法。
风险管理的目标是减少和消除EL,但是更concern UL,A对 承担风险的数量和潜在损失的大小不是绝对相关的,B错 风险管理的最后一步是监控,C错 风险是不确定性,不确定性是不会消失的,采用风险转移只是把风险转给了别的公司...分析利率急升的影响是要使用Stress Testing的,而压力测试是ERM的一个方法,所以答案是C 01.4 区别EL和UL Expected Loss在正常业务情况下有多少损失是预计会发生的,容易预测和计算...借款损失被资金和资产的利差覆盖了,这个是期望的情况,所以损失是EL。...Settlement risk是在市场上交易双方在最终交割时一方不能交割的不确定性 答案是A 和坚叨叨:这题的考点是信用风险下的四个分类,所以大家要对风险分类掌握这个问题: XX风险究竟是什么的不确定性...分析师的结论是70%的概率会收购,而他的opinion是可能会降级。所以报告说70%概率会降级是不合适的
一、风险等级 做风控拦截,首先要回答的问题是风险等级怎么划分? 目前主流的风险等级划分有三种方式, 三等级、四等级、五等级。 三等级的风险分为 低风险、中风险和高风险。...由于一般计算频率是按照自然时间段来进行的,所以如果用户的操作是跨时间段的,则会出现频率限制失效的情况。 当然,比较复杂的可以用滑窗来做。 对不同的风险等级设置不同的阈值。...而机器学习是解决这些问题的利器。 互联网金融风控离不开机器学习,特别是支付风控。 在各种支付风控模型中,决策树模式是相对比较简单易用的模型。...这个过程,将在下一篇的风控架构中介绍。 五、模型评估 风控本质上是对交易记录的一个分类,所以对风控模型的评估,除了性能外,还需要评估“查全率”和“查准率”。...从实际应用情况来看,目前国内大部分团队使用Logistic回归+评分模型来做风控,少数人使用决策树。
今天来介绍一下风控中的异常检测,从最基础的概念开始讲起,因为本人对这块的内容平时工作也做得不多,更多滴偏向于“纸上谈兵”,有什么说得不对的地方,也欢迎各位朋友指正~谢谢。...异常检测的概念 02 异常检测的难点 03 异常检测的分类及常见算法 01 异常检测的概念 异常检测(Anomaly Detection 或 Outlier Detection),又称为离群点检测,在我们风控领域很多地方都会用到...公式如下: 其中,A是实际频数,E是期望频数。...然后我们会基于Residual曲线做离群点检测。...0306 基于聚类的算法 聚类算法我们遇过了很多,比如上面提到的KMeans,而利用聚类算法来做异常检测无非是基于3种假设。 1、孤立的,无法归属于任何簇的点为异常点。
「风控ML」系列文章,主要是分享一下自己多年以来做金融风控的一些事一些情,当然也包括风控建模、机器学习、大数据风控等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步!...02 数据搜集处理(Data Curation) 当我们确定了要开发的模型之后,这个时候需要做的是搜集数据与处理数据了。...顾名思义,这一步也就是收集你可以用的数据去训练模型,而这是我认为是最为重要的一步。...”或者是无法上线的变量,这往往是和业务逻辑是挂钩的,在上一步的Business insight过程需要了解清楚。...如果是一些深度学习相关的模型算法就另当别论。 3、对于模型算法的选择,如果不知道选啥,可以都试试看看效果最直接。
大家好,又见面了,我是你们的朋友全栈君。 一套完整的风控体系,在风控中,少不了决策引擎,今天就浅谈一下风控决策引擎。...一、优先级 风控决策引擎是一堆风控规则的集合,通过不同的分支、层层规则的递进关系进行运算。而既然是组合的概念,则在这些规则中,以什么样的顺序与优先级执行便额外重要。...风控系统的作用在于识别绝对风控与标识相对风险,如果是绝对风控,则整套风控的审核结果便将是“拒绝”。既然结果必然是“拒绝”,则没必要运行完所有的风控规则,而主要单条触发“拒绝”即可停止剩余规则的校验。...具体的记录与统计内容,主要如下: 1、触发的具体风控规则 举例说明:通过两种不同的视角进行记录,一是用户与订单层面,记录其所触发的明细规则;二是风控规则层面,记录某条风控规则具体的触发率。...(聚信立) 四、建模 现金贷风控体系较简单。如果是固定额度与固定费率式的产品业务定价,则风控体系更多的是规则的集合。
某证券行业头部券商在二十余年创新发展过程中逐渐形成了以风控为本创新驱动,服务实体经济发展的理念。在战略规划中将金融科技应用视作首要战略支柱,长远目标是要打造智慧型数字化金融平台。...合规风控始终是公司的首要核心竞争力,该券商不断推进全面风险管理体系建设,需要全方位提升主动合规风控管理能力,进而提升风险管理精细化、智能化水平。...而由于合规风控处于企业核心竞争力的高度,原风控数据积累10年,数据量已超30TB。...非现场风控平台各项报表和查询生成时间逐渐拉长。夜间批量任务越来越慢,部分任务出现超时失败现象。 02 原合规风控数据库数据量巨大,原有的传统的备份手段难以实现数据的实时保护。...价值提升 1 通过QData数据库云平台大幅提升了风控系统的业务效率,风控日终调度业务从原十几个小时缩短至1.5小时,性能提升10倍以上。
在金融行业,风险控制(风控)是核心环节,它关乎资产安全、合规性以及机构的长期稳健发展。随着大数据时代的到来,金融机构面临着前所未有的数据量和复杂性。...在这样的背景下,风控领域特征工程应运而生,成为连接原始数据与精准风险评估的桥梁。 特征工程,简而言之,是对数据的一种深度加工,它通过一系列技术手段,将原始数据转化为对风险预测有用的信息。...在风控领域,特征工程的核心目标是构建出能够准确反映个体或实体风险水平的特征集。...通过综合运用这些特征衍生方法,风控领域的特征工程能够更全面地挖掘数据潜力,为风险评估提供多维度的视角。...总结来说,特征工程是金融风控领域中不可或缺的一部分,它不仅需要技术专长,还需要对数据的深入理解和创新的思维。通过综合考虑数据特性、应用需求和领域知识,我们可以构建出能够显著提升模型性能的特征集。
03 什么风控建模场景下常用这两个明星算法?...在风控模型中我们经常也是用来做分类(Classification),但我们知道GBDT的基分类器是CART,即Classification And Regression Tree,所以也可以支持回归建模...而关于风控模型怎么调优,我会在下一节一起讲。...,比如auc、error、mae、rmse等等,在风控模型中我们经常就是做评分卡,所以auc相对来说是最为常用的。...风控模型怎么调优 关于风控模型的调优,先前有篇文章讲得比较细致《风控ML[7] | 风控模型调优的思路有哪些》,大家可以移步去回顾一下。
确定建模目的 在信贷领域中建立风控模型是为了找出可能会逾期的客户,根据逾期的可能性和资金的松紧程度选择是否放贷。 在支付领域建立风控模型是为了找出可能存在非法经营的商户,保证商户没有违法经营。...确定好坏样本逻辑 在信贷领域中逾期大于x期(不同公司取值不同)的客户定义为坏客户(1),从未逾期的客户定义为好客户(0) 在支付风控领域中,有赌博、欺诈、套现、伪卡等行为的商户定义为坏商户(1)(具体根据模型要防控的风险决定...特征工程 在风控领域一直都有这样一句话 “数据决定了机器学习的上限,而算法只是尽可能逼近这个上限”,这里的数据指的就是经过特征工程得到的数据。通俗的讲就是衍生变量去捕获风险客户。...模型上线 在支付风控领域如果模型验证没有问题,一般会上到线上,自动生成案例。在信贷中会模型搭配规则,判断申请贷款的人是通过放贷、拒绝放贷、还是转人工处理。...本文所讲的都是大致流程,没有深入展开分析,在之后的各期中会逐步展开这里所讲的每一小点,给所有需要从事风控模型的同学一点建议。 以上都是我在建模过程中的一点经验总结,有不正之处恳请指正!
一个优秀的模型上线报告以及一个优秀的上线后模型监控报表,在我们日常风控建模中是非常的常用并且有用的,今天这个话题就来和大家聊聊怎么去制作优秀的模型上线报告以及上线后的模型监控报表,主要聊聊思路,先要有一个全局的感受...以下内容均基于自己浅薄的经历提炼的,如有纰漏,欢迎指正或补充哦,欢迎交流~ 00 Index 01 聊聊为什么要做这件事 02 标配的风控模型上线报告应具备哪些内容 0201 模型现状 0202 KS值与各种曲线...02 标配的风控模型上线报告应具备哪些内容 0201 模型现状 想要突出你模型的好,你得先分析旧模型的不好。 比如说,把目前线上模型的实际表现进行统计,如KS值、分组排序性、PSI等基础指标。...0202 KS值与各种曲线 我们需要描述模型的效果,在风控领域最直接的指标就是KS值,我们一般会认为KS>0.3才具备最基本的上线要求,而且我们要保证训练集、测试集以及跨时间测试集都需要达到标准哦!...一般情况下,我们会对预测结果按照一定的阈值,进行分组,比如分为A/B/C/D/E/F共6组,越靠后就意味着越有可能是高风险客户,我们给予一定的风控规则进行拦截。
领取专属 10元无门槛券
手把手带您无忧上云