首页
学习
活动
专区
圈层
工具
发布

风控ML | 风控建模中怎么做拒绝推断

02 为什么要做拒绝推断 在我们的生活中,有很多关于幸存者偏差的例子,比如我们身边的同事月收入都是过万,就误以为大多数人都是这样子,身边的人都是本科毕业,就以为大多数人都上过大学。...《风控建模中的样本偏差与拒绝推断》https://zhuanlan.zhihu.com/p/88624987 不过我也还是把他文章里的分类体系在这里重点再次分享一下。...以上的5个步骤,就是实施拒绝推断中推断法之一的展开法。...06 总结一下 本文算是一个对拒绝推断的入门介绍了,让初涉风控模型的同学有一个相对来说比较清晰的全局认识,这里面涉及到的很多算法模型上的细节并没有展开来讲,因为我觉得这也会让阅读带来比较大的负担,公众号的文章还是要控制在几分钟内读完比较合适...Reference [1] 异常检测算法分类及经典模型概览 https://blog.csdn.net/cyan_soul/article/details/101702066 [2] 风控建模中的样本偏差与拒绝推断

3K30

风控ML | 风控中的异常检测原理与应用

今天来介绍一下风控中的异常检测,从最基础的概念开始讲起,因为本人对这块的内容平时工作也做得不多,更多滴偏向于“纸上谈兵”,有什么说得不对的地方,也欢迎各位朋友指正~谢谢。...异常检测的概念 02 异常检测的难点 03 异常检测的分类及常见算法 01 异常检测的概念 异常检测(Anomaly Detection 或 Outlier Detection),又称为离群点检测,在我们风控领域很多地方都会用到...抽象来说,就是需要从一堆数据中,找到那个“邻舍不同”(粤语)的点,并能够给出合理的判断和解释。 02 异常检测的难点 为什么说异常检测很难呢?...主要有几个原因: 1)异常点和噪声会混杂在一起,机器难以具体识别开来; 2)现实中很少有异常点的标签,因为标签越多也就意味着遇到过的异常越多,也不符合常识认知; 3)对于标签的定义也是很难,比如1个金融场景...所以很多时候我们在操作的过程中,会先用无监督方法挖掘出异常样本,再基于这些样本去做有监督模型挖掘更多的异常点,这中间也多了一层转化,所以准确率和置信度上也有一定的下滑。

4.4K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    风控ML | 风控建模中GBDT和XGBoost怎么调优

    03 什么风控建模场景下常用这两个明星算法?...贷中 B卡(行为评分卡):S级出场率。 交易反欺诈:A级出场率,主要是支付风控,防止客户进行薅羊毛、套现等行为。 客户流失:A级出场率。 贷后 催收告警:A级出场率。 迁徙率预测:B级出场率。...在风控模型中我们经常也是用来做分类(Classification),但我们知道GBDT的基分类器是CART,即Classification And Regression Tree,所以也可以支持回归建模...而关于风控模型怎么调优,我会在下一节一起讲。...风控模型怎么调优 关于风控模型的调优,先前有篇文章讲得比较细致《风控ML[7] | 风控模型调优的思路有哪些》,大家可以移步去回顾一下。

    2.6K30

    风控ML | 风控建模的KS

    我们这做风控模型的时候,经常是会用KS值来衡量模型的效果,这个指标也是很多领导会直接关注的指标。今天写一篇文章来全面地剖析一下这个指标,了解当中的原理以及实现,因为这些知识是必备的基本功。...不过这不影响我们去使用它,我们只需要知道在风控中是怎么实现的,并且在实际场景中怎么去使用它就可以了。就如上面我们说的,KS在风控主要是用于评估模型的好坏样本区分度高低的。什么是区分度?...可以看下图: 从业务上来说,就是越往后的箱子,客户的质量越差,rate整体上呈现单调性,从而可以把大多数的坏人,直接从箱的维度上就可以区分开来了,在后续的风控策略使用体验上十分友好。...02 KS的生成逻辑 KS的生成逻辑公式也是十分简单: 好样本累计占比坏样本累计占比 在风控领域,我们在计算KS前一般会根据我们认为的“正态分布原则”进行分箱,一般来说分成了10份,然后再进行KS的计算...03 KS的效果应用 KS的值域在0-1之间,一般来说KS是越大越有区分度的,但在风控领域并不是越大越好,到底KS值与风控模型可用性的关系如何,可看下表: 004 KS的实现 首先我们来对上面展示的例子进行

    6.1K31

    风控中的大数据

    风控的意义 何为风控?字面含义就是对于风险的控制从而使财务不受到损失。对于任何一家金融机构(包括银行,小贷,P2P等)来说,风控的重要性超过流量、体验、品牌这些人们熟悉的指标。...这其中除了一部分明显的自融欺诈外,大多数平台垮掉的原因还是风控不过关。 ◆◆◆ 2. 风控的核心 风险控制需要做什么?与逾期率的绝对数值相比,对风险的控制能力要重要得多。...国际上传统的风控方法 风控的核心是要准确预测每一笔借款违约概率。显而易见,这需要量化的工具,也就是模型。...x ,y:在美国,人们一般在上大学的时候就会拥有人生中第一张信用卡。这样等到后续买房(房贷)买车(车贷)的时候,就已有了不短的信用历史了。...大数据风控的挑战 伴随着机遇同样也有挑战。就像要有美味的菜肴,我们既需要好的材料,也需要好的厨师,当前大数据在风控中运用的挑战主要还是在数据和人才这两方面。

    2K120

    风控ML | 风控建模的WOE与IV

    「风控ML」系列文章,主要是分享一下自己多年以来做金融风控的一些事一些情,当然也包括风控建模、机器学习、大数据风控等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步!...第一次接触这两个名词是在做风控模型的时候,老师教我们可以用IV去做变量筛选,IV(Information Value),中文名是信息值,简单来说这个指标的作用就是来衡量变量的预测能力强弱的,然后IV又是...: 第i组中响应客户数量 : 全部响应客户数量总和 :第i组中未响应客户数量 :全部未响应客户数量总和 响应/未响应:指的是自变量每个记录对应的目标变量的值,目标变量的值为0或1,...04 Python实现 我们知道,针对连续型变量,是需要先转换为类别变量才可以进行IV值的计算的,现在我们把数据导入到Python中,原始变量是连续型变量,那么我们如何在Python里实现IV值的计算呢

    4.7K20

    信贷风控模型搭建及核心风控模式分类

    2.评分卡的意义 在互联网金融风控体系中,量化分析需要贯穿始终,评分卡模型是其中非常重要的一环。...3.评分卡的开发应用 在互联网金融评分卡开发过程中,我们仔细研究了企业风控操作流程,反复推敲了模型构建步骤,最后我们认为从业务应用角度,评分卡开发应用应遵循: 业务定义➡️风险定义 ➡️风险分解➡️...直到我们和某P2P公司的风控经理实际交流后才明白这其中的含义。在传统银行信用卡业务中,是很喜欢这类少量逾期的客户的,因为他们能给银行创造罚息,但是又不是恶意违约那种客户。...另外,风控模型在不同的阶段体现的方式和功能也不一样。...所以说,风控模型的计算策略和机制在一个公司属于绝密,规则除了核心的员工,其他人是不能知道风控规则的。 四、风控的核心 如果说金融产品的核心是风控,那么风控的核心是什么?

    4K11

    构建高并发风控中台:基于车辆过户查询API的资产溯源方案

    数字化车务管理的最后一块拼图:车辆流转档案的自动化获取在大型二手车交易平台、融资租赁公司以及车队管理企业的业务流中,每天涉及数以千计的车辆资产评估。...对于核心业务系统而言,无法实时获取车辆的“过户履历”,就意味着风控模型中缺失了最关键的“资产流动性”维度。车辆过户查询API,专为高并发、高稳定性的企业级应用设计。...为了保持代码简洁,复杂的AES算法细节已封装在工具方法中,重点展示业务流程与异常处理。...将transTimeSum(过户次数)作为一个独立的惩罚因子引入算法中,可以显著提升估值的准确性。例如:设定规则,每增加一次非直系亲属过户,评估价下浮2%。...在数据驱动决策的今天,车辆过户查询API不仅仅是一个查询工具,更是企业资产风控体系中的核心组件。

    18110

    风控建模中的IV和WOE

    在风控建模中IV(信息价值)和WOE(证据权重)分别是变量筛选和变量转换中不可缺少的部分。 很多文章已经讨论过这两个变量,本文在吸收前人优秀成果的基础上,希望用通俗易懂的语言让大家快速理解这两个变量。...并用简单的例子让大家明白在实际中如何运用这两个变量,最后给出建模过程中实际需要用到的Python代码。 1....表 1 - 极端例子1(用第一种方法算WOE) 从表1可知,如果该分箱中坏人在总坏人中的占比和的该分箱中的好人在总好人中占比相同,WOEi为0。...表 3 - 极端例子2(算IV) 从表3知,该组别中坏样本占比和好样本占比的差异性越大,该组中WOEi的绝对值越大。...,针对不在组别1中的数据另外进行分析。

    2.7K30

    构建高并发风控中台:消费交易特征API的Java调用与数据解析

    一、构建企业级数据风控中台在构建企业级信贷审批系统、保险核保平台以及大型电商会员体系时,如何从海量数据中实时获取用户的精准画像,是决定业务风控能力的关键。...本文将以此为核心,面向Java开发者,详细介绍如何在SpringBoot等企业级环境中集成此API,解析其加密数据结构,并探讨如何利用这些特征数据构建稳健的企业风控应用。...四、字段详解(企业级风控重点)下表筛选了对金融信贷和企业风控最具参考价值的字段。请注意,API为了数据脱敏,大量采用了区间映射机制(具体映射关系需参考文档5.2章节5)。...字段编码字段含义数据类型/说明风控应用价值tap028消费能力评分Integer(200-900)核心指标。200分代表无交易记录(白户),分数越高代表消费能力越强,是授信额度的直接参考。...五、应用价值分析:从数据到决策在Java微服务架构中,API通常作为“风控中台”的一个核心数据源,其应用价值体现在以下几个维度:1.贷前自动化审批(Pre-loanApproval)在信贷审批流中,系统可自动调用

    32710

    支付风控模型

    二、基于规则的风控 规则是最常用的,也是相对来说比较容易上手的风控模型。从现实情况中总结出一些经验,结合名单数据,制定风控规则,简单,有效。 常见的规则有: 1....比如: 用户ID是在风控黑名单中。 用户身份证号在反洗钱黑名单中。 用户身份证号在公检法协查名单中。 用户所使用的手机号在羊毛号名单列表中。...它是其它风控模型的基础。实践中,首先使用已知的规则来发现存在问题的交易,人工识别交易的风险等级后,把这些交易作为其它有监督学习的训练数据集。...互联网金融风控离不开机器学习,特别是支付风控。 在各种支付风控模型中,决策树模式是相对比较简单易用的模型。 如下的决策树模型,我们根据已有的数据,分析数据特征,构建出一颗决策树。...支付风控场景分析 ; 支付风控数据仓库建设 ; 支付风控模型和流程分析(本文); 支付风控系统架构 发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn

    4.2K22

    风控中的大数据和机器学习

    本篇文章只关注个人信用借款的风控。抵押贷,企业贷不在讨论范围中。 ◆ ◆ ◆ 1. 风控的意义 何为风控?字面含义就是对于风险的控制从而使财务不受到损失。...风控做得好与坏直接决定了一家公司的生与死,而且其试错成本是无穷大的,往往一旦发现风控出了问题的时候就已经无法挽回了。截止到2015年底,全国总共3000多家P2P平台里超过三分之一已经倒闭。...这其中除了一部分明显的自融欺诈外,大多数平台垮掉的原因还是风控不过关。 ◆ ◆ ◆ 2. 风控的核心 风险控制需要做什么?与逾期率的绝对数值相比,对风险的控制能力要重要得多。...国际上传统的风控方法 风控的核心是要准确预测每一笔借款违约概率。显而易见,这需要量化的工具,也就是模型。...大数据风控的挑战 伴随着机遇同样也有挑战。就像要有美味的菜肴,我们既需要好的材料,也需要好的厨师,当前大数据在风控中运用的挑战主要还是在数据和人才这两方面。

    1.3K30

    风控中必做的数据分析

    大数据领域就没有不做数据分析的,大数据风控也不例外。 我的观点是风控和其他互联网业务都是互通的,本文介绍下风控中必做的数据分析,用以说明数据分析是一通百通的。 工欲善其事,必先利其器。...01 业务理解 如果一家金融机构聘请你给他们的风控业务做咨询,你知道怎么办吗? 别告诉我,你想硬搬风控建模比赛的那套东西。不要掉价。 解决方案一定是针对当前业务和用户客群独家定制的。...通过KYC,你可以大致知道发力的方向在哪里,是拓展新户还是挖掘存户,是提升风控能力还是优化产品设计,等等。 02 漏斗分析 进件漏斗分析可以帮助我们定位到产品设计的薄弱位置,从而针对优化。...vintage分析把不同期的样本放在了一起,可以用来观察不同期客群风险的变化,然后确定是流量本身的变化,还是宏观形形势的变化,还是风控策略的变化等等。...如大家所见,在风控领域所在的数据分析,应该和其他互联网领域的数分并无本质区别。 因为风控和其他业务一样,本质都是用户生命周期管理。基于相同的底层逻辑,数据分析必然也并无二致。

    1.9K30

    构建金融风控中台:基于天远API的个人风险报告接入与数据解析

    一、打造金融级的数据风控中台在信贷审批、保险核保、大额资产租赁以及企业高管背景审查等严谨的业务场景中,单一的数据源往往难以描绘出完整的用户风险画像。...本文将面向Java后端工程师,特别是使用SpringBoot构建微服务架构的开发者,详细阐述如何将此API封装为标准化的RPC服务,解析其复杂的组合包结构,助力企业构建稳健的自动化风控决策引擎。...DWBG8B4D(谛听多维报告):核心风控数据源,包含评分、标签和借贷统计。FLXG0V4B(个人司法涉诉):详细法律文书数据源,包含民刑行案件及失信记录。...2.风险预警标签(DWBG8B4D->riskWarning)此模块包含大量布尔型(0/1)标记,是风控引擎的决策依据。...六、总结个人风险报告API为Java开发者提供了一套标准化的风控数据接入方案。通过一次接口调用,即可获取涵盖征信、司法、社会安全等维度的全量数据。

    30610

    风控领域特征工程

    在金融行业,风险控制(风控)是核心环节,它关乎资产安全、合规性以及机构的长期稳健发展。随着大数据时代的到来,金融机构面临着前所未有的数据量和复杂性。...在这样的背景下,风控领域特征工程应运而生,成为连接原始数据与精准风险评估的桥梁。 特征工程,简而言之,是对数据的一种深度加工,它通过一系列技术手段,将原始数据转化为对风险预测有用的信息。...在风控领域,特征工程的核心目标是构建出能够准确反映个体或实体风险水平的特征集。...此外,良好的特征工程实践还能促进模型的解释性,为风控决策提供更加透明的依据。 随着技术的发展,特征工程的方法也在不断创新。...通过综合运用这些特征衍生方法,风控领域的特征工程能够更全面地挖掘数据潜力,为风险评估提供多维度的视角。

    2.2K11
    领券