对于企业来说,我们按照融资主体的融资用途,分 别使用企业融资模型,现金流融资模型,项目融资模型等模型。而对于个人来说,我们有”四张卡“来评判个人的信用程度:A卡,B卡,C卡和F卡。 而众人常说的“评分卡”其实是指A卡,又称为申请者评级模型,主要应用于相关融资类业务中新用户的主体评级,即判断金融机构是否应该借钱给一个新用户,如果这个人的风险太高,我们可以拒 绝贷款。 4.5 建模与模型验证 woeall_vali = {} for col in bins_of_col: woeall_vali[col] = get_woe(vali_data,col,"SeriousDlqin2yrs model_woe.iloc[:,:-1] y = model_woe.iloc[:,-1] lr = LR().fit(x,y) lr.score(vali_x,vali_y) C是正则化强度的倒数,C越小,损失函数就越小,模型对损失函数的惩罚越重 solver:默认是liblinear,针对小数据量是个不错的选择,用于求解使模型最优化参数的算法,即最优化问题的算法 max_iter:所有分类的实际迭代次数,对于liblinear求解器,会给出最大的迭代次数
不过,作为一家起家于P2P的金融科技企业,在网贷业务上几经转型的陆金所,如今却依旧难脱“放贷创收”的旧窠臼。 据招股说明书资料显示,截止2020年6月30日,陆金所控股管理贷款余额5194亿元,位列市场第二,累计借款人数1340万;在财富管理方面,陆金所控股管理客户资产规模3747亿元,位列市场第三,活跃投资者人数达到了 从具体业务来看,信贷业务方面,陆金所控股主打大额借贷。截至2020年中,平安普惠平均无抵押借款规模为14.65万元,有抵押平均借款规模为42.24万元,远高于大部分同类企业。 总的来看,作为一家创业型金融科技企业,陆金所仅用了不到10年的时间,就已经具备如此体量规模,其所取得的成绩可谓亮眼。 一路背靠大树乘凉 能取得如此成绩,与平安的扶持分不开。 截至今年6月30日,公司承担的信用风险敞口仅为2.8%,零售信贷业务和资产管理业务的信用风险主要由合作伙伴承担。 除了分摊风险之外,撮合贷款还有利于陆金所的独立发展。
一键领取预热专享618元代金券,2核2G云服务器爆品秒杀低至18元!云产品首单低0.8折起,企业用户购买域名1元起…
蚂蚁金服首席数据架构师俞本权这样告诉大数据文摘记者,“但在这个过程中除了风险控制之外,还有很多其他的操作,真正留给风控来检查的时间大概也就两百毫秒左右,在这两百毫秒内我们要做规则的判断、数据及其特征的提取及最终判断这笔转账的风险 ,才能把钱在一秒之中转出去,但在这个过程中除了风险控制之外,还有很多其他的操作,真正留给风控来检查的时间大概也就两百毫秒左右,在这两百毫秒内我们要做规则的判断、数据及其特征的提取及最终判断这笔转账的风险 ,所以每一个毫秒我们都要尽力争取”,俞本权接着说道:“我们现在的数据已经达到了百亿个节点,万亿条边的规模,而且在支付宝的这个应用场景里,支付的频度是非常快的,特别是当双11或双12这种大型促销的时候,QPS GeaBase两大典型应用:风险、诈骗识别与好友推荐 “图数据的最典型应用之一就是进行风险识别和诈骗识别,比如在资金关系网络中,如果我们发现资金的流动形成一个闭环,这就很可能是一个洗钱行为的讯号。” 比如当一个用户在一个设备上进行登陆的时候,蚂蚁金服需要判断这次登陆是不是有风险,如果有风险,就会发送验证码或者问用户一些挑战性的问题来验证这是否是用户本人的操作。
拍拍贷“魔镜风控系统”从平均400个数据维度评估用户当前的信用状态,给每个借款人打出当前状态的信用分,在此基础上,再结合新发标的信息,打出对于每个标的6个月内逾期率的预测,为投资人提供了关键的决策依据 ,促进健康高效的互联网金融。 统计模型的选择长期看似乎是风水轮流转,逻辑回归是最经典的线性分类模型,XGBoost是目前在机器学习竞赛表现普遍很好的集成决策树类模型,神经网络现在如此热门,但是今后也说不定有更强大的模型,况且大家都是对现实的规律进行某种形态的假设和拟合 在最后,我们用加权平均的方法组合模型,虽然是以非常有限的统计和机器学习知识,利用不同模型的一部分独立性在同一层次下进行线性互补,但是至少作为一个省时省力地改进单模型结果和避免增加过拟合风险的方法还是比较稳健的 机器数学模型相比与人类,有着其特质的某种中立性、冷静与洞察力,帮助我们作出决策,同时也有作为机器和数学模型的局限、冷漠和短视,比如在有反馈效应的数据体系中(比如金融市场),预测长期趋势的无能为力,而模型决策趋同所产生的正反馈却可能在危机时造成踩踏风险
这次的分享主要集中在陆金所去O在线换库的技术特点上,之后详细给大家剖析陆金所设计的在线换库方案以及方案如何在一个庞大的金融系统里通过多个团队的紧密配合稳妥落地。 Q3,陆金所的数据库都会完成去Oracle化,整个推进速度还是比较快的; 智能:借助去O对陆金所整个生产环境的架构实现比较大范围的重构,实现从开发到测试再到运维自研各种落地智能工具,来把控去O各个核心环节的质量 3、适用于金融核心系统的稳妥去O推进方案 接下来分享的是大家在去O过程中的一个痛点:我们对大规模的系统进行去O改造,到底要从哪里入手?怎么做才能将系统风险降到最低而且全程可控? 这个痛点也是非常重要的一点,上面说到过陆金所很多系统的规模都很大,我们就会将其拆分成很多个批次。 3、通过去O在各种不同场景引入最合适的存储引擎 陆金所在去O前对存储引擎进行了架构选型,涉及到架构选型的时候会支持哪些业务场景、通过哪些数据库承接。
而另一端“7·18”互金指导意见出台后,P2P网贷行业成为了理财的话题王,陆金所、人人贷等第一梯队平台备受关注。但与热钱滚滚涌入形成鲜明对比的是,今年上半年网贷行业综合收益率持续下降。 2016年上半年,人人贷借款成交金额同比增长44%,这和人人贷WE理财大数据的完善风控体系和小额分散的风控机制不无关系,而陆金所也是一马当先。 所以降息和新政对于P2P等理财平台及其用户而言,短期可能会使得收益下降,但从长远来看,各类理财平台势必从泡沫化向规范化的过渡,从高息揽客、快速做大的互联网思维,向全面把控风险、回归合理收益水平的金融思维转变 尽管我们知道那些不合规的平台将会渐渐退场,但我们仍然需要分辨,陆金所依仗平安的强大背书和多年的金融行业沉淀一骑绝尘,人人贷WE理财携手中国民生银行正式上线资金存管以及巨大的风险备用金逆势前行(截至2016 在高收益和高风险之间选择那些用户体验好、品牌实力强、风控体系完善的第一梯队平台,如在各类榜单中稳居前三的陆金所、人人贷、微粒贷等。BAT京东们的余额宝、蚂蚁金服系等,尽管利息不高,但稳妥方便也可考虑。
一、评分卡的分类 在金融风控领域,无人不晓的应该是评分卡(scorecard), 无论信用卡还是贷款,都有”前中后“三个阶段。 我们最熟悉的,莫过于支付宝的芝麻信用分,又或者知乎盐值(虽然知乎盐值不是评估金融风险的,但也算是评分卡的应用之一) 但是,随着信贷业务规模不断扩大,对风控工作准确率的要求也逐渐提升。 不同分箱会导致IV值不同,但本文是一个baseline模型,所以未对分箱策略做优化。 由于数据集的测试样本是没有标签的,所以我们需要从训练集里分一些验证集出来。用train_test_split函数把数据分成70/30两部分 ? 然后跑模型,模型训练非常快,一下子就完了。 ? 我们来看模型的AUC。业内的经验是,0.80以上就算是可以投入产品线使用的模型。 ? 模型的AUC达到还不错的0.82。由于这里使用数据集的sanity比较好,所以也容易出效果。
风控建模的技术方案 1 逻辑回归模型 在银行的传统评分卡建模中,应用的也是逻辑回归模型。逻辑回归本质上是一个线性分类模型。 对于金融科技公司在建模所遇到的大量的弱特征,如何挖掘多个特征之间的互补性,产生组合的分箱特征是一个技术挑战。 4 深度学习模型 基于深度学习的技术路线会面临两个挑战。一方面,深度学习模型都有很高的模型复杂度,需要大规模的样本数据,而风控领域要获取大规模的样本数据的成本极高。 另一方面,如前所述风控特征数据的维度间是平行的,不存在邻近关系,较难利用CNN和RNN这样具有较好物理含义的深度学习模型,而简单的堆砌若干个全连接层在高维特征数据上是很难得到一个稳定的模型。 总之,金融风控模型是一个既传统又新鲜的技术问题。银行的风控模型已经随着银行业的发展应用了数十年。
其中,这 98% 的数据库覆盖了陆金所的账务、资金、资产中心、支付、交易、用户、基金、主账户、网贷、资管、银行理财等全金融场景。整个去 O 的全程 0 故障、0 风险、对用户几乎不感知。 ? 二是对于高频上线了上百次的去 O 变更,全程 0 故障、0 风险,这一点非常考验陆金所去 O 的变更工具水平。 上生产后兜底如果问题突破了所有检测环节上了生产,如何设计一个兜底方案可以有效控制风险,把影响尽可能降低。 以陆金所的去 O 落地经验来看,一个不起眼的细节问题如果未进行有效管控,都有可能引发严重的生产故障。所以我们可以把陆金所数据库升级平台理解成为一套强大的去 O 风控系统。 在整个去 Oracle 的过程中,陆金所架构从一个传统金融的超大型数据库支持各种核心业务的架构变成了以微服务化驱动的分布式架构,这种架构具备以下特点: 每个服务有自己独立的应用和数据库。
至2020年2月20日陆金所发布的消息,他们已经去掉了90%的Oracle工作,并计划在今年6月份下架最后一台Oracle. 陆金所为什么要考虑去Oracle化,难道仅仅是因为成本问题? 因此如果Oracle一家公司便能完美的帮助陆金所完成这些功能,即使收费再贵,我想也没有理由去急着换血。毕竟上市在即,冒着如此风险带来的经济损失更大。 具体的技术实现细节,可以看这篇文章: 陆金所去Oracle化 https://mp.weixin.qq.com/s/GuERD4O1-W9t0OrA2J4PYA 或直接去InfoQ上搜索标题《独家揭秘陆金所去 而真正令我担心的问题是这些: 陆金所对接了哪些公司,这些公司的技术栈如果是Oracle,是否也要变 陆金所那些Oracle相关供应商,软件的,硬件的,将要失血 陆金所这批资深的Oracle专家,会有多少被市场消化 这很有可能陆金所带头的去Oracle事件,引起平安内部大规模去Oracle活动,导致整个市场上与平安相当体量的oracle用户全部完成去oracle,那彼时,Oracle在中国的市场就会急剧下滑,那么只会
1 客群,产品的客群定位,决定了产品的营销和风控。 2 额度,产品的授信额度,基于风险和收益确定的授信额度(动态化)。 3 利率,产品的利率定价,基于风险和收益进行的利率定价(差异化)。 比方说常用画像分析、关联分析、营销模型、促活模型、交叉销售模型、客群细分模型等。 2 风控端,客户资信的计量与测算? 比方说贷前的反欺诈模型和申请评分模型,贷中的行为评分模型和贷后的催收模型,贷中的账户管理和资产监控与分析,策略的分析与调优等。 3 效率端,客户体验如何提升?人工成本如何优化? 总之,金融科技所服务的业务线众多。 业务知识的学习、积累和应用,可以让我们的数据科学工作接地气,有价值。 我是陆勤,在金融科技行业从事数据科学工作,也是一名终身学习者。 我工作过的内容主要包括数据清洗和准备、风控评分模型、数字营销模型、风控策略分析、数据建模环境构建和维护等。 金融科技专辑 1 金融科技:金融科技与数据科学概述 2 金融科技:技术栈
一个优秀的模型上线报告以及一个优秀的上线后模型监控报表,在我们日常风控建模中是非常的常用并且有用的,今天这个话题就来和大家聊聊怎么去制作优秀的模型上线报告以及上线后的模型监控报表,主要聊聊思路,先要有一个全局的感受 02 标配的风控模型上线报告应具备哪些内容 0201 模型现状 想要突出你模型的好,你得先分析旧模型的不好。 比如说,把目前线上模型的实际表现进行统计,如KS值、分组排序性、PSI等基础指标。 3)Lift曲线: Lift曲线,简单理解,就是对比在不使用模型的情况下,预测能力提升了多少,其计算公式如下: 0203 模型分组排序性 分组排序性在风控模型中的重要性不言而喻了,所以这个指标也是领导需要着重看的 0301 模型一致性监控 这个监控在模型上线前期需要重点关注,因为我们模型各种指标的计算和效果评估,所用到的输入特征都是线下计算得到的,虽然我们在上线前会去校验线上线下的特征一致性,但是也难免有些场景没有考虑到以及测试到的 后期积累一定线上用户后可评估线上模型的AUC与KS,不过需要注意的是,比如像线上KS值这种指标,可能会因为线上模型通过率越低,KS值越低,所以具体的值监控起来没有太大的意义,我们更多的是需要关注趋势。
这周因为一些原因需要整理一些风控建模的知识点,顺便在这里整理一下,一起来回顾回顾。 一、评分卡开发过程 1、信用评分卡分为:申请评分卡和行为评分卡。 2、典型的评分卡开发流程包括:问题准备、数据获取与整合、EDA、数据准备、变量选择、模型开发、模型检验和评价、评分卡实施、模型检测。 此图统计的逾期用的是月末的逾期状态(有些时候也可以使用历史逾期状态,一个客户只要发生过M4+逾期,未来每个月都将该客户记为M4+逾期客户),计算逾期率使用金额(也可使用笔数)。 3、全面了解风控指标体系 https://mp.weixin.qq.com/s/-posovos49MGleNgSXHFWw 概述:非常全面地梳理了一遍风控指标,从贷前到贷后,很适合系统了解这块知识。 ,PCA-算法面经 8、关键数据Vintage、滚动率、迁移率的讲解应用 https://www.sohu.com/a/305129117_99917536 讲解了风控必须要了解的几个关键指标的原理和应用案例
再看看哪里还有机会 对比大中型和中小企业的借款需求,我们会发现两者具有着极大的差异,比如大中型企业借贷是标准化。期限基本固定,利率固定化,有抵押担保,所以标准化的借贷产品能够满足到他的需求。 后又衍生出陆金所P2P平台,提供网贷业务,陆金所坏账事件后,又更名为如今的平安普惠。 (也有说法:陆金所控股鲸吞平安普惠)如此折腾,被动调整多于主动变革,也说明平安的网贷产品仍存有较大不确定性,尤其是之前爆出的一些问题,比如一洛阳市用户用平安易贷贷款六万元后,才被告知不能提前还款,一个半月的时间 正如唐侠所言,借款仍是金融,金融的关键在于其风控系统,尤其是信用风险模型的精准度。也就是说征信和风控体系是决定他们能走多远的核心因素。 其次,需要不断验证纠正评分制度和征信风控体系。尽管丰富多样的“社交数据”或“电商数据”等场景数据可以去融合“金融数据”,但这样的模型和评分体系是否有效还需不断调整验证。
对一个互联网产品来说,典型的风控场景包括:注册风控、登陆风控、交易风控、活动风控等,而风控的最佳效果是防患于未然,所以事前事中和事后三种实现方案中,又以事前预警和事中控制最好。 登陆,盗号登陆; 交易,盗刷客户余额; 活动,优惠活动薅羊毛; 风控实现方案:事中风控,目标为拦截异常事件; 2.风控系统 风控系统有规则和模型两种技术路线,规则的优点是简单直观、可解释性强、灵活 ,所以长期活跃在风控系统之中,但缺点是容易被攻破,一但被黑产猜中就会失效,于是在实际的风控系统中,往往需要再结合上基于模型的风控环节来增加健壮性。 但限于篇幅,本文中我们只重点讨论一种基于规则的风控系统架构,当然如果有模型风控的诉求,该架构也完全支持。 通过把数据计算和逻辑判断拆分开来并引入 Flink,我们的风控系统可以应对极大的用户规模。
我们希望把客户和传统的银行连接在一起,我们的态度是开放的,任何一家金融机构和我们合作我们都欢迎,我们自身的能力、风控、营销、背后的精算、结算,能够帮数亿客户和传统的金融机构,用移动互联网的手段把他们两面紧紧抓到一起 信用风险第一个资产结构要稳定,第一步海量的用户,三亿用户的时候社会平均风险,第二个在这些人里面把坏客户挑出去,比社会平均风险还要好一些,我们其实做信用风险上有六个模型做,一个是微信社交模型,QQ数据模型 ,财付通社交模型,人民银行还款能力的模型,资金饥渴的模型等六个模型在做,这个中间我们把坏的客户挑掉,我们额度不会太高,我们产品500到20万中间,还款能力都可以。 我听到一些关于安全风险的担忧,尤其和传统金融机构领导吃饭的时候,他们会说新型的移动支付不安全,不敢支付交易。 长期无论我们资产端,财富管理,理财,或者是满足普通老百姓投资,对于普通大众来说,我们未来的产品不会很多,对于普通老百姓,金融需求主要是借钱,第二个我们投资理财,第三个支付转帐,我们陆陆续续我们新的产品出来
的产品投递 1、产品名称 数美全业务流程风控体系 2、所属分类 金融科技 · 风控、反欺诈 3、产品介绍 数美依托强大的AI技术与海量基础数据,为金融机构提供覆盖全业务流程的完整风控解决方案。 应用场景二:贷前审批 1)信贷风控云,包含了一系列基于海量样本、模型评分与专家经验制定的预置风控规则,客户可以直接选择其中的部分或者全部使用。 在可信度分级把部分“好”用户找出后,其他的用户会进一步通过一系列策略、模型识别欺诈风险与信用风险。可信度和所有的风险判断结果都会反馈给客户的风控专家团队。 ? 并将多维度、多模型的组合打法贯穿业务流程始终,做到风控与反欺诈的高召回、低误杀。 2) 助力金融企业服务,促进普惠金融发展 数美一直专注于大数据反欺诈领域的技术创新,通过多种反欺诈技术识别欺诈风险,借助多维度数据识别信用风险,利用多重的策略模型提升风控效果,进而打造立体的防御体系,为金融客户提供持续
“自2016年12月以来,京东金融风控打黑项目团队共推动和深度配合各地公安机关破获网络黑产案件29起,打掉黑产团伙13个,抓获犯罪嫌疑人118人,避免用户损失上亿元。” 之所以在打击黑产领域成果显著,是因为京东金融凭借自身的电商和金融场景优势,依托数据和技术优势锤炼出的智能风控体系。 据了解,目前京东金融已经构建出500多个风控模型,5000多个风险策略,5千万个黑灰名单。截至目前,不论是支付类业务资损率,还是信贷类业务的逾期率,京东金融均位居全行业最低行列。 在数据和技术不断积累、迭代的基础上,京东金融也在将风控能力对外输出,为行业提升风控能力做出努力。对此,沈晓春重点介绍了京东金融打造的风控明星产品:安全魔方。 沈晓春说,京东金融“安全魔方”快速对犯罪分子所操纵的账户从注册、登陆、浏览、支付等各环节,进行了全方位的风险行为分析,并通过“安全魔方—智盾”模块对犯罪分子所使用的硬件设备信息进行了锁定,并据此关联出其全量隐含风险交易进行拦截处理
腾讯云星云风控平台(Risk Control Platform)提供实时、集中的一站式智能风险管控服务。打通数据采集、数据清洗、特征加工、规则模型、顶层场景的各个模块,从而形成符合实际风控场景的端到端服务平台。
扫码关注云+社区
领取腾讯云代金券