首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

风控数据体系-简介

一旦授权通过,交易记录转到主账户中;如果授权不通过,交易记录单独保留在别的数据库中。非交易产品或即时交易不需要这种数据库。 2.3.4.5 个体了解 客户个人关系有时候不被归为借贷关系。...央行的征信接口对所有持牌机构开放,但目前市面上的金融公司都没有直连央行接口。...Hive 没有专门的数据存储格式,也没有为数据建立索引,Hive 中所有的数据都存储在 HDFS 中,Hive 中包含以下数据模型:表(Table),外部表(External Table),分区(Partition...4.1.4.3 逾期历史记录 判断手机、姓名、身份证是否在黑名单;灰名单;灰名单更新时间。以及逾期次数;最大逾期金额;最大逾期天数。.../人数 一阶联系人逾期m3+个数 借款人的一阶联系人中,历史逾期天数大于等于90天,包含逾期还清 一阶联系人黑名单数占比 一阶联系人逾期占比 二阶联系人黑名单个数 借款人的二阶联系人中,被认定为黑名单的个数

4K65

【钱塘号专栏】揭秘互联网金融的大数据风控

另外一个主要来源是催收公司,催收的成功率一般小于于30%(M3以上的),产生很多黑名单。...灰名单是逾期但是还没有达到违约的客户(逾期少于3个月的客户),灰名单也还意味着多头借贷,申请人在多个贷款平台进行借贷。总借款数目远远超过其还款能力。...另外如果让外界知道了自家平台黑名单的数量,影响其公司声誉,降低公司估值,并令投资者质疑其平台的风控水平。...借款时间长的人比借款时间短短人,逾期和违约概率高20%左右。拥有汽车的贷款人比没有汽车的贷款人,贷款违约率低10%左右。...涉赌和涉毒的人员工作一般也不太稳定或者没有固定工作收入,如果申请人经常换工作或者经常在某一个阶段没有收入,这种情况需要引起重视。

99870
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【应用】揭秘互联网金融的大数据风控

    另外一个主要来源是催收公司,催收的成功率一般小于于30%(M3以上的),产生很多黑名单。...灰名单是逾期但是还没有达到违约的客户(逾期少于3个月的客户),灰名单也还意味着多头借贷,申请人在多个贷款平台进行借贷。总借款数目远远超过其还款能力。...另外如果让外界知道了自家平台黑名单的数量,影响其公司声誉,降低公司估值,并令投资者质疑其平台的风控水平。...借款时间长的人比借款时间短短人,逾期和违约概率高20%左右。拥有汽车的贷款人比没有汽车的贷款人,贷款违约率低10%左右。...涉赌和涉毒的人员工作一般也不太稳定或者没有固定工作收入,如果申请人经常换工作或者经常在某一个阶段没有收入,这种情况需要引起重视。

    1.4K40

    风控中必做的数据分析

    02 漏斗分析 件漏斗分析可以帮助我们定位到产品设计的薄弱位置,从而针对优化。...你的产品形式也许需要关注的点和上面有所差异,但思路应该没有区别。 漏斗转化能帮助你了解到用户容易在什么环节发生流失。转化流和行业一般情况做对比,就可以快速了解你的产品设计有没有大的问题。...这也就是为什么前端分析很重要了,申请通过用户的质量通过模型分和重要特征分布已经进行了一轮刻画了。当然,这些前端信息并不能完全衡量出后端的风险。...Vintage分析是反映不同账龄周期用户的风险情况,直白地说,是各个时间阶段(如月份)申请人在往后各个账龄下有没有出现过M1+逾期(或其他)的统计结果。...滚动率呢,首逾的用户有多少变成逾期7+,然后有多少变成M1+,到M2+,到M3+等。逾期状态的滚动分析有助于我们确定建模目标。

    1.2K30

    信贷风控模型搭建及核心风控模式分类

    就分析方法发而言,现在分类算法有很多种,决策树、逻辑回归、支持向量机、神经网络等等,都可以实现这个目的。...脱离了业务场景谈模型的准确性,没有意义。 不同的业务场景,产生了不同的数据,不同的数据包含的规律,体现在数据分析中就是不同的模型、不同的参数和不同的评分。...即在一定时间范围内,用于构建模型的数据依赖的业务模式是相对没有变化的,前后一致的。只有满足这个条件,历史数据模拟出来的模型,和后面的数据才是匹配的。...这里有人问:“怎么呢?欠钱不还的不就是坏客户么。”好吧,我来举个例子。...4.产品上线,进行验证 产品上线进行验证其实是很有风险的,这个时候是对风控模型的终极检测,很可能产品的初期都会吸引一部分攻击者进行疯狂的件攻击,所以在金融产品上线的初期我们就必须要考虑到可能出现的危机

    2.2K10

    概述:机器学习和大数据技术在信贷风控场景中的应用

    还款能力不足:申请人负债收入比较高,外部有大量债务且自身收入不稳定,这些都有可能导致用户愿意还款但是却没有能力还款。...这便是深度学习(深度神经网络)发挥作用的地方。它通过在千万甚至亿级别的人脸数据库上学习训练后,自动总结出最适合于计算机理解和区分的人脸特征。...所以国内银行对于大部分非中高端用户实际上是不愿意也没有能力提供金融服务的。没有征信数据,那套国外搬过来的基于征信数据的方式方法就不管用了。...网贷黑名单:根据个人姓名和身份证号码验证是否有网贷逾期黑名单信息。...随着信贷行业的不断发展,机器学习和大数据技术的越来越成熟,二者结合的应用场景相信也愈加丰富,相信在这块未来会有更多新颖的应用场景。 编辑:王菁

    53020

    金融科技&大数据产品推荐:百融信贷决策审批系统

    医美分期、教育分期、旅游分期等,和无消费场景的信贷产品,如工薪贷、线下现金分期、线上现金分期等与信贷业务相关的企业客户提供服务,这些信贷结构都可以使用百融的信贷审批系统;主要的使用这个系统的客户群是自身没有信贷审批系统...规则回溯,即通过分析历史件,以分析客户风险与通过率,效果图如下: 5.3.1.5建议规则使用 通过规则回溯,以识别规则对历史件的影响。...5.4建议使用规则 5.4.1反欺诈规则 百融反欺诈的规则经由复杂网络、深度学习等机器学习方法开发,总结、归纳,作为了百融预置规则集。...早期催收模型 早期催收模型是预测申请用户在发生一次逾期后再次逾期的可能性,在早期就采取催收行为防止信用恶化。...6.3与数据平台顺利对接 百融反欺诈系统支持与数据平台的完美对接,通过开发接口,不仅可实现与北汽现代自有的黑名单库的交互,也可支持开发相应的接口引入外部第三方数据。

    2.4K90

    机器学习在信用评分卡中的应用

    贷前主要解决用户准入和风险定价问题,即面对一个新申请的件用户,判断用户是否符合产品的放款条件及相应的放款额度、价格、期限等问题。...主要研究问题包括: 1)还款风险监控:比如用户否因失业、过度举债、家庭突发状况等一些突发原因导致还款能力降低,出现逾期风险; 2)贷中风险的政策制定:当用户出现逾期风险时,如何根据用户风险原因制定相应的策略...在某些场景下,如曾经的Payday Loan,由于整个业务周期只有半月或1个月,为加快模型迭代速度,有时甚至定义7+甚至1+逾期用户为坏客户。...如根据电话邦、百度手机卫士或搜狗号码通的标记,区分出骚扰电话、生活服务类电话、快递外卖类、金融机构电话等,甚至根据业务积累区分号码是否为黑名单用户、申请用户或申请被拒用户。...1)利用社区聚类算法,从通话网络中挖掘中介团伙; 2)借鉴信息检索的链接分析,使用PageRank、HITS等算法,计算每个节点的社交权重; 3)标签传播: 通话网络中一些节点在业务中已存在一些状态,

    2.6K42

    机器学习在信用评分卡中的应用

    贷前主要解决用户准入和风险定价问题,即面对一个新申请的件用户,判断用户是否符合产品的放款条件及相应的放款额度、价格、期限等问题。...主要研究问题包括: 1)还款风险监控:比如用户否因失业、过度举债、家庭突发状况等一些突发原因导致还款能力降低,出现逾期风险; 2)贷中风险的政策制定:当用户出现逾期风险时,如何根据用户风险原因制定相应的策略...在某些场景下,如曾经的Payday Loan,由于整个业务周期只有半月或1个月,为加快模型迭代速度,有时甚至定义7+甚至1+逾期用户为坏客户。...如根据电话邦、百度手机卫士或搜狗号码通的标记,区分出骚扰电话、生活服务类电话、快递外卖类、金融机构电话等,甚至根据业务积累区分号码是否为黑名单用户、申请用户或申请被拒用户。...1)利用社区聚类算法,从通话网络中挖掘中介团伙; 2)借鉴信息检索的链接分析,使用PageRank、HITS等算法,计算每个节点的社交权重; 3)标签传播: 通话网络中一些节点在业务中已存在一些状态,

    1.2K51

    风控建模中的IV和WOE

    对于IV的预测能力,一般的会有以下建议: IV范围 预测效果 建议 小于0.02 几乎没有 不放入模型 0.02~0.1 弱 联合考虑是否放入模型 0.1~0.3 中等 联合考虑是否放入模型 0.3~0.5...接下来我们证明一下IVi的值为什么恒大于等于0,而IV是IVi求和,从而IV值恒大于等于0. ? ? ? 从而证明了IV值恒大于0。...再来想一想为什么IV值过大时要考虑把该变量做成前端条件分成两部分去做模型或数据处理。...我们可以针对组别1的条件划成两种情况,在组别1中的客户重点找到0.0999%的逾期客户,绝大部分是好客户,此时可以通过黑名单、灰名单、简单规则的方式直接对这一组别的数据进行过滤管理,不用再单独建立一个模型...在变量转换成woe的阶段根据业务逻辑微调变量切割的阈值。

    2K30

    用户行为序列的特征设计和挖掘思路分享

    但贷中更侧重发生逾期前的额度调整,贷后更侧重逾期发生后的催收,如果实在催收不成功,则坏账准备(例如银行通过分析发现,当客户逾期超过180天了,95%的客户永远还不上钱,则银行认栽,把坏资产打包出售给第三方公司等等...手动构建特征 由于此回答主要讲用户行为序列,那么非用户行为的特征(例如征信等级,信用评分,是否在黑名单上)这里就不讨论了。 如果你熟悉客户管理/营销,那么你可以听过RFM模型。...如果有信用卡,则观测近三个月内平均逾期天数比过去十二个月,是否变得更少。例如 如果客户在本行没有记录,则可以从征信信息观测其行为序列。例如过去几个月其贷款笔数是多了还是少了,其贷款总额的增速是多少。...例如信用卡有10000块额度,比如你所说每个月额度都刷满并且按时还款,那么银行可能认为客户信用额度不够就给你提额,但也可能认为你在套现,给你降额。...(如果上个月逾期了这个月还是逾期,说明客户的情况并没有好转,考虑优先催收,如果距离上次逾期都一年了,说明这个客户并不是经常逾期,即使不催收也可能自己还) 最近联系记录。

    2.2K20

    【金融数据】消费金融:大数据风控那点事?

    信用风险常见的算法有参数统计法例如逻辑回归、Bayes风险判别分析法,以及非参数统计方法例如聚类和K-means法,神经网络法。...大多数银行过于保守,不愿意容忍较高的逾期率和不良率,对于所有信贷产品都一视同仁,严格控制逾期率和不良率水,一旦过高,立即缩紧信贷政策,严格控制贷款规模。...例如全部用大写字母填写资料的人,信用贷款逾期率较高;凌晨1点登陆网络申请贷款的人,恶意欺诈的比较多;手机上只有贷款App,没有其他App的人,其恶意欺诈比率高;缺少社交活动的人,其贷款逾期可能性较高。...第一种是利用黑名单机制,来拒绝一些恶意欺诈人获得贷款。但是道高一尺,魔高一丈,黑名单共享机制时效性越来越差,并且恶意欺诈的人频繁使用其他人信息进行欺诈,黑名单机制在一定程度上很难帮到金融企业预防欺诈。...并且很多平台不太愿意共享自己的黑名单,因为黑名单在一定程度反映贷款平台风控管理水平,过多的黑名单影响平台的声誉,甚至影响平台融资。

    3.8K51

    laravel jwt 无感刷新token

    BaseMiddleware { function handle($request, Closure $next) { // 检查此次请求中是否带有 token,如果没有则抛出异常...JWT_BLACKLIST_ENABLED=true #当多个并发请求使用相同的JWT进行时,由于 access_token 的刷新 ,其中一些可能失败,以秒为单位设置请求时间以防止并发的请求失败...JWT_BLACKLIST_GRACE_PERIOD=600 5.备注: JWT token的三个时间,config/jwt.php查看 a.有效时间,有效是指你获取token后,在多少时间内可以凭这个token去获取资源,逾期无效...这里要强调的是,是否在刷新期可以一直用旧的token获取新的token,这个是由blacklist_enabled这个配置决定的,这个是指是否开启黑名单,默认是开启的,即刷新后,旧token立马加入黑名单...(默认是开启的),黑名单保证过期token不可再用 'blacklist_enabled' => env('JWT_BLACKLIST_ENABLED', true) // 设定宽限时间,单位:秒 '

    2.7K20

    4步教你开发风控评分模型

    业务定义 为什么把业务定义放在最底层呢? 从商务智能的角度说,模型,评分,策略等都是为业务服务的,脱离了业务场景的模型和评分是无本之木,无源之水;脱离了业务场景谈模型的准确性,没有意义。...这里有人问:“怎么呢?欠钱不还的不就是坏客户么。”好吧,我来举个例子。...为什么呢? 因为刘总用这个卡主要是发工资的,每月到账后,夫人就会把钱拿去购买理财产品。因此卡上一般没多少钱。但是刘总是不是高风险客户呢?...就分析方法发而言,现在分类算法有很多种,决策树,逻辑回归,支持向量机,神经网络等等,都可以实现这个目的。在以后的文章中,我们详细讲解一下数据和模型的匹配性。数据决定了用什么模型。...我们接下来观察是否由于件时间不同引起:通过验证发现银行卡月均流水变量各类别,均分布在件时间从2014年9月19日到2015年5月15日的区间内,并不存在显著的不同。

    3.8K81

    【案例】渤海银行——在线业务自动化信用审核

    面临挑战 商业银行的传统客户和线上客户差异巨大,而且随着消费金融的普及,越来越多的人会通过贷款来购物,但是银行的信用信息基础数据并没有覆盖所有人,有很多用户甚至是信用白户。...合作方规则方面,根据行方业务需求对芝麻规则进行分析和排序,区分强规则和弱规则,同时根据行方需求,定义目标客户,划分严拒规则和可变规则;反欺诈规则方面,同盾通过设置产品准入、身份证格式、身份证黑名单、手机黑名单...(逾期、法院、风险名单)、身份证手机失联、地址黑名单、多头借贷等大量数据变量导入,与渤海银行联合建立反欺诈模型;三方规则方面,同盾为渤海银行三款产品分别设置了实名认证、手机三要素核验、手机在网状态、手机在网时长...贷后风控方面,尽管银行在坏账和逾期的表现上,没有消费金融公司严重,但逾期催收始终是一件不得不做的“苦力活”,同盾智能催收产品逾期管家,也逐渐开始替代传统银行的人工催收模式,高效运作。...核心技术3:复杂网络 复杂网络能针对复杂对象的关联关系进行非线性建模,由节点(实体)和节点之间错综复杂的关系(实体之间关系)构成拓扑网络,当异常关系聚集出现时,即可识别欺诈行为。

    1.4K31

    干货 | 联通政企数据运营体系建设

    首先,政企客户的欠费情况比较普遍,他们的逾期客户占比比较高,并且账收比高企,并且联通公司对于逾期客户缺乏预警,缺乏预期风险、营收规模、客户自身经营风险等的综合评估,并且缺乏客户评级,也因此导致他们在客户服务力量和资源的分配上没有办法按照科学的评级进行调配...然后iv值在0.02以下的话一般是一个对于预测没有太多价值的变量,所以一般就是在考虑在大于0.02到1的这一部分的变量作为粗筛的变量。...右边的以二分后的逾期欠费占比的评分卡稍逊于前面的M2plus。...正值的话是分数越高,客户逾期的可能性越低。如果是负值的分箱,代表落到这个分箱里面的客户,他的逾期可能性越高。...在这个基础上,我们最后想实现的一个功能是给予联通公司也给予政府一个能够决策的建议,分为两个层面,第一个层面,企业本身有没有逾期的可能性;第二个是关于逾期的程度,就是说它逾期的金额大概有多少。

    27020

    中诚信征信姚明、PTS张佳辰:区块链,信用科技与普惠金融的最强引擎 | 清华x-lab公开课

    戳链接回顾之前课程内容: IBM任常锐:让区块链真正为商业所用 | 清华x-lab公开课 Node Capital王明远:区块链为什么能改变世界 | 清华x-lab公开课 火币袁煜明:区块链的本质、意义与商业体系设计...如果有少数人违反了协议,故意做假数据,共识机制能够保证其他人察觉,从而拒绝接受数据进入区块链。 这样,错误数据或者称之为作恶数据就会被整个网络抛弃掉了。...所以最终在这个区块链网络里面的数据,都是大家一致认同的、正确的数据了。但是在最近比特黄金的事件中,确实有人成功作恶,并且得到了网络的共识。为什么会得到网络共识?...区块链也可以解决这个信任问题,为什么呢?因为区块链账本是全网复制存储的,可以自由的、透明的查看交易对象。 第三个问题是,我怎么知道这些信息没有被偷偷的修改过?...如果没有国家政府的强制法令,信贷机构不会主动把自己的黑名单贡献出来,其中一个原因是黑名单信息上面记录的信息属于商业资产。 在这样的情况下,区块链能解决一部分共享机构之间的信任问题。

    55140

    1分钟链圈 | 以太坊上DApp热门排行榜:ForkDelta位列第一!哈佛大学区块链团队获新融资,重点发展区块链教育

    观点 朱啸虎:区块链要回归到创造价值 以太坊联合创始人Joseph Lubin:专注开发数字货币,ETH的价格“任其涨跌” 公司 HTC区块链手机Exodus不包含原生区块链网络 苏宁金融区块链黑名单共享平台数据...现在基本还是以交易所和发币为主,还没有一个能够创造价值的东西出来,区块链要回归到创造价值,能给用户创造价值的钱我们愿意赚。...根据美国总统特朗普总统的一项行政命令,新的工作组由司法部领导,由美国证券交易委员,联邦贸易委员和消费者金融保护局等机构组成,将“网络欺诈”和“加密货币欺诈”列为该小组的工作目标。...(链财经) 12.苏宁金融区块链黑名单共享平台数据4个月超过百万 据中国网消息,今年2月,苏宁金融上线了国内金融行业首个基于区块链技术打造的黑名单共享平台,截至目前,这一区块链黑名单共享平台存储的数据已突破百万...,累计达到151万条,覆盖失信、逾期、疑似套现、疑似欺诈、羊毛党、黄牛等20种数据类型。

    76710

    第5批!17家中企被列入美证监会「预摘牌名单」,中概股全线暴跌

    如果逾期未能提交,则会被转入「确定预摘牌名单」。 根据SEC公布的《外国公司问责法》(HFCAA),被列入确定摘牌名单的公司需要在连续三年内提交SEC需要的文件。...如果「确定摘牌名单」中的公司没有提交或提交的文件不符合SEC要求,理论上将会在披露2023年年报后(2024年初)面临立即退市。...共40家中企名单,百度、爱奇艺进入「确定名单」 就在10天前,这份暂定名单上刚刚新增了12家中国公司,这也是被列入该名单的第四批中国公司 具体名单包括:Microvast(微宏)、中汽系统、大全新能源...再鼎医药 Zai Lab Limited                                                          盛美半导体 ACM Research, Inc...名单不等于退市,取决于中美沟通 据报道,SEC目前推进实施的《外国公司问责法》,主要是要求外国在美上市企业向SEC提供审计底稿。

    43320

    风控策略:客户分群策略详解

    没有一个衡量的标准? 1)分群衡量标准 在维度筛选方面,一般有几个因素需要考虑,其中前两个比较重要。...如果一个方法分群后看不到风险差异,那就违背了贷前业务的目标,没有意义。 2)分群常用方法 下面介绍几个常用的分群方法。 新老客 新客、老客分群是最常用有效的方法,为什么这么说呢?...而老客(存量客户)已经在平台有过业务接触,过往历史中是否按时还款,是否有过逾期记录这些都记录在系统中,是我们强有力的判断依据。...件渠道 客户的件渠道是另外一个比较常用的分群方式。和新老客划分不同,件渠道不止两个,可能有很多个,且各渠道的风险不一,可能相同也可能不同,要基于这个渠道的客户质量具体来看的。...决策树 客户件时我们获取一些数据,比如基本信息、征信数据、多头数据、设备数据等等,加起来可能有成百上千个变量。那么如何从这些变量中挖掘出最优价值,最有区分度的变量呢?

    67900

    扫码

    添加站长 进交流群

    领取专属 10元无门槛券

    手把手带您无忧上云

    扫码加入开发者社群

    热门标签

    领券