一旦授权通过,交易记录会转到主账户中;如果授权不通过,交易记录会单独保留在别的数据库中。非交易产品或即时交易不需要这种数据库。 2.3.4.5 个体了解 客户个人关系有时候不被归为借贷关系。 央行的征信接口对所有持牌机构开放,但目前市面上的金融公司都没有直连央行接口。 Hive 没有专门的数据存储格式,也没有为数据建立索引,Hive 中所有的数据都存储在 HDFS 中,Hive 中包含以下数据模型:表(Table),外部表(External Table),分区(Partition 4.1.4.3 逾期历史记录 判断手机、姓名、身份证是否在黑名单;灰名单;灰名单更新时间。以及逾期次数;最大逾期金额;最大逾期天数。 /人数 一阶联系人逾期m3+个数 借款人的一阶联系人中,历史逾期天数大于等于90天,包含逾期还清 一阶联系人黑名单数占比 一阶联系人逾期占比 二阶联系人黑名单个数 借款人的二阶联系人中,被认定为黑名单的个数
另外一个主要来源是催收公司,催收的成功率一般小于于30%(M3以上的),会产生很多黑名单。 灰名单是逾期但是还没有达到违约的客户(逾期少于3个月的客户),灰名单也还意味着多头借贷,申请人在多个贷款平台进行借贷。总借款数目远远超过其还款能力。 另外如果让外界知道了自家平台黑名单的数量,会影响其公司声誉,降低公司估值,并令投资者质疑其平台的风控水平。 借款时间长的人比借款时间短短人,逾期和违约概率高20%左右。拥有汽车的贷款人比没有汽车的贷款人,贷款违约率低10%左右。 涉赌和涉毒的人员工作一般也不太稳定或者没有固定工作收入,如果申请人经常换工作或者经常在某一个阶段没有收入,这种情况需要引起重视。
个人网站、项目部署、开发环境、游戏服务器、图床、渲染训练等免费搭建教程,多款云服务器20元起。
02 漏斗分析 进件漏斗分析可以帮助我们定位到产品设计的薄弱位置,从而针对优化。 你的产品形式也许需要关注的点会和上面有所差异,但思路应该没有区别。 漏斗转化能帮助你了解到用户容易在什么环节发生流失。转化流和行业一般情况做对比,就可以快速了解你的产品设计有没有大的问题。 这也就是为什么前端分析很重要了,申请通过用户的质量通过模型分和重要特征分布已经进行了一轮刻画了。当然,这些前端信息并不能完全衡量出后端的风险。 Vintage分析是反映不同账龄周期用户的风险情况,直白地说,是各个时间阶段(如月份)申请人在往后各个账龄下有没有出现过M1+逾期(或其他)的统计结果。 滚动率呢,首逾的用户有多少会变成逾期7+,然后有多少会变成M1+,到M2+,到M3+等。逾期状态的滚动分析有助于我们确定建模目标。
就分析方法发而言,现在分类算法有很多种,决策树、逻辑回归、支持向量机、神经网络等等,都可以实现这个目的。 脱离了业务场景谈模型的准确性,没有意义。 不同的业务场景,产生了不同的数据,不同的数据包含的规律,体现在数据分析中就是不同的模型、不同的参数和不同的评分。 即在一定时间范围内,用于构建模型的数据依赖的业务模式是相对没有变化的,前后一致的。只有满足这个条件,历史数据模拟出来的模型,和后面的数据才是匹配的。 这里有人会问:“怎么会呢?欠钱不还的不就是坏客户么。”好吧,我来举个例子。 4.产品上线,进行验证 产品上线进行验证其实是很有风险的,这个时候是对风控模型的终极检测,很可能产品的初期都会吸引一部分攻击者进行疯狂的进件攻击,所以在金融产品上线的初期我们就必须要考虑到可能出现的危机
医美分期、教育分期、旅游分期等,和无消费场景的信贷产品,如工薪贷、线下现金分期、线上现金分期等与信贷业务相关的企业客户提供服务,这些信贷结构都可以使用百融的信贷审批系统;主要的使用这个系统的客户群是自身没有信贷审批系统 规则回溯,即通过分析历史进件,以分析客户风险与通过率,效果图如下: ? 5.3.1.5建议规则使用 通过规则回溯,以识别规则对历史进件的影响。 5.4建议使用规则 5.4.1反欺诈规则 百融反欺诈的规则经由复杂网络、深度学习等机器学习方法开发,总结、归纳,作为了百融预置规则集。 早期催收模型 早期催收模型是预测申请用户在发生一次逾期后再次逾期的可能性,在早期就采取催收行为防止信用恶化。 6.3与数据平台顺利对接 百融反欺诈系统支持与数据平台的完美对接,通过开发接口,不仅可实现与北汽现代自有的黑名单库的交互,也可支持开发相应的接口引入外部第三方数据。
还款能力不足:申请人负债收入比较高,外部有大量债务且自身收入不稳定,这些都有可能导致用户愿意还款但是却没有能力还款。 这便是深度学习(深度神经网络)发挥作用的地方。它通过在千万甚至亿级别的人脸数据库上学习训练后,会自动总结出最适合于计算机理解和区分的人脸特征。 所以国内银行对于大部分非中高端用户实际上是不愿意也没有能力提供金融服务的。没有征信数据,那套国外搬过来的基于征信数据的方式方法就不管用了。 网贷黑名单:根据个人姓名和身份证号码验证是否有网贷逾期、黑名单信息。 随着信贷行业的不断发展,机器学习和大数据技术的越来越成熟,二者结合的应用场景相信也会愈加丰富,相信在这块未来会有更多新颖的应用场景。 编辑:王菁
贷前主要解决用户准入和风险定价问题,即面对一个新申请的进件用户,判断用户是否符合产品的放款条件及相应的放款额度、价格、期限等问题。 主要研究问题包括: 1)还款风险监控:比如用户会否因失业、过度举债、家庭突发状况等一些突发原因导致还款能力降低,出现逾期风险; 2)贷中风险的政策制定:当用户出现逾期风险时,如何根据用户风险原因制定相应的策略 在某些场景下,如曾经的Payday Loan,由于整个业务周期只有半月或1个月,为加快模型迭代速度,有时甚至会定义7+甚至1+逾期用户为坏客户。 如根据电话邦、百度手机卫士或搜狗号码通的标记,区分出骚扰电话、生活服务类电话、快递外卖类、金融机构电话等,甚至根据业务积累区分号码是否为黑名单用户、申请用户或申请被拒用户。 1)利用社区聚类算法,从通话网络中挖掘中介团伙; 2)借鉴信息检索的链接分析,使用PageRank、HITS等算法,计算每个节点的社交权重; 3)标签传播: 通话网络中一些节点在业务中已存在一些状态,
但贷中更侧重发生逾期前的额度调整,贷后更侧重逾期发生后的催收,如果实在催收不成功,则坏账准备(例如银行通过分析发现,当客户逾期超过180天了,95%的客户会永远还不上钱,则银行认栽,把坏资产打包出售给第三方公司等等 手动构建特征 由于此回答主要讲用户行为序列,那么非用户行为的特征(例如征信等级,信用评分,是否在黑名单上)这里就不讨论了。 如果你熟悉客户管理/营销,那么你可以听过RFM模型。 如果有信用卡,则观测近三个月内平均逾期天数比过去十二个月,是否变得更少。例如 如果客户在本行没有记录,则可以从征信信息观测其行为序列。例如过去几个月其贷款笔数是多了还是少了,其贷款总额的增速是多少。 例如信用卡有10000块额度,比如你所说每个月额度都刷满并且按时还款,那么银行可能会认为客户信用额度不够就给你提额,但也可能认为你在套现,给你降额。 (如果上个月逾期了这个月还是逾期,说明客户的情况并没有好转,考虑优先催收,如果距离上次逾期都一年了,说明这个客户并不是经常逾期,即使不催收也可能自己会还) 最近联系记录。
对于IV的预测能力,一般的会有以下建议: IV范围 预测效果 建议 小于0.02 几乎没有 不放入模型 0.02~0.1 弱 联合考虑是否放入模型 0.1~0.3 中等 联合考虑是否放入模型 0.3~0.5 接下来我们证明一下IVi的值为什么恒大于等于0,而IV是IVi求和,从而IV值恒大于等于0. ? ? ? 从而证明了IV值恒大于0。 再来想一想为什么IV值过大时要考虑把该变量做成前端条件分成两部分去做模型或数据处理。 我们可以针对组别1的条件划成两种情况,在组别1中的客户重点找到0.0999%的逾期客户,绝大部分是好客户,此时可以通过黑名单、灰名单、简单规则的方式直接对这一组别的数据进行过滤管理,不用再单独建立一个模型 在变量转换成woe的阶段会根据业务逻辑微调变量切割的阈值。
BaseMiddleware { function handle($request, Closure $next) { // 检查此次请求中是否带有 token,如果没有则抛出异常 JWT_BLACKLIST_ENABLED=true #当多个并发请求使用相同的JWT进行时,由于 access_token 的刷新 ,其中一些可能会失败,以秒为单位设置请求时间以防止并发的请求失败 JWT_BLACKLIST_GRACE_PERIOD=600 5.备注: JWT token的三个时间,config/jwt.php查看 a.有效时间,有效是指你获取token后,在多少时间内可以凭这个token去获取资源,逾期无效 这里要强调的是,是否在刷新期可以一直用旧的token获取新的token,这个是由blacklist_enabled这个配置决定的,这个是指是否开启黑名单,默认是开启的,即刷新后,旧token立马加入黑名单 (默认是开启的),黑名单保证过期token不可再用 'blacklist_enabled' => env('JWT_BLACKLIST_ENABLED', true) // 设定宽限时间,单位:秒 '
信用风险常见的算法有参数统计法例如逻辑回归、Bayes风险判别分析法,以及非参数统计方法例如聚类和K-means法,神经网络法。 大多数银行过于保守,不愿意容忍较高的逾期率和不良率,对于所有信贷产品都一视同仁,严格控制逾期率和不良率水,一旦过高,立即缩紧信贷政策,严格控制贷款规模。 例如全部用大写字母填写资料的人,信用贷款逾期率较高;凌晨1点登陆网络申请贷款的人,恶意欺诈的比较多;手机上只有贷款App,没有其他App的人,其恶意欺诈比率高;缺少社交活动的人,其贷款逾期可能性较高。 第一种是利用黑名单机制,来拒绝一些恶意欺诈人获得贷款。但是道高一尺,魔高一丈,黑名单共享机制时效性越来越差,并且恶意欺诈的人频繁使用其他人信息进行欺诈,黑名单机制在一定程度上很难帮到金融企业预防欺诈。 并且很多平台不太愿意共享自己的黑名单,因为黑名单在一定程度反映贷款平台风控管理水平,过多的黑名单会影响平台的声誉,甚至影响平台融资。
面临挑战 商业银行的传统客户和线上客户差异巨大,而且随着消费金融的普及,越来越多的人会通过贷款来购物,但是银行的信用信息基础数据并没有覆盖所有人,有很多用户甚至是信用白户。 合作方规则方面,根据行方业务需求对芝麻规则进行分析和排序,区分强规则和弱规则,同时根据行方需求,定义目标客户,划分严拒规则和可变规则;反欺诈规则方面,同盾通过设置产品准入、身份证格式、身份证黑名单、手机黑名单 (逾期、法院、风险名单)、身份证手机失联、地址黑名单、多头借贷等大量数据变量导入,与渤海银行联合建立反欺诈模型;三方规则方面,同盾为渤海银行三款产品分别设置了实名认证、手机三要素核验、手机在网状态、手机在网时长 贷后风控方面,尽管银行在坏账和逾期的表现上,没有消费金融公司严重,但逾期催收始终是一件不得不做的“苦力活”,同盾智能催收产品逾期管家,也逐渐开始替代传统银行的人工催收模式,高效运作。 核心技术3:复杂网络 复杂网络能针对复杂对象的关联关系进行非线性建模,由节点(实体)和节点之间错综复杂的关系(实体之间关系)构成拓扑网络,当异常关系聚集出现时,即可识别欺诈行为。
业务定义 为什么把业务定义放在最底层呢? 从商务智能的角度说,模型,评分,策略等都是为业务服务的,脱离了业务场景的模型和评分是无本之木,无源之水;脱离了业务场景谈模型的准确性,没有意义。 这里有人会问:“怎么会呢?欠钱不还的不就是坏客户么。”好吧,我来举个例子。 为什么呢? 因为刘总用这个卡主要是发工资的,每月到账后,夫人就会把钱拿去购买理财产品。因此卡上一般没多少钱。但是刘总是不是高风险客户呢? 就分析方法发而言,现在分类算法有很多种,决策树,逻辑回归,支持向量机,神经网络等等,都可以实现这个目的。在以后的文章中,我们会详细讲解一下数据和模型的匹配性。数据决定了用什么模型。 我们接下来观察是否由于进件时间不同引起:通过验证发现银行卡月均流水变量各类别,均分布在进件时间从2014年9月19日到2015年5月15日的区间内,并不存在显著的不同。
观点 朱啸虎:区块链要回归到创造价值 以太坊联合创始人Joseph Lubin:专注开发数字货币,ETH的价格“任其涨跌” 公司 HTC区块链手机Exodus不包含原生区块链网络 苏宁金融区块链黑名单共享平台数据 现在基本还是以交易所和发币为主,还没有一个能够创造价值的东西出来,区块链要回归到创造价值,能给用户创造价值的钱我们愿意赚。 根据美国总统特朗普总统的一项行政命令,新的工作组由司法部领导,由美国证券交易委员会,联邦贸易委员会和消费者金融保护局等机构组成,将“网络欺诈”和“加密货币欺诈”列为该小组的工作目标。 (链财经) 12.苏宁金融区块链黑名单共享平台数据4个月超过百万 据中国网消息,今年2月,苏宁金融上线了国内金融行业首个基于区块链技术打造的黑名单共享平台,截至目前,这一区块链黑名单共享平台存储的数据已突破百万 ,累计达到151万条,覆盖失信、逾期、疑似套现、疑似欺诈、羊毛党、黄牛等20种数据类型。
腾讯云对象存储数据处理方案主要针对于存储于腾讯云对象存储COS中的数据内容进行处理加工,满足压缩、转码、编辑、分析等多种诉求,激活数据价值。
扫码关注腾讯云开发者
领取腾讯云代金券