【案例】某城商银行——消费金融大数据智能风控体系应用

数据猿导读

项目以“内外部大数据的应用”、“实时风控技术的落地”、“智能化风控体系 的搭建”和“云化风控系统的探索”为基础,与客户一同形成一套整体化的新型大数据智能风控解决体系,项目落地后取得了较好的效果。

本篇案例为数据猿推出的大型“金融大数据主题策划”活动(查看详情)第一部分的系列案例/征文;感谢 数尊 的投递

作为整体活动的第二部分,2017年6月29日,由数据猿主办,互联网普惠金融研究院合办,中国信息通信研究院、大数据发展促进委员会、上海大数据联盟、首席数据官联盟协办的《「数据猿·超声波」之金融科技·商业价值探索高峰论坛》还将在上海隆重举办【论坛详情】【上届回顾(点击阅读原文查看)】

在论坛现场,也将颁发“技术创新奖”、“应用创新奖”、“最佳实践奖”、“优秀案例奖”四大类案例奖

来源:数据猿丨投递:数尊

本文长度为5000字,建议阅读10分钟

近年来,伴随互金、消金等业务形态的崛起,个人金融信贷业务范围逐步扩展至新场景、新客群,探索出了新模式、新通道。与此同时,作为金融的“本质”的风险控制面临了前所未有的挑战。

尤其是在网贷、消金领域,新形势下风控命题迟迟无法破题,导致大量积聚的风险正在蚕食着行业健康、可持续发展的基石,主要表现在以下几个方面:

  • 积聚政策性风险。在风控领域缺乏真正有效的解决方案的情况下,大量机构被迫“超高利率”来弥补风控的不足,也引来了监管部门对“现金贷”等业务的强力整顿。
  • 倒逼客户回流传统机构。曾几何时,高举“效率为王”,以急速放贷为突破口,给行业带来了几缕新气。然而,过高的利率、妖魔化的催收,正在倒闭客户远离这个行业。
  • 造成行业社会价值极大削弱。“好人不敢来”、“坏人里面挑好的”成为常态,新金融与“普惠”的初衷渐行渐远。

与此同时,大数据、人工智能技术逐渐成熟,行业看到了彻底解决风控症结的新路径、新方法、新技术。为此,构建新形势下的新一代智能借贷风控体系以有效识别风险、降低风险,如何有效依托场景、创新性使用新技术、平衡风控的效率与效能,打造新型的智能风险控制系统成为我们这个时代风控人的核心使命。

本项目以“内外部大数据的应用”、“实时风控技术的落地”、“智能化风控体系的搭建”和“云化风控系统的探索”为基础,与客户一同形成一套整体化的新型大数据智能风控解决体系,项目落地后取得了较好的效果。

周期/节奏

项目的整体分为两个阶段,第一阶段为实施部署,持续了16.5周,具体分为:方案制定、接入准备、系统测试、软件实施、验收测试、系统上线等6个阶段,于2016/3/21项目开始到2016/6/30结束。第二阶段为上线运营,跟进了12周,从2016/6/30开始到2016/9/30结束。具体项目排期如下:

客户名称/所属分类

项目名称《某城商银行消费金融场景大数据智能风控体系》。

以下为所属分类选择:

1、风控行业

风险控制是指风险管理者采取各种措施和方法,消灭或减少风险事件发生的各种可能性,或风险控制者减少风险事件发生时造成的损失。总会有些事情是不能控制的,风险总是存在的。做为管理者会采取各种措施减小风险事件发生的可能性,或者把可能的损失控制在一定的范围内,以避免在风险事件发生时带来的难以承担的损失。

2、大数据技术服务

基于大数据特点:数据量大、类型繁多、价值密度低、速度快、失效高等,结合金融行业特点,从大数据的思路出发,提供从数据到技术到业务再到决策和战略部署的整体解决方案服务,为企业和消费金融业务带来从量到质的过程。

任务/目标

银行现有风控体系面临数据应用范围扩展、风控决策效率不匹配场景需求,本项目旨在达成如下目标:

1)探索非金融体系数据的应用:现有风控体系基于央行征信报告设计,内部数据集成项目正在进行过程中,时间不可匹配业务,外部数据(征信数据除外)尚未有接入经验;

2)提升风控决策效率:传统风控系统单笔订单审批时间超过半小时,但消费金融场景客户填写资料后就在现场等,需要做到“实时”或“准实时”放贷;

3)尝试风控体系自动化优化:需要针对消费金融场景独立构建分析体系、风控体系自优化等内容;

4)探索风控系统的云模式:以消费金融业务为试点,探索风控系统云化的可能性。

挑战

本项目整合了数尊的三个核心产品:BOX(数尊宝)、BOL(数据连)、BOD(数尊塔)等三个产品,分别用以实现外部数据的接口及调度管理、内外部数据的任务/算法/运维管理、智能化决策引擎系统等三大主要功能,三个产品针对消金场景而设计。

尽管数尊拥有丰富的三个自有产品的实施经验,但仍然面临了以下三个方面的挑战:

1)认识层面:客户方对云化、外部数据的应用存在疑惑,也缺少经验,部分人员存在认识不清、不敢推动、不知如何推动的情况;

2)数据层面:内部数据存储于多个系统,存在多口径、格式等多个方面的问题;外部数据样式多变、项目执行过程中持续增加了多个接口(相应接口的字段也都有增减);

3)项目预期:对新业务的业务量预估值过高,对系统性能提出了超高水平的要求,导致系统部署方案进行多次调整。

实施过程/解决方案

本项目基于公司已有的外部接口管理平台、内外部数据实时处理平台、智能决策平台,采用多项成熟的外部数据处理标准、构建超过2000+内部风控决策规则,并且通过人工智能算法对决策流关键要素(如:字段、规则、评分卡)进行自动的监控及预警。

项目紧密结合新金融风控的特点、客户特点、以友好的体验方式,提供给客户一整套易用、灵活以及较彻底的拜托传统IT的束缚的智能化风控决策系统。

从如下项目构架图可以看到整个项目包括大数据接入平台(BOX)、大数据中间件(BOL)、智能决策平台(BOD)3大部分。

1、大数据接入平台

项目基于公司现有的BOX系统,整合已经接入30+以上外部数据供应商的数据接口,实现对央行征信、运营商数据、银联数据、电商数据、政府数据等2000+维度的字段的集成和实时调用。

另外,BOX系统采用了先进的数据路由的理念,对同一字段实现了“主­从­备”多数据源调用的动态优化,同时,也支持业务人员基于字段响应时长、字段覆盖率和字段成本等多维度指标,对数据调用策略进行界面化配置。

所涉关键功能包括:

1)数据接口变更的界面化配置。实现对接口HTTP、调用参数、覆盖字段、字段返回值等内容的前台维护和界面化配置。

2)数据调用路由,确保数据的稳定性。实现对多数据源的动态调用策略,封装了成本优先、覆盖率优先、按比例设置主从等多个策略。

3)外部接口原始数据的切片式存储和检索。实现对外部接口原始数据的存储和检索,以及数据的维护。

主要解决的问题:

1)解决外部接口持续增多、数据口径/逻辑不稳定所带来的频繁变动的问题。

2)解决外部数据调用需要兼顾“稳定性”和“节费”的问题。

3)解决调用来的原始字段存储的问题。

2、大数据中间件

大数据处理中间件(BOL)主要用以实现内部自有数据的实时同步、内部数据的复杂算法处理、内外部数据的交叉比对、外部实时清单数据的加工处理等4个方面需求。

BOL使用了目前最先进的流处理技术和实时处理机制,支持在10ms以内实现个人客户标签的抽取、数据的交叉比对等内容,极大的降低了业务界面客户等待的时间。

BOL综合采用了JVM存储、内存数据库和分布式缓存的方式,形成了数尊面向金融应用场景独有的数据存储结构,兼顾系统的动态性、高可用、高可扩展性。

BOL支持客户通过前台定制SQL的方式形成“任务”,通过触发和手动两种方式激活任务,实现对数据表操作、数据复杂加工处理、内外部数据的交叉验证等功能。同时,BOL支持基于xml方式的外部大数据计算平台的复杂模型的导入,从而为整个系统提供了大数据智能的数据基础。

所涉关键功能或技术包括:

1)流处理技术

BOL基于SparkStreaming搭建了流处理核心技术。通过创造性的应用和改造SparkingStreaming提供的丰富的API,实现内存的高速执行引擎,实现了丰富的“流式、批处理和交互式查询”应用。

2)通用算法平台结果文件的兼容和实现

通过XML解析器解析SAS、SPSS、阿里机器学习平台产生的模型结果,实现了对离线建模结果的兼容和算法应用

3)CEP策略的承载

内置复杂时间处理模块,用以提供提供基于时间跨度和滑动窗口的事件处理模式,极大的丰富了风控系统应对风险的能力。

4)第三方数据标准化及入库管理

内置30+第三方数据源接口、入库任务、常用加工处理任务,可供随时实现对外部数据的调用。

主要解决的问题:

1)解决海量数据挖掘的计算效率问题

某城商银行存量客户近1000万,项目使用了这批客户3年内的交易流水数据、APP登录、客服等维度的全数据,每天增量数据超过1G,这样的海量数据计算不可能由单台服务器完成,而是需要多台服务器同时计算,且最大化地使用服务器资源。

2)解决动态风险预警信息及时传递给决策流的问题

针对基于行为触发规则的场景,BOL基于实时数据的计算,捕捉动态风险信息并主动推送给决策流系统。

3、智能决策平台

智能决策决策平台(BOD)是智能风控决策中心平台,用以对借款人进行准确、实时的风险量化评估、进而提供基于订单的风险决策建议;

BOD为客户提供【一站式】风控决策流的开发、发布与部署的平台,提供【无需编码】【拖拽式】的决策流界面,【一键式】决策流上线部署和下线停用,提供基于数尊项目经验的“2000+内置的规则和100+评分卡”的强大知识库。

工作机制:接收到业务系统的借贷决策请求后,BOD向BOL发起数据请求,BOL通过调用外部字段(BOX)、整合内部字段完成数据组织;BOD获取数据后按决策流节点需求计算出节点结果,持续进行后续多次调用。

BOD为客户提供全流程闭环数据管理,为数据化运营提供了基础。BOD提供了风控业务相关的“前台”和“后台”报表50余张,帮助客户全面分析进件情况、指标、模型、决策流的整体情况和效率。

BOD基于历史数据,运行后台封装的算法策略,统计后台算法策略的违约率,作为字段、规则、评分卡等决策要素的效能优化的依据。

所涉关键功能或技术包括:

1)规则引擎

BOD兼容流模式和规则模式,基于风控应用了实现了大量的逻辑优化,实现了引擎核心与Java内核的完美融合。

BOD内置了规则优先序自动优化的智能程序,用以自动节省规则流中规则执行的优先序以及节省数据成本。

2)知识图谱

BOD基于“字段­规则­评分卡­决策流”之间的内部数据关联关系,使用知识图谱的方式,提供可供配置的四类要素效力的指标监控和预警。

BOD依托客户的身份主键信息进行了普遍的实体化,支持基于本人、联系人、交易方、身份证、手机号、地址、学校、邮箱后缀、工作单位、QQ等借款人ID的关联关系展现,从而帮助客户方专家人工识别欺诈、信用风险的团体特征。

3)机器学习算法

BOD内置了包括GDBT、RNN、CNN、DNN等30+算法,仅需简单勾选即可跟踪风险动态,通过实时捕捉风险变化对决策流要素优化方向给出建议。

主要解决的问题:

1)决策流页面化全面配置的问题

决策流全流程页面化配置,全局“托拉拽”式组织,有效解决了传统引擎难用、不会用的问题。

2)人工智能和专家智能的融合的问题

基于个人关联关系,在复杂网络智商通过无监督算法实现分团和网络全局风险特征抽取,并基于规则和模型融合专家研判持续迭代和优化模型、发现欺诈模式。机器+专家研判持续强化机器识别能力。

结果/效果总结

1)风控效率提升。上线新系统及模板规则后,有效防控欺诈客户、降低信用风险,消费金融业务逾期率下降21%。

2)风控时间有效缩短,有效适配场景需求。线上放贷周期由1小时最短降低到1分钟,有效提升在客户触点的竞争力,审批时长的缩短直接提升了渠道推广人员的积极性。

3)IT­风控权责分离和模型自动化能力带来大量成本节省。风控模型变更不再需要IT排期,风控人员即可完成修改并热部署实时生效;风控模型调整周期缩短,更高效应对信贷风险,提升风险应对能力。针对项目场景,整体系统节省的人工审批成本、软件开发成本、IT维护成本,经核算,整体节省成本约458万/年。

企业介绍:

1)数尊信息科技(上海)有限公司(以下简称数尊),是“华院数据”基于大数据核心能力、面向信用评估和风控领域孵化的子公司,专注于个人与中小企业信用风险的评价服务。数尊已成功完成两轮投资;

2)数尊总部设立在上海,在西安设有研发中心,在深圳、杭州等地设有办事处;

3)数尊擅长于多维权威数据源的整合和综合洞察,以“用数据推动风控和信用服务”为使命,致力于帮助企业提升个人客户的信用服务和风险控制能力,并立志成为中国最专业的数据化信用服务解决方案提供商;

4)数尊已覆盖了超过8亿的个人客户信用评价,并对近1亿客户实施过个人信用的场景化辅助应用;

5)数尊优势:

  • 汇聚了来自中国科技大学、复旦大学、上海交通大学、西安交通大学等顶级学府的顶尖人才,组建了国内一流的金融智能算法和技术团队,其中硕士及以上学历员工超过80%,团队具备大数据、金融、互联网等行业的丰富经验;核心成员均具有十年以上面向个人客户的金融风险控制模型、系统、整体解决方案服务的经验或管理经验或数据处理经验;
  • 数尊所深度整合的数据来源合法、操作合规、应用合理,可以为金融机构提供丰富有效的外部数据资源;
  • 截止目前,数尊已经为国内300多家银行、保险、消费金融公司、其它互联网金融机构提供大数据智能风控服务,在行业享有一定的知名度和美誉。

原文发布于微信公众号 - 数据猿(datayuancn)

原文发表时间:2017-05-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏理论坞

用户体验案例:从头到尾的设计经验

作为设计师,我们常常抱怨产品不尽人意。我之前也常常会这样想,直到前一段时间有幸参与到某个金融项目中,才对彼此的工作有所的了解。当中的很多理念都是未来设计师所必须...

1153
来自专栏企鹅号快讯

2018年IT行业必须面对的7个改变

根据罗致恒富(Robert Half)2018年发布的薪酬指南,科技人员的好时机将一直持续到明年。该指南发现,今天的技术人才缺口将继续给2018年的企业带来压力...

2235
来自专栏ATYUN订阅号

【科技】现在&未来,AI对网络工程的影响

2017年是我们看到AI起飞的一年,还是…… ? 如果没有别的原因,AI继续爬升技术炒作曲线。阅读新闻,浏览网页,参加会议,甚至看电视,都可以看到AI使我们的生...

3036
来自专栏非著名程序员

GitHub 迎史上最大改变?先看看 2018 年度统计报告再说吧!

作为 GitHub 的忠实使用者,一直都在密切关注者 GitHub 的一举一动,尤其是被微软收购以后,GitHub 变得貌似更加频繁了。变化咱们先不说,先来看看...

2851
来自专栏华章科技

这些数据获取方式,一般人不知道

在这里给大家推荐一些能够用上数据获取方式,有了这些资源,不仅可以在数据收集的效率上能够得到很大的提升,同时也可以学习更多思维方式。

3642
来自专栏PPV课数据科学社区

大数据从小做起—中小企业的Big Data之道

任何一个时代或者模式的兴起,都离不开与之相关的Killer App,比如,C/S时代的SAP ERP,互联网 1.0 时代的门户,以及互联网 2.0时代的搜索和...

3425
来自专栏人称T客

CIO必读:企业移动应用开发技术如何选?

要是你问现在哪个行业最火?哪个名词最热?哪个专业最受社会关注?那肯定当选移动互联网。热透了的B2B、B2C、C2C、O2O、BYOD概念无时无刻不影响着移动互联...

3748
来自专栏前端桃园

破坏开发人员生产力的十二件事

很多文章都涉及技术主管和项目经理的角色。我们经常遇到的一个共同主题是如何提高团队的工作效率。但是在你集中精力来提高生产力之前,你可能首先要考虑是什么在摧毁它,以...

852
来自专栏云计算D1net

私有云泛滥 如何采用云整合加强安全性

海量的私有云基础架构可能会对你的组织造成危害。专家Ed Moyle将讨论如何以及何时考虑使用云整合来减少云泛滥。 对大部分组织来说,云的采纳具有十分重要意义。尽...

2977
来自专栏Java学习网

新手程序员应该知道的7件事

新手程序员应该知道的7件事 资深软件开发人员分享的一些关于专业化编程的经验和教训,这些经验教训都是经过多年历练总结得出的。 如果你刚进入专业的软件开发世界,那么...

2427

扫码关注云+社区

领取腾讯云代金券