首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

人工智能在金融风控中的应用实践

非常感谢上海脉友会的邀请,能够跟这么多同行一起讨论人工智能在金融风控中的应用。这个Topic我本身非常感兴趣,李晓忠博士是我们领域的资深前辈,我后来听李博士这么一介绍我发现我的经历是踩着李博士的足迹在走,2003年做我的博士论文是《人工智能在风险管理中的应用》,当时是在英国做的博士,随后我的职业生涯都是在人工智能和风险管理领域内。刚回国的时候对人工智能怎样具体在互联网大数据环境下应用,这一点是非常感兴趣的,所以大面积的调研了一些对应的模型实践。

这是大家都知道的背景,就是为什么我们现在需要新金融服务我们当前所谓的普惠大众,最主要的原因是因为这些普惠大众目前缺少征信记录。我当时在伦敦做大数据风控的时候,整个银行内部其实对互联网数据的使用是相对比较少的,更多的是依赖于内部银行数据、依赖于征信报告,如果把模型和应用配合起来整个变量应用不超过100个维度,这是传统金融在互联网兴起之前的现象。

在互联网金融兴起以后,我们比较明显的特点就是能够实现这“四个化”:在线化、自动化、智能化、数据化。数据化和在线化这两块是属于互联网金融刚兴起的时候大家就普遍共识的一点,也许中间会有人工审批的地方,但是越来越多的信审决策过程是完全实现自动化的。基本上所有信贷决策过程都可以完全实现全自动化的,而且自动化大大提高了整体的决策效率,一两个人能够管的范围远远超过依赖人工审批几十个人管的工作范围,这是自动化比较明显的边际优势。在这个基础上去做智能化,智能化的过程有一个明显特点,我们在做消费信用评分的时候如果用到了深度学习模型的时候,我们能看到在整个模型吃进700-800变量的时候模型温度性大大提升,精度上某些客群差不多,但是模型稳定性提升是非常明显的。

在两三个月的时候由于深度学习的自适应性,以及对高维度变量信息抽取和互补的过程导致三个月左右、四个月左右模型的性能几乎没有变化,如果依赖于传统机器学习或者统计模型波动性相对大很多,这是智能化的具体应用。在信贷全生命周期过程中,应用人工智能其实已经比较广泛,比如刚才大家讲得比较多的催收过程中,由于催收过程大家最早期所判断风险的时候使用的数据其实已经有一定程度上失效了,这个时候如果还是依赖于以前的失效数据这就会发现一个问题,我们对应的C卡其实效果没有那么明显,这个时候怎么办?我们可以依赖于催收过程中的语音数据挖掘对应的关键信息,根据这些关键信息可以进一步提高C卡的效率。这是智能化在贷前的评分和贷后的管理催收都有一些具体的落地实践。

人工智能为什么我认为在接下来会更加重要呢?因为当前2017年是严监管年,严监管年导致了什么?导致了整个行业受到了非常激烈的冲击。无论是从利率的角度还是从获客的角度,都对互联网信贷领域的要求会更加高,这个时候我们怎样在低利率的环境下精细化运营、提高回报、控制风险这是要求我们真正把数据的价值更深刻挖掘出来的,这是人工智能接下来会越来越重要的原因。

这是我对智能信贷全流程生命周期管理三阶段的演变,最早期很早之前大家依赖于人工到慢慢的依赖打分卡再到机器学习过程,其实是一个非常明显的变化,这个变化会体现在整个业务的全生命周期流程中。如果我们只是依赖于低维度的数据,这些低维数据如果变化不明显的时候是不是这两个人之间的明显类似?如果我们引进高纬度数据会发现原来在其他维度数据上已经能够体现出对应风险的变化,这就是为什么我们需要应用全自动、智能化的管理实时动态反映客户的变化。

这是我对信贷周期管理一共有10大应用,这里面有一些具体的实践,包括对风险、欺诈、渠道的管理和智能化运营,然后对客户在生命周期管理里面我们怎么样最大化的挖掘每个客户对应的回报都是可以有一些人工智能实践的应用。比如说在产品定价的时候,如果要挖掘每个客户的价值除了风控要做好,还需要对产品有合适的定价。如果产品定位为40%的利率,那吸引的一定是40%的客户,相对来讲如果定价为20%利率吸引的一定是那一批更加好一点的客户。所以在这个基础上,怎么样对产品进行定价?除了风险因素要考虑之外,还要对整个客户的回报考虑到定价里面去。我们需要采用一些对应的类似于全生命回报分析帮助我们把每个客户真正能够实现的价值最大化,这是对客户价值进行管理的时候我们怎么样利用大数据和人工智能更加最大化。

社区分析这块根据互联网关系网络大数据进行挖掘,我们能够看到客群与客群之间有很多相关的特点,我们可以采取无监督的方法把对应的客群划分出来。划分出来以后,我们可以针对这些客群的划分挑出有相应比较高风险的人,所以这是社区分析给我们带来的价值。产品分析在这里面听起来好像和人工智能没有关系,但实际上在建模的时候或者说在设计产品的时候,我们需要依赖于底层的风险指标影响产品设计,所以这里面我们也可以借鉴人工智能产出的结果影响我们对应的产品设计。这是整个人工智能的十大应用,针对敏捷BI这块我们可以利用一些RNN算法推测整个BI报表将来的发展趋势是什么,从里面真正挖掘存在哪些风险、会有什么变化,这些变化到底是受宏观环境的影响、受自己审批策略的影响还是受行业的影响、区域的影响,这是利用人工智能去挖掘对应的宏观数据推测风险,这也是人工智能可以落地的场景。这十大应用取决于大家各自对应用的理解,我们可以有很多相关的分析。

这是无论做网贷平台还是做网络小贷都会喜欢去跟场景进行结合,有一些比较常见的问题比如说数据碎片化。数据碎片化就是属于大家比较头痛的事。我们接入不同场景的时候每一个场景都有一些碎片化的数据,这些数据有点像鸡肋,量不一定大但是作用对场景比较明显,怎么样有效利用好这些碎片化的数据,这是一个比较大的难题。这些都是曾经测试过比较好的人工智能方法,根据这些对应的方法能够有效的把碎片化数据利用起来整体提升到每个场景对应的模型提升,所以这也是比较好的例子来验证人工智能是不是真正的解决了在互联网网络小贷领域里面的一些问题。

这是我的思考。脱离了BAT大数据环境后怎样真正的去建设自己的数据生态、怎么样真正设计比较有效的风控流程、怎么样有效的利用碎片化数据或者说一些多方位维度的有限数据进行自己有效的信息抽取和设计合理的模型体系,这是一个庞大的系统性工程。脱离bat以后,面临的第一个问题就是数据生态建设。我怎么样建设好自己的数据生态、怎样在数据生态基础上,如果数据量不够的情况下怎样利用我们的方法上创新去弥补数据的不足,所以这是我的一些心得体会。如果你的数据量不够,怎样去有效的让自己的模型能够更加有效的挖掘有限数据。比如说现在我们做的最开使用的一些传统的逻辑回归模型,到后期我们现在用了很多模型的版本并且进行深度融合,这样的话最终性能能够比最开始统计学习模型性能提高20%,这是在模型设计里面进行有效挖掘能够实现的效果。

这是我的理解,如果能够把互联网技术和大数据怎么样能够有效交互并且规避风险点。在这个基础上建立数据生态,充分利用数据生态环境下每一个有效的数据源在这个基础上再进行智能的交互和体会,这样的话无论是对B端金融机构还是C端客户都会提供有效的价值,这是基于人工智能的全生命周期不一定叫风控服务,我觉得更多的是组合管理服务。

这是我们公司的背景,打一点小广告,公司目前主要提供的一些服务,因为我们目前跟几个牌照方都签订了战略合作协议,所以如果需要走牌照通道我们这边可以走、资金也有一些合作的对象,包括一些数据服务、流量服务,在2018年春节过后大家会发现流量是一个越来越难,如果没有牌照的情况下流量会变得越来越难拿得到,所以流量获客这块将来也会是一个稀缺资源。

这是我们的团队。这是公司的服务形式包括联合托管、信贷生命周期任何一种形式的合作都可以,

谢谢大家。

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

【温馨提示】如何获得全部演讲笔记和演讲视频?

关注【问见】微信公众号后自动弹出全部内容。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180207A0LEGM00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券