数据分析挖掘沙龙
时间:4月20日下午15:00
地点:金唐国际金融大厦912会议室
接入:总行管理信息部、数据中心(北京)、厦门分行
2018年4月20日,第三十七期数据分析挖掘沙龙如期举办,本次沙龙邀请到来自农业银行软件开发中心五部的陈萌老师,为大家分享基于知识图谱和图挖掘的信用风险管理知识。本次沙龙主会场设在金唐国际金融大厦,总行管理信息部、上海数据中心、厦门分行通过视频接入方式共同参与学习交流。
项目背景与目标
陈萌老师首先讲解了该项目的背景和目标。中央要求、宏观形势以及银行内在动力共同指出创新信用风险管理模式、满足客群风险管理、支持系统性金融风险监控和处置的需求迫在眉睫,需努力解决客户群体性风险防范的意愿、能力、时效、成效问题,做到主动、科学防范系统性风险,实现早发现、早识别、早预警、早处置的目标。
技术架构与功能
之后,陈萌老师详细讲解了项目的技术架构和功能,从数据、信息、知识、智慧角度诠释项目的整体流程。
关键技术与创新
该项目主要有四大关键技术创新:
1.建立数据视图(DV),奠定信息基础
通过建立信贷客户标识特征库,提升行内外可用数据整合程度,进而更加全面地识别客户间关联关系,构建客户关系全网视图,进一步解决银行对客户的信息不对称问题。
2.构建知识图谱(KG),奠定知识基础
基于客户关系视图,综合考虑客户本身属性和客户之间关联关系,通过客群划分算法找出风险传导强关联的客户群体,形成客户风险传播的知识图谱。
3.实现知识发现(KD),奠定智慧基础
基于信用风险关系知识图谱打造客群风险洞察引擎CGEE。
核心客户识别:核心客户在客群风险传导中具有关键作用,是潜在信用风险的交织点,针对关系网的核心用户,提高预警的等级,能有效防范群体性风险。根据关联关系和风险传导特性,采用基于关系数量和传导系数的双因子聚合算法。
风险传导测算:当客群中有客户发生风险事件时,及时发现最具可能的风险传导路径,指导客户经理分清主次先后、提前介入、有序防范,既能为风险处置赢得黄金时间,又能斩断风险蔓延路径。基于客群子网及传导系数,构建客群风险传导概率矩阵,运用状态迁移算法,测算出子网中每个客户受其他客户影响的复合概率,由近极远、每层深度概率最大的客户形成风险传导路径。
客群风险测评:将客群子网视为风险共同体,通过信息整合、数据建模、整体评价得出客群整体风险等级。
客户关系探索:面向客户信用关系探查,自主研发了高性能图谱计算与展示框架,支持用户对海量客户关系信息、大规模复杂关系网络的图形化、差异化、定制化、简便化探查,支持百亿数据实时分组查询,单Server 150TPS,响应时间1-3s,从而覆盖每月30万笔新增业务探查客户关系及关联风险需要。
4.知识全面应用(KA),提升风险管理效率
信用风险知识图谱及客群风险洞察引擎全面应用于信贷管理流程,提升风险管理效率,助力防范系统性风险。
该项目获得多项专利并发表多篇文章。
应用效果
最后,陈萌老师介绍了该项目的应用效果。项目达到了早发现、早识别、早预警、早处置的预期目标,自动识别关系521万,客群9800余个,成员73万;年均计算风险传导路径近2千条,沿着风险传导路径日均发送225笔信号,信号准确率60%;风险前置周期3到6个月,排查客户关联风险时间从10天缩短到3天;助力农行不良持续双降,2017年不良率从2.37%下降到1.81%,2017年度新增不良金额同比下降近5.49%。
讨论与答疑
陈萌老师做完介绍以后,软件开发中心、管理信息部和上海数据中心的同事都对知识图谱和图计算技术表现出了强烈的兴趣,现场讨论气氛热烈,大家就数据准备、算法选择、平台环境和落地应用等多个流程环节展开提问,陈萌老师对提出的问题一一作答,对部分内容做了更为详细的解释。
分享人:陈萌
来自软件开发中心应用开发五部信贷支持组,入行后一直从事信用风险监控、信贷数据应用等方面的工作。
顾 问:赵维平
董晓杰
主 编:张 勇
轮值编辑:武文斌
李卓蓉
蔡鹍鹏
张 晓
轮值审稿:魏 超
ABC大数据•分析挖掘小分队
微信:ABC_DataMining
长按识别上面二维码,关注【数说吧】
领取专属 10元无门槛券
私享最新 技术干货