专栏首页数据猿【案例】大数据监测预警非法集资平台建设

【案例】大数据监测预警非法集资平台建设

数据猿导读

由于监管机制和手段的相对滞后,互联网金融游离在“一行三会”的金融监管之外,出现了金融诈骗、风险失控、卷款潜逃等之类的问题,影响了金融秩序,对社会稳定、公民财产安全等造成极大的安全隐患。

本篇案例为数据猿推出的大型“金融大数据主题策划”活动(查看详情)第一部分的系列案例/征文;感谢 金信网银 的投递

作为整体活动的第二部分,2017年6月29日,由数据猿主办,上海金融行业信息协会、互联网普惠金融研究院联合主办,中国信息通信研究院、大数据发展促进委员会、上海大数据联盟、首席数据官联盟、中国大数据技术与应用联盟协办的《「数据猿·超声波」之金融科技·商业价值探索高峰论坛》还将在上海隆重举办【论坛详情】【上届回顾(点击阅读原文查看)】

在论坛现场,也将颁发“技术创新奖”、“应用创新奖”、“最佳实践奖”、“优秀案例奖”四大类案例奖

来源:数据猿丨投递:金信网银

本文长度为5900字,建议阅读12分钟

新金融业态发展现状

自中共十八大以来,中国金融改革动作也日益频繁,在金融改革不断推进的大潮中,作为新型金融业态的互联网金融异军突起。迅速发展、频频发力的互联网金融,将机遇与挑战同时推到传统金融业面前。

淘宝基金店、百度“百发”理财产品、阿里余额宝、腾讯微信支付、人人贷、众筹、网络银行、手机银行……2012年下半年至今,中国互联网、电商巨头竞相涉足金融领域,同时中国金融业也纷纷开辟或深耕互联网平台,各自推出一系列互联网金融创新产品。

随着移动互联网等新一代信息技术的迅猛发展,互联网+金融也呈现出爆发式增长的态势,互联网金融作为新经济的代表,在创造更加普惠的金融需求,形成对传统金融的重要补充等方面有着得天独厚的优势,是金融领域供给侧改革的新动力。

互联网金融的融资规模和交易规模、涉及交易多方主体的规模都在不断的扩大,据网贷之家数据统计显示,仅网贷行业2015年全年成交量达到了9823.04亿元人民币,2016年全年网贷行业成交量更是达到20638.72亿元,相比2015年全年网贷成交量增长110%。

由于监管机制和手段的相对滞后,互联网金融游离在“一行三会”的金融监管之外,出现了金融诈骗、风险失控、卷款潜逃等之类的问题,影响了金融秩序,对社会稳定、公民财产安全等造成极大的安全隐患。

2016年,互联网金融行业监管政策的趋严,也给行业带来了许多挑战。诸如借贷限额、银行存管等硬性规定,同业竞争更加激烈,经营压力增大,使得一些公司被迫走向转型或退出行业,诸如消费返利、各种交易所等新兴金融形式不断有问题暴露。

由于互联网不分地域、快速传播、涉众面广等特性,互联网金融监管相比传统行业监管面临着更多的困难,主要表现在发现难、研判难、决策难、控制难、处置难。单靠人防的传统监管模式已无法应对当前严峻形势,亟待通过大数据等技术手段加以预警和监测,将金融风险和隐患化解在萌芽状态,切实维护地区金融稳定和人民群众的财产安全。

非法集资现状

截至2015年底非法集资案件爆发式增长,发案数量、涉案金额、参与集资人数、跨区域案件、大案要案达历年峰值。新增案件6077起,数量、金额和参与人数,同比增长71%、57%、120%。跨省案件、亿元以上案件、参与人数1000人以上分别同比增长73%、44%、78%。

同时,随着国家对金融市场管控政策的不断调整以及互联网金融的快速发展,非法集资项目推介的主渠道也向线上转移,犯罪手段不断翻新,支付方式更加多元,扩散速度不断加快,犯罪活动周期大大缩短,给打击非法集资工作带来了新困局。

2016年1月中央政法会议指出,有的不法分子利用网络贷款、网上理财等名义以高息回报为诱饵,大肆进行非法集资等违法犯罪活动,形式多、花样翻新的非法集资似有愈演愈烈之势,且涉及人数多、金额大,处理不好极易引发社会风险。

2016年,全国检察机关公诉部门共受理非法集资案件9500余件。其中,非法吸收公众存款案8200余件、集资诈骗案1200余件。

面对目前非法集资案件的高发态势,国务院、市委市政府各级领导高度重视,多次批示或召开专题会议,研究部署相关事项,强调要从有效防范和化解风险,维护社会稳定的高度出发,加大力度抓好非法集资案件处置工作。

近几年来先后出台了《关于办理非法集资刑事案件适用法律若干问题的意见》、《促进互联网金融健康发展的指导意见》、《国务院关于进一步做好防范和处置非法集资工作的意见》、《北京市进一步做好防范和处置非法集资工作的管理办法》等规范性文件,强调了防范和打击非法集资工作的重要性并在政策层面上给予规范,同时上述文件中也多次提到监管部门应创新工作方式,充分利用互联网、大数据等技术手段加强对非法集资的监测预警。

所以,迫切需要将大数据技术运用到非法集资的监测预警中,建立立体化、社会化、信息化的监测预警体系,及早的引导、规范、和处置非法集,遏制非法集资高发势头。针对目前的形势,金信网银金融信息服务有限公司设计并研发了大数据监测预警非法集资平台。

周期/节奏

本项目于2015年开始建设,建设周期历时六个月,目前北京市金融工作局持续应用中。

同时提供基于大数据监测预警非法集资平台的各类企业非法集资风险监测分析报告包括年度报告、半年度报告、季度报告、月度报告、专项报告和舆情报告。

客户名称/所属分类

北京市金融工作局/大数据技术服务

任务/目标

金融领域的的移动互联化和新型机构的不断涌现,导致现有监管架构已经不适应创新型金融监管需要,当前形势下防范互联网金融风险,规范互联网金融发展已相当紧迫。而防范和预警互联网金融领域的非法集资事件已成为了监管部门打击非法集资活动中的难点。

本项目建设围绕非法集资犯罪的“发现难、研判难、决策难、控制难、处置难”等问题,以解决五难问题为导向,建立大数据监测预警非法集资平台。利用大数据、云计算、机器学习等技术手段,实现主动发现风险、评估风险、固化证据、判断趋势、及时干预和联合打击六大目标。推动地方金融治理由传统的被动监管、粗放监管、突发式应对向主动监管、精准监管和协同监管模式转变,切实维护金融秩序和社会稳定,以及人民群众财产安全。

挑战

金融领域的的移动互联化和新型机构的不断涌现,导致现有监管架构已经不适应创新型金融监管需要,当前形势下防范互联网金融风险,规范互联网金融发展已相当紧迫。而防范和预警互联网金融领域的非法集资事件已成为了监管部门打击非法集资活动中的难点。实现对非法集资的防范和预警需要对企业的非法集资行为进行研判和量化。有关非法集资的数据是广泛可用的,所缺乏的是非法集资监测数据的采集和从数据中提取知识的能力。

第一、跨网络、跨单位、跨平台的非集信息采集及汇聚困难

本项目需要整合内网、政务外网和专网的相关数据,采集和汇聚从技术角度有一定的难度。各单位数据孤立,没有统一有效整合及利用,而且不容易协调。

第二、跨网络、跨单位、跨平台数据的质量和数量难以保证

非集风险评估是一个跨领域和多数据来源的复杂问题,多方面的数据采集和多角度的特征分析是最终模型能够完成准确预警的重要保障。所以本项目需要保障线下举报、线上数据采集、与其他政府部门、第三方机构数据对接的工作质量,确保有足够多、较高质量的数据进入后续的分析挖据环。

第三、非法集资风险的数据、分析、研判难以量化

本项目中,需要建立量化的评估标准,针对采集、对接到的各种数据字段构建非法集资信息的量化评估模型,通过各种维度指标的综合加权,确定每个监管对象的综合风险指数,并且分级预警,以便在海量的非法信息中识别出影响力大、危害度高、老百姓痛恨、管理部门头疼的重点打击对象。

第四、非集风险涉及行业多,非法集资的风险点复杂

非法集资风险存在众多领域,业务类型涵盖P2P借贷平台、小额贷款公司、股权投资机构、交易场所等各个新兴金融业态,而且不同行业的风险点各不相同。从业务角度分析起来比较困难。

实施过程/解决方案

大数据监测预警非法集资平台围绕金融领域大数据与监管业务,强化基于业务服务的大数据基础技术研究和应用适配,创新基于大数据技术增强监管能力的创新现代业务业应用模式,探索、培育和挖掘满足金融领域应用特征的新业态、新模式,支撑和促进经济社会发展。

同时,通过技术创新和模式创新,凝聚大数据处理领域的优势力量,研究大数据基础理论,攻克大数据采集、处理、挖掘分析和智能决策等系列化关键技术,研发面向金融监管部门的公共服务系统,以现代服务业新业态促进大数据形成核心竞争力,加速数据资源的开发和利用。

北京金信网银金融信息服务有限公司以推进互联网金融监管改革更好服务社会转型为核心,建设“大数据监测预警非法集资平台”, 打通政府部门、企事业单位之间的数据壁垒,利用大数据分析手段,提升各级政府的社会治理能力。

1、总体原理

大数据监测预警非法集资平台从海量的互联网信息中提取涉及非法集资的相关信息,大数据中心7x24 小时对企业数据、政府数据新闻、舆情数据等进行动态监测。通过对大数据中心多个数据源的数据,在内存式计算系统上进行分布式计算,经过数据清洗、数据集成、数据变换、数据规约等一系列预处理过程,把数据集合统一转换成可供分析的结构化数据。

大数据监测预警非法集资平台在综合利用上述跨部门数据资源的基础上,以大数据和云计算为技术支撑,利用机器学习和神经网络技术,构建“冒烟指数”分析模型,从海量数据中筛选出与企业非法集资风险高度相关的几类指标,构建“冒烟指数”模型。“冒烟指数”分数越高,该企业非集风险就越高。

大数据监测预警非法集资平台包括金融风险大数据管理系统和金融风险大数据分析挖掘系统,分别对数据进行管理和存储,对接其他政府部门的不同数据并对数据进行分析和挖掘。

非法集资分析模型子系统主要包含系统所需要的计算模型,包含主动发现模型、全面排查模型、网贷行业风险分析模型、投资理财风险分析模型、私募模型、预警模型等;监测预警子系统是通过数据采集和加工并通过模型计算后最终通过量化指标“冒烟指数”来展示企业的风险,通过金融风险分析方法,构筑金融风险防控体系。

2、金融风险分析大数据中心

金融风险分析大数据中心为大数据监测预警非法集资平台提供数据支撑,从海量的互联网信息中7x24小时不间断提取企业的非法集资相关信息,围绕非法集资的监测预警,建设金融风险大数据中心,每日数据量更新达5000万条。

舆情数据采集站点超过2万个,新闻数据12.08亿条,论坛8.6亿条,微博163.1亿条,微信公众号数据2.96亿条;工商数据覆盖4500万家企业和1亿家工商个体户;法院数据15亿条,采集站点超过3800个,覆盖1000万家涉诉企业;招聘数据覆盖主流招聘网站;投诉数据对接了“12345”热线、“打击非法集资”公众号、邮箱举报、“金融小卫士”等渠道举报数据;金融行业数据覆盖了网贷、私募、众筹、小额贷款公司、交易中心、融资租赁等行业。

此外,该大数据中心还采集了ICP备案数据,同时建立了一套非法集资高风险企业库。

3、“冒烟指数”分析模型

图 | 冒烟指数分析模型

“冒烟指数”作为非法集资犯罪预警的系统性风险综合指数,其最初构想来源于“森林着火是要冒烟的警示”,是衡量目标企业非法集资风险大小的指数,监测领域为从事金融类业务的企业。通过追踪目标企业的互联网行为、经营行为以及对企业外围各类数据的研判等方式来揭示企业风险。

“冒烟指数”模型是在利用金融风险分析大数据中心数据的基础上,以大数据和云计算为技术支撑,从海量数据中筛选出与企业非法集资风险高度相关的几类指标,构建针对五大领域十七个行业的分析模型。

主要从合规性指数、收益率偏离指数、投诉举报指数、传播力指数、特征词命中指数共5个维度的多项数据对监控对象计算分析,利用不同的机器学习方法,经过训练后建立起风险预警模型,最终得出的非法集资风险相关度指数即“冒烟指数”。

根据冒烟指数的得分来进行分级预警,分数越高,则该企业非集风险就越高。如果指数为80—100区间,则应向公安部门移交线索;指数为60—80区间,则意味着其非法集资的风险非常高,需要重点关注、约谈整改;指数为40—60区间,则需要监管部门重点监测、规劝改正。冒烟指数风险区划分及相应的差异化处理策略。

图 | 冒烟指数分级预警

4、大数据监测预警非法集资平台的功能

大数据监测预警非法集资平台的功能包括:

一、非法集资信息主动发现。通过招聘、地图及网路舆情等数据主动发现目标企业,包括本地注册本地经营的企业及外地注册但是在本地经营的企业;

二、非法集资的异动预警。对监测区域内企业的异常信息进行及时预警,通过制定相应的应急规则,针对可能涉及非法集资的信息进行及时提醒;

三、全息画像。不同维度展示目标企业全量信息;

四、风险评估。量化企业信用风险、量化非法集资风险;

五、分析报告。通过分析企业运营模式、信用风险分析等来判断企业的非法集资行为;

六、数据共享。打通各政府部门间数据壁垒,实现数据共享。

效果总结

大数据监测预警非法集资平台已被北京市金融工作局运用到了2015年和2016年北京市打击非法集资专项整治行动中,并取得了显著的成效。

截止到2016年底,拓尔思公司共向北京市金融工作局提供各类监测报告共500余份,监测北京市各类企业3000多家,分布于全市16个区,报送了50余家高非法集资风险的企业。大大的提高了北京市金融局防范、处置、化解非法集资的工作效率,大大的降低了北京市非法集资的案发数量和非法集案件的处置成本。

2016年,北京市互联网金融风险专项整治行动中,大数据监测预警非法集资平台协助北京金融局排查了近17万家互联网金融机构的运营风险,为有关部门采取相应措施提供了有力依据。

目前,“冒烟指数”作为利用大数据监测预警非法集资平台的核心技术,以及打击防范领非法集资犯罪域内比较权威的评判标准。已经亮相于各大主流媒体并被多本专业书籍应用。

企业介绍:

北京金信网银金融信息服务有限公司(简称“金信网银”)创立于2014年,是北京拓尔思信息技术股份有限公司(股票代码300229)的控股公司,金信网银具备一套完整的金融数据体系,包括网络舆情数据、公司运营数据和政府数据,创新性融合了海量非结构化信息处理、自然语言理解、分布式计算技术、机器学习技术等大数据关键技术。

金信网银致力于打造全息、可信、可视化金融大数据平台公司秉承“搜索信息、整合内容、发现知识”的技术理念,专注于金融大数据分析挖掘系统和风险管理综合服务平台的研发和服务,运用大数据技术来满足金融监管部门多角度金融风险预防和监管的需求。金信网银致力于为金融行业提供大数据分析挖掘系统和风险管理综合服务平台。提升互联网环境下金融监管机构的创新能力和金融机构的核心竞争力。

北京金信网银金融信息服务有限公司将进一步加强大数据监测预警非法集资平台的系统化、科学化、精准化建设。制定非法集资风险预警处置标准,加强基础设施建设,对接工商、公安、税务、统计等数据源,完善P2P网络借贷、私募股权投资基金、投资理财等风险模型。

优化风险分析系统,构建高风险企业图谱分析,引更多社会资本和科学技术投入进来,不断优化和提高大数据监测的分析精准度。不断积累传统金融和互联网金融行业的数据,并充分发挥数据的价值,为数据思维创新和资源创新奠定坚实的基础,为监管部门打击非法集资工作提供有力的大数据分析支撑。

本文分享自微信公众号 - 数据猿(datayuancn),作者:金信网银

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-06-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【案例】重庆市金融工作办公室:大数据监测预警非法集资平台

    近年来,随着国家对金融市场管控政策的不断调整以及互联网金融的快速发展,非法集资的犯罪手段和形势发生了很大变化。仅在2016年,全国检察机关公诉部门受理非法集资案...

    数据猿
  • 纯算法AI企业最好的出路是被收购,数字化水平低的企业只有转型和淘汰两条路 | 大咖周语录

    数据猿导读 对于大数据的概念以及大数据在各行业的应用,每个人心中都有不同的看法。小编每周都会整理大数据牛人们的精彩观点,让你在最短的时间获得最精的思想荟萃。后续...

    数据猿
  • 竹间智能创始人兼CEO简仁贤:AI+,金融的服务模式变革

    图 | 竹间智能创始人兼CEO 简仁贤 数据猿报道,2017年10月25日,由 数据猿 联合《清华金融评论》共同主办的“2017金融科技价值峰会——数据驱动金融...

    数据猿
  • 实用篇-无处不在的Location

    location配置是nginx模块化配置中最出色的一个设计,几乎所有nginx的业务场景都要通过书写多个location配置来顺应业务需要。语法配置和执行规则...

    后端技术探索
  • 1分钟链圈 | BM:针对RAM扩容规则,BPs 投票才是规则所在!薛蛮子:区块链领域未来会出现超越BAT的杀手级应用

    这里是 8 月 8 日的每日1句话新闻晚报,只需1分钟,看看全球最热、最新的区块链新闻。

    区块链大本营
  • 实用篇-无处不在的Location

    location配置是nginx模块化配置中最出色的一个设计,几乎所有nginx的业务场景都要通过书写多个location配置来顺应业务需要。语法配置和执行规则...

    后端技术探索
  • 超级高铁Hyperloop首次来到中国,政府会买单吗?

    试想一下,如果我们和你说到这几个关键词:音速行驶、发车间隔10秒钟、全真空轨道。你一定觉得这是一个遥远的科幻小说。5月24日下午,美国超级高铁公司Hyperlo...

    机器人网
  • 我在Google用AI研究基因,入门从吴恩达的课程开始

    允中 编译 Google博客 量子位 出品 | 公众号 QbitAI ? Google AI入驻计划,是一项为期12个月的研究培训项目,希望帮助不同领域的科学...

    量子位
  • Xamarin Evolve 2013

    在不久前结束的Xamarin Evolve 2013开发者大会上,Xamarin团队成员向600多名C#开发者介绍了该产品的新功能并通过授课的方式让大家更加了解...

    张善友
  • 认识目标文件结构

    目标文件是源代码编译但未链接的中间文件(Windows的.obj和Linux的.o),Windows的.obj采用 PE 格式,Linux 采用 ELF 格式,...

    Dabelv

扫码关注云+社区

领取腾讯云代金券