【案例】重庆市金融工作办公室:大数据监测预警非法集资平台

近年来,随着国家对金融市场管控政策的不断调整以及互联网金融的快速发展,非法集资的犯罪手段和形势发生了很大变化。仅在2016年,全国检察机关公诉部门受理非法集资案件9500余件

作者 | 金信网银

官网 | www.datayuan.cn

微信公众号ID | datayuancn

本篇案例为数据猿推出的“金融科技价值—数据驱动金融商业裂变”大型主题策划活动第一部分的文章/案例/产品征集部分;感谢 金信网银 的投递

1、企业名称

重庆市金融工作办公室

2、所属分类

金融科技·征信

3、案例背景

近年来,随着国家对金融市场管控政策的不断调整以及互联网金融的快速发展,非法集资的犯罪手段和形势发生了很大变化。仅在2016年,全国检察机关公诉部门受理非法集资案件9500余件,其中,非法吸收公众存款案8200余件、集资诈骗案1200余件。受理金融犯罪案件30900余件48700余人,起诉23700余件36300余人。从以上数据来看全国打非形势依然非常严峻。同时,伴随着互联网大环境下网络非法集资的规模大比例增加,作案手段更趋隐蔽化、多样化给金融监管工作带来了更大的困难。

在当前金融市场和互联网的大环境下,政府想要更有效地打击非法集资,就需要运用到新的手段和方式。通过技术创新和模式创新,凝聚大数据处理领域的优势力量,做到“用数据说话、用数据决策、用数据管理、用数据创新”,并且借助大数据实现智慧治理、数据决策、风险预警、智慧城市、智慧公安、舆情监测等。因此,尽快建立实用有效的网上监控体系,是实现非法集资事件早期发现与预警的最有效手段和方式。

4、实施时间

2017年5月31日至2018年5月30日

5、应用场景

(1)打击非法集资迫切需要

近年来,重庆市非法集资案件多发频发势头虽得到扼制,陈案积案处置取得积极进展,规范、流程等基础性制度初步建立,但受经济下行、商事制度改革过渡期、群众金融知识普遍缺乏等因素影响,各类不规范民间融资行业领域有集中暴露风险。值得注意的是,非法集资正不断向新的行业、领域蔓延。

很多非融资性担保公司、投资咨询等中介机构公开“代人理财”大肆非法集资;许多小额贷款公司、私募股权投资等融资性机构超范围经营涉嫌非法集资;一些农业专业合作社以入股分红为诱饵吸收农民资金投资异地或放高利贷;网络平台打着“民间借贷”旗号非法集资风险也日见凸显。

且随着互联网金融的不断发展,当前,互联网金融的内部运作和外部监管在具体合规操作和法规体系上凸现出相关漏洞,局部领域风险不断积累,迫切需要实现非法集资的事前监测,实现“打早打小”,防止演变成较大的非集事件,及时挽回群众的资产损失。

(2)落实市政府关于防范和处置非法集资工作需要

重庆市大数据监测预警非法集资平台建设是按照《国务院关于进一步做好防范和处置非法集资工作的意见》,扎实有效做好本市防范和处置非法集资工作,防范系统性区域性金融风险的重要组成部分。

在今年4月25日,桂平同志在全市打击非法金融活动领导小组(扩大)会议上强调:强化网络监测、行政处置、督查考核“三种手段”,加快建设全市大数据监测预警非法集资平台,采取差别化处置策略积极稳妥化解风险。因而,建立立体化、社会化、信息化的监测预警体系,是遏制非法集资高发势头,及早引导、规范、处置非法集资苗头的有效保证。

(3)建设智慧型服务型政府的需要

从全球范围来看,随着大数据、云计算和智能挖掘等新一代信息技术商业模式的不断成熟,重庆市政府决力向智慧化、精准化、主动化的方向发展,打造智慧型政府形象。

6、面临挑战

(1)政府人员有限

面对互联网时代,非法集资出现的新特点、新趋势、新手段,传统的防范监管模式已经不能完全适应新形势变化,且市政府人员编制较少造成个人工作量增加而效率降低的情况。

(2)事前监测预警难

面对目前非法集资手段的电子化、网络化、传播途径多样化、行业分布的广泛化等特点,想要实现对非法集资犯罪活动的事前预测、事中预警,是重庆市金融监管部门面临的一大挑战。

(3)数据协调困难

随着我国政务信息化取得巨大进展,很多不同的数据分别隶属于政府的不同部门,相关数据信息相互隔离,缺乏关联分析与深度挖掘,容易形成信息孤岛,从而导致获取非法集资相关信息和证据困难。

例如:非法集资风险监测预警的核心是账户资金异动情况,涉及账户信息异动是由各金融机构依据《反洗钱法》和《大额交易和可疑交易报告办法》向人民银行报送,具体信息由人民银行反洗钱部门掌握。非法集资民事、刑事案件审判信息和犯罪记录由法院和公安机关掌握。此类信息因涉密和保护隐私,难以向其他部门实现共享。中央条管金融机构合法产品信息由银监、证监、保监等中央金融监管部门掌握。农民专业合作社管理信息由农业部门掌握,要实现数据共享还需要进一步协调。

(4)非法集资处置困难

传统监管模式对非法集资行为不能及早发现,只能在非法集资案件发生后被动地去处置,很难做到“打早打小”,在苗头时期、涉众范围较小时解决问题。

7、数据支持

围绕非法集资的监测预警,建设金融风险大数据中心,每日数据量更新达5000万条。截止目前,新闻数据12.08亿条,论坛8.6亿条,微博163.1亿条,微信公众号数据2.96亿条;工商数据覆盖4500万家企业和1亿家工商个体户;法院数据15亿条,覆盖1000万家涉诉企业;招聘数据覆盖主流招聘网站;金融行业数据覆盖了网贷、私募、众筹、小额贷款公司、交易中心、融资租赁等行业。此外,该大数据中心还对接了相关脱敏数据,采集了ICP备案数据,同时建立了一套非法集资高风险库。

8、应用技术/实施过程

(一)实施过程

(1)搭建平台架构

重庆市大数据监测预警非法集资平台的数据支撑为金融大数据系统,通过系统对多个数据源的采集,在内存式计算系统上进行分布式计算,经过数据清洗、数据集成、数据变换、数据规约等一系列预处理过程,把数据集合统一转换成可供分析的结构化数据。

其次,针对重庆市私募、网贷、投资咨询、融资担保等行业分别建设预警模型,应用大数据处理技术实时运算,得出衡量企业非法集资潜在风险的指标“冒烟指数”。

最终,基于重庆市企业的原始数据和“冒烟指数”分析结果,设计可视化系统,辅助用户直观了解重庆市非法集资风险情况和个别企业风险详情。

(2)设计研发产品

从需求出发,金信网银辅助重庆市金融办实时扫描重庆2万余家类金融企业的舆情负面信息、工商处罚信息、法院涉诉信息等数据,一旦出现企业涉嫌非法集资的行为,及时发出预警信号。

同时,结合重庆市区域金融风险情况,应用“冒烟指数”模型作为研判依据。“冒烟指数”一词的取名,灵感来自于森林火灾前的冒烟场景。因为森林要着火首先要冒烟,烟越大火势越旺,同样非法集资案件爆发前总会有苗头,因此衡量企业非法集资潜在风险大小的指标叫“冒烟指数”。

“冒烟指数”从合规性、收益率、传播力、投诉举报情况和特征词命中情况五个维度深度挖掘重点监控企业的风险。合规性指数从企业资质、企业管理人资质、是否涉嫌超范围经营、是否存在虚假宣传等几个因素来考量;收益率偏离指数从企业承诺的收益率和市场平均收益率之间的差值来考量;传播力指数从企业或产品宣传的途径、企业经营覆盖范围等几个因素来考量;投诉举报指数从投诉信息的来源渠道和投诉内容来考量;特征词命中指数从企业舆情出现非法集资风险关键词的频率来考量。

“冒烟指数”位于0~100之间,分数越高,该企业非集风险就越高。当冒烟指数高于60分时,说明该企业的非法集资风险很高,建议约谈整改。

为确保“冒烟指数”模型的精准性和客观性,金信网银在利用跨部门数据资源的基础上,以大数据和云计算为技术支撑,综合应用了机器学习算法、自然语言处理及复杂网络分析等前沿技术,并对历史非法集资案件的数据进行剖析,梳理出近千个细分数据项,然后对海量数据进行反复训练,不断的优化模型的准确性。

(3)数据计算云平台服务方案

最终,产品以Saas云平台的模式交付给重庆市金融办。Saas云平台具有数据同步便捷、运维成本低等优点。在数据同步方面,金信网银不断积累的新数据和模型优化后的计算结果能够第一时间同步到重庆市大数据监测预警非法集资平台中。在后期运维过程中,一旦出现软硬件等运营故障,金信网银可以第一时间核查原因,降低时间成本。

(二)应用技术

(1)大数据采集技术

应用TRS海量异构数据采集技术对网络新闻、财经媒体报道、百度贴吧、社交网络信息、经授权的工商、税务、法院诉讼数据等数据实时监控和采集,对采集到的信息进行过滤和自动分类处理,最终将最新内容及时发布出来,实现统一的信息导航功能,同时提供包括全文检索、日期(范围)检索、标题检索、URL检索等在内的全方位信息查询手段。

(2)大数据管理技术

金融风险大数据中心每日数据更新量达5000万条,融合多源结构化和非结构化的海量数据。作为大数据架构的底层,大数据中心应用分布式存储技术和集成技术实现数据的海量存储,应用索引分片、对等节点机制(去中心化)、新型列数据库存储机制等技术实现数据的有效管理,应用全文检索技术实现数据的精准检索,提供了大数据高效管理和智能检索的平台支撑。

(3)大数据分析技术

高效、迅速、精准的挖掘海量数据中的风险信息是重庆市大数据监测预警非法集资平台的关键。金信网银利用大数据、云计算和机器学习等进行决策,融合了文本挖掘、自然语言处理技术、复杂网络分析、LBS分析等技术,并结合机器学习、深度学习等算法,实现从大数据监测预警非法集资分析方法的突破。

文本挖掘也称为文本数据挖掘,是以文本型信息源为分析对象,利用智能算法,如神经网络、基于案例的推理等,融合文本分词、文本分类、文本过滤、文本抽取、关系挖掘等功能,从非结构化文本文档中提取有用的、重要的模式,知识和规律。

文本分词融合规则和统计两方面技术,可有效解决切分歧义问题;文本分类可对信息的行业、地区、褒贬义等进行分类,是建模中的一项重要指标;文本过滤有效识别和过滤各种有害垃圾文本信息,降低后期模型计算的误差;文本抽取使用机器学习和统计的方法实现各类实体信息的抽取;关系挖掘可从海量数据中快速分析挖掘实体间关系,用于分析企业的关联担保风险。

复杂网络是由数量巨大的节点和节点之间错综复杂的关系共同构成的网络结构。结合工商数据的投资关联数据、法院数据的原被告利益数据等数据,复杂网络分析方法可用于核心企业/人员的锁定、关联风险的识别及关联结构异常的挖掘等。

基于LBS分析,可视化呈现目标企业与其关联企业的地理分布,并从其动态演变特征挖掘风险异常。

机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。它是一门研究机器以获取新知识和新技能,并识别现有知识的学问,是将无序数据转化为有用信息的方法,价值在于从数据中抽取规律,并用于解释数据或预知未来。机器学习分为四大块:降维、分类、聚类和回归。从技术角度看,谷歌云机器学习与人工智能首席科学家李飞飞表示:机器学习正在信用卡风险检测、反诈骗和洗钱等方面发挥越来越大的作用。

9、外部合作

为完成重庆市大数据监测预警非法集资平台的建设,金信网银从数据合作、技术合作、专家合作等方面整合了各方资源,共同做好此项目。

数据是大数据平台的生产资料。整合多方海量的数据,才能丰富模型的指标体系,提升数据分析的准确性。金信网银一方面建立自己的独家数据资源库,另一方面一直寻找市场上最优质数据供应商,用最准确的数据给用户提供服务。与好公司合作,可降低自己的数据成本和时间成本,也会更好的服务用户。目前,金信网银整合的舆情数据、工商数据等数据都与业界最好的数据供应商建立起合作关系,真正实现“1+1>2”的效果。

技术合作是金信网银提高产品研发速度的重要途径。开源软件的普及打破了传统科技公司的桎梏,促进了多方之间的交流和合作。金信网银的产品设计借鉴了合作伙伴和开源软件的自然语言处理技术、知识图谱分析等,大大提高了工作效率。

专家合作是金信网银迅速发展的一大法宝。对市场需求的理解,一方面需要从实践中总结学习提升,另一方面需要理论层面的引导,加深对业务逻辑的分析。金信网银建立自己的专家智库,一起探索非法集资监测预警工作的方向,辅助监管层更有效地降低区域金融风险。

此外,金信网银还加强和市场合作、媒体合作、高校资源合作,以及未来资本运作等方面的合作。

10、商业变化

重庆市大数据监测预警非法集资平台建设是按照《关于促进互联网金融健康发展的指导意见》以及近期国务院关于启动互联网金融领域的专项整治系列部署,落实属地监管责任,推进本行政区域范围内的风险排查、监测预警、案件查处、善后处置、宣传教育和维护稳定等工作。具体有以下社会效益:

第一,平台建设是推进金融治理创新的必要手段,将金融风险化解在萌芽阶段,维护重庆市本地金融稳定和人民群众财产安全,促进本地新兴金融业态的健康发展。

第二,平台建设加强了重庆市政府对于互联网金融的监管,促进了互联网金融健康的发展,更好地服务于实体经济。

第三,平台建设有利于及时发现和处置重庆市非法集资行为,对已经出现的违法案件,有利于形成完整的线索链条,加快公安部门侦破案件,为人民群众挽回损失。

第四,平台采集到的新兴金融业态各方参与主体大数据信息,也有利于充实和完善重庆市公共基础信息资源库和信用信息主题库,依托该系统可为有关部门和领导提供宏观经济金融形势、金融运行状况、行业发展的统计、分析等,为决策参考。

- 关于企业 -

北京金信网银金融信息服务有限公司(以下简称金信网银),成立于2014年,是一家专门从事金融大数据分析挖掘系统、风险管理综合服务平台的研发和服务公司,能够满足金融监管部门多角度金融风险预防和监管的需求。公司致力于大数据监测预警金融风险,技术驱动创新社会治理,打通政府信息壁垒,用“冒烟指数”辅助地方金融监管部门守住不发生系统性金融风险,促进社会和谐稳定,为中国金融体系完善和信用体系建设注入正能量!

目前,金信网银已服务公安部建设非法集资犯罪监测预警平台,利用大数据技术辅助研判分析经济犯罪;服务北京市金融局建设全国第一个打击非法集资监测预警平台,应用于打击非法集资专项整治行动和互联网金融风险专项整治,及时监测预警非法集资等金融风险;服务中国互联网金融行业协会监测预警会员风险;服务深圳市金融办建设类金融行业监管平台;服务广东省金融办、重庆市金融办、北京市东城区金融办、北京市海淀区金融办、贵州省金融办、湖北襄阳金融办等做好类金融行业风险排查工作。此外,还服务于“一行三会”、珠海市金融办内蒙古自治区金融办等金融监管部门。

原文发布于微信公众号 - 数据猿(datayuancn)

原文发表时间:2017-10-09

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

美国大数据维稳镜鉴

31550
来自专栏镁客网

深兰科技陈海波:新零售的下一个战场是移动零售 | 镁客请讲

对于深兰科技而言,不断推陈出新的技术和产品就是它的核心竞争力,如小兰、大兰、“小蚂哥”、芭堤雅等。

8220
来自专栏新智元

【大咖专栏】谢国彤:我看到的靠谱医疗AI应用场景和关键技术

【新智元导读】IBM 中国研究院认知医疗研究总监谢国彤是新智元的老朋友。有感于“搞人工智能技术的人不知道医疗里重要又可解的问题是什么,搞医疗的人不知道技术究竟能...

413100
来自专栏AI科技大本营的专栏

一周AI看点 | 美军内部要求停用大疆无人机,DeepMind 与暴雪开源星际争霸 2 人工智能研究环境

本期一周AI看点包括:技术前沿,行业,观点,应用以及投融资等方面。 行业 美军内部备忘录曝光:要求停用大疆无人机 8月5日消息,专业无人机网站SUAS News...

401110
来自专栏AI科技大本营的专栏

让孩子进阶中产的唯一路径是编程?

作者 | 周翔 ****年,新的北京城已经建成**年了。 如今的北京已经是一座有着八千万人口的巨型城市,但是位于城市中心的紫禁城却不再属于每一个居民。 为了满足...

35560
来自专栏云技术

独家:“云养鹅目前已完成内测,将择日开放”

腾讯公司宣布,筹备近两年的“AI生态鹅厂”已在贵州贵安新区完成项目主体建设,预计于年内投产运行。

1.1K70
来自专栏程序人生

管理是什么(一)

简言之,无论团队大小,管理者的主要任务是建立 信任,输出 文化,确定 目标和战略(策略),有效 执行,并且和团队不断 学习和成长。

10700
来自专栏机器人网

机器人和自动化如何逐渐“控制”人类?

Nicholas Carr在它的新书《The Glass Cage: Automation and Us》中对人类未来做出了惨痛的沉思,而就在这本书出版前的一年...

37250
来自专栏大数据文摘

他统计完200多家公司的成败,发现惊人成功要素...

18440
来自专栏大数据文摘

[译]投资银行如何利用大数据预测行情

28630

扫码关注云+社区

领取腾讯云代金券