首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

2017年数据报告

二是通过大数据、云计算等手段,在风险防范、风险管方面实现了线上化和批量化。 其中,大数据技术解决了消费金融乃至小微金融领域的效率瓶颈。...目前,有能力推动大数据的主要为国有大行、股份制银行等大型银行,以及部分城商行等。互联网巨头、三运营商等由于掌握了庞大的个人数据,也开始加入到这一市场中来。...“白名单”主动预授信 在消费金融中,银行、互联网金融等机构开始采用前置的白名单邀请制,商业银行将主动授信用于实际业务,这是对以往被动授信模式的颠覆。...解决方案包括: (1)设立反欺诈“黑名单”,拦截有不良欺诈记录的申请者,数据来源于央行征信系统、公安联网系统、前海征信或同盾等专业从事反欺诈的第三方数据。...就国内商业银行而言,将风险评分等技术手段引入信用贷款模型,是一些银行信用贷款业务爆发、不良下降的核心原因。

1.9K00

实时业务系统

账号:垃圾注册、撞库、盗号等 交易:盗刷、恶意占用资源、篡改交易金额等 活动:薅羊毛 短信:短信轰炸 项目介绍 实时业务系统是分析风险事件,根据场景动态调整规则,实现自动精准预警风险的系统。...本项目只提供实时风系统框架基础和代码模板。...,风险事件的分析必须毫秒级响应,有些场景下需要尽快拦截,能够给用户止损挽回损失 低误报,这需要人工经验,对各种场景风险阈值和评分的设置,需要长期不断的调整,所以灵活的规则引擎是很重要的 支持对历史数据的回溯...,能够发现以前的风险,或许能够找到一些特征供参考 项目标签 轻量级,可扩展,高性能的Java实时业务系统 基于Spring boot构建,配置文件能少则少 使用drools规则引擎管理规则,原则上可以动态配置规则...; 扩展规则,针对需要解决的场景问题,添加特定规则,分值也应根据自身场景来调整。

2.1K10
您找到你想要的搜索结果了吗?
是的
没有找到

数据体系-简介

早期传统金融的主要利用了信用属性强大的金融数据,一般采用20个维度左右的数据,利用评分来识别客户的还款能力和还款意愿。...结合中国互联网发展,以及目前的征信监管要求,对可用数据及可用数据做一个全面的梳理。...2.数据来源 2.1 数据应用逻辑 常见流程中,客户准入时提供的资信材料有限,业务机构数据体量不足,仅仅根据内部风险数据进行风险评估会非常片面,无法全面的把某位客户的风险情况,所以通常需要依赖于第三方供应商提供数据作风支撑...未来百行能不能有效被使用上还有待观察,但人员可先了解其相关的资料。百行征信涉及的模块,主要包括以下方面: 报告相关数据:报告时间;查询原因;查询结果等。...4.2 明确需求 建议:回顾第二节数据应用逻辑关于业务类型、风险类型、流程、风险画像等的介绍。

3.8K65

ML | 建模的KS

我们这做模型的时候,经常是会用KS值来衡量模型的效果,这个指标也是很多领导会直接关注的指标。今天写一篇文章来全面地剖析一下这个指标,了解当中的原理以及实现,因为这些知识是必备的基本功。...不过这不影响我们去使用它,我们只需要知道在中是怎么实现的,并且在实际场景中怎么去使用它就可以了。就如上面我们说的,KS在主要是用于评估模型的好坏样本区分度高低的。什么是区分度?...可以看下图: 从业务上来说,就是越往后的箱子,客户的质量越差,rate整体上呈现单调性,从而可以把大多数的坏人,直接从箱的维度上就可以区分开来了,在后续的策略使用体验上十分友好。...02 KS的生成逻辑 KS的生成逻辑公式也是十分简单: 好样本累计占比坏样本累计占比 在领域,我们在计算KS前一般会根据我们认为的“正态分布原则”进行分箱,一般来说分成了10份,然后再进行KS的计算...03 KS的效果应用 KS的值域在0-1之间,一般来说KS是越大越有区分度的,但在领域并不是越大越好,到底KS值与模型可用性的关系如何,可看下表: 004 KS的实现 首先我们来对上面展示的例子进行

4.4K30

智能系统设计与实践

在信息安全领域,建立在人工智能技术之上的策略引擎已经深入到了产品功能的方方面面,相应的,每一个策略系统都离不开大量的特征,来支撑模型算法或人工规则对请求的精准响应,因此特征系统成为了支持线上风引擎的重要支柱...本文以智能在线特征系统为原型,重点从线上数据从生产到特征物料提取、计算、存取角度介绍一些实践中的通用技术点,以解决在线特征系统在高并发情形下面临的问题和挑战。 特征系统的基本概念 1....在线实时特征系统设计与实践,对从整体功能上来讲,在线实时特征系统的设计主要考虑以下几个方面: a) 数据系统每天产生日志量3TB左右,同时特征系统还会接入发布、浏览、登录、注册、聊天等数据。...b) 时效性高,面对庞大的数据量级,数据的处理实效性要求是秒级别,同时不能产生数据堆积的情况。 c) 并发策略系统面向用户端,服务端峰值QPS超过35万,每日调用量超过200亿次。...总结和规划 本文主要以智能在线特征系统为原型,提出了在线特征系统的一些设计思路。其中特征工程系统的边界并不限于特征的解析、计算、存取等。

1.8K20

中的大数据

的意义 何为?字面含义就是对于风险的控制从而使财务不受到损失。对于任何一家金融机构(包括银行,小贷,P2P等)来说,的重要性超过流量、体验、品牌这些人们熟悉的指标。...做得好与坏直接决定了一家公司的生与死,而且其试错成本是无穷的,往往一旦发现出了问题的时候就已经无法挽回了。截止到2015年底,全国总共3000多家P2P平台里超过三分之一已经倒闭。...◆◆◆ 5.大数据在中国的机遇 最近10年,以个人信用卡为代表的个人贷款业务在中国有了蓬勃的发展。我国的信用卡交易和风系统在初期大量借鉴了国外的经验。银联的第一代系统是与VISA合作完成的。...国内很多银行的流程和系统是从国外采购,很多风高管也是直接从国外银行引进的。 然而与国外相比,中国最大的差异在于征信体系的不完善。...大数据的挑战 伴随着机遇同样也有挑战。就像要有美味的菜肴,我们既需要好的材料,也需要好的厨师,当前大数据中运用的挑战主要还是在数据和人才这两方面。

1.5K120

ML | 建模的WOE与IV

ML」系列文章,主要是分享一下自己多年以来做金融的一些事一些情,当然也包括建模、机器学习、大数据等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步!...第一次接触这两个名词是在做模型的时候,老师教我们可以用IV去做变量筛选,IV(Information Value),中文名是信息值,简单来说这个指标的作用就是来衡量变量的预测能力强弱的,然后IV又是...data_bad) len_good = len(data_good) for value in value_list: # 判断是否某类是否为0,避免出现无穷小值和无穷值...测试数据集可以后台回复 'age' 进行获取。...,不过得注意一些细节,转换数据格式。‍

3.5K20

信贷模型搭建及核心模式分类

一、当前模式现状 近年来,信用风险管理发展呈现出数据化、模型化、系统化、自动化和智能化的特点。传统的人工专家经验正逐步被模型与算法替代。...目前,对于信贷审核来说主要基于的模式为IPC、信贷工厂、大数据三种,每一种都有自己不同的侧重点。...在我们清洗数据的时候,看到对客户信用评价中有这么一类“少量逾期”,这个类别占了相当的比重,而且在模型中作用也比较显著,和其它类别“信用好”“信用差”等比肩。...五、模型的设计步骤 总体来说模型的设计主要可以分为以下的几个步骤: 1.获取数据 信用评估来自于用户数据,模型规则其实就是用户数据规则,信息的纬度也比较广泛,大致可以分为基本信息/行为信息...,一般来说活体检测是能够过滤到一部分恶意欺诈人群的。

2K10

机器学习与大数据

但机器学习在中的作用究竟如何,有哪些关键技术,其优势与缺点又有哪些呢?本期硬创公开课,雷锋网邀请百融金服风险总监郑宏洲,来讲讲机器学习与大数据的那些事。 嘉宾介绍: 郑宏洲,百融金服风险总监。...国内商业银行模型团队多年管理经验,专注于大数据机器学习、信贷风险策略、模型评分管理等领域。从事大数据分析和信贷风险管理近十年,在金融行业的数据分析、平台架构、模型研究和风险策略等方面有深刻的理解。...机器学习几乎在每一个有数据的场景都有应用。它主要是区别于纯粹人工经验去做决策。 雷锋网:目前来说,机器学习在大数据中是怎么样的地位?作用多大?...大数据是量化的一种新形式,出现主要的条件是,现代社会是一个信息社会,在信息和数据上极大的膨胀,这给我们有更全面衡量个体风险的机会。...区别于传统技术,大数据是在方法论上做了相应的革新。风险,即不确定性。风险管理实际上就是做量化风险。大数据是将贷款主体各个方面的属性维度做全面风险的量化。

1.8K80

支付模型

大部分支付系统是使用三等级的风险。 二、基于规则的 规则是最常用的,也是相对来说比较容易上手的模型。从现实情况中总结出一些经验,结合名单数据,制定规则,简单,有效。...它是其它模型的基础。实践中,首先使用已知的规则来发现存在问题的交易,人工识别交易的风险等级后,把这些交易作为其它有监督学习的训练数据集。...三、决策树模型 风险评估从本质上来说是一个数据分类问题。 和传统的金融行业风险评估不一样的地方,在于数据规模、业务变化快、实时要求高。一旦有漏洞被发现,会对公司造成巨大损失。...互联网金融离不开机器学习,特别是支付。 在各种支付模型中,决策树模式是相对比较简单易用的模型。 如下的决策树模型,我们根据已有的数据,分析数据特征,构建出一颗决策树。...支付场景分析 ; 支付数据仓库建设 ; 支付模型和流程分析(本文); 支付系统架构 发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn

1.8K21

系统敏感词校验架构设计

这里想到了自己经常联调的同学违禁词识别场景。和某明星塌房需要拦截关键词一毛一样。在联调之余有幸请教了的几位同学,再此学习了一下系统中敏感词校验的设计方案。...对于上面的DEMO,实际上数据init一次以后就不会再加载了,如果数据中新增一个违规词,则只能通过重启服务,这个操作太重(大项目启动一次20几分钟)。...这种方案也有一个弊端,如果周期小频繁查询全量数据,DB压力,无效查询居多(基本不变);如果周期大我联调或者真生产环境要瞬间加违禁词,时效性差。...终极方案:新增或者删除以后【自动或者人工】感知到这种变更,然后变更通知到系统中的Listener,重新读取全量的数据。...详情可参考Trie 树原理及其敏感词过滤的实现 3、总结 整个链路可以不实现,但是方案要完整;系统可以不用,但是要做。两句都对。

33510

金融科技&大数据产品推荐:金鹏汽车金融大数据系统

金鹏汽车金融大数据系统主要基于大数据科技、决策树规则引擎、深度学习等多项核心技术,有效针对新车贷款、二手车贷款等业务,提高风效率。...的产品投递 1、产品名称 金鹏汽车金融大数据系统 2、所属分类 消费金融 金融科技·、征信、反欺诈、智能定价 3、产品介绍 金鹏汽车金融大数据系统一站式完成车贷审批流程。...4、应用场景/人群 车贷场景,审批员或客户经理在“金鹏”系统中提交贷款申请,完成车贷审批流程。...6、产品优势 金鹏汽车金融大数据系统能力行业领先。秒速审批,一站式低成本。精准,近100%覆盖权威有效。自动定价,自动决策引擎定价,差异化匹配资质,高体验。...金鹏汽车金融系统一站式解决预审批难题,基于大数据科技、决策树规则引擎、深度学习等多项核心技术,提高车贷行业能力,给予更准确、更效率、更便捷的体验。

2K70

美团点评业务系统构建经验

下面分别来看我们在系统构建中的做法。 接入成本 系统最早只是业务系统中的一个函数,逐步演化成了独立的服务。...即业务系统调用用户中心,用户中心再调用透传所需参数,而的决策也通过用户中心返回给业务后台。 这样的好处是只需要用户中心与对接一次,业务系统甚至不需要明显感知到的存在。...运营平台的意义不仅在于处理案件本身,更在于将处理结果反馈到线上系统中实现线上和线下的运行闭环。除了运营平台,逆转信息劣势还要靠完善的数据体系的帮助。...基础数据:除了直接传递到数据外,处理过程少不了需要业务甚至是外部的辅助信息。例如,业务相关订单和活动信息、公认的事实数据、外部辅助决策信息等。...小结 把上面三部分融合起来,可以看到系统的全景: ? 之道 从上文三条工作原则可以看到,系统构建过程各个阶段的关注点从对接质量,到平台效率,再过渡到立体的闭环防御。

3.5K71

ML | 中的异常检测原理与应用

今天来介绍一下中的异常检测,从最基础的概念开始讲起,因为本人对这块的内容平时工作也做得不多,更多滴偏向于“纸上谈兵”,有什么说得不对的地方,也欢迎各位朋友指正~谢谢。...异常检测的概念 02 异常检测的难点 03 异常检测的分类及常见算法 01 异常检测的概念 异常检测(Anomaly Detection 或 Outlier Detection),又称为离群点检测,在我们领域很多地方都会用到...0301 基于统计检验与分布算法 说起异常点检测,最容易想到的就是这个正态分布图了,3倍方差之外的数据属于异常数据。...它是在1977年由美国统计学家John Tukey发明,分析数据需要为定量数据,通过它可以直观的探索数据特征。我们可以从箱线图中直观地看到两点:数据离散分布情况以及离群点。...而右边为解码器,它负责把压缩了的数据再进行还原,努力恢复成原本的样子。如果恢复不了,那就意味着样本不是同一类,可以归纳为异常数据。 4、混合DAD:深度学习模型提取特征+SVM进行分类。

2.5K20

ML | 建模中怎么做拒绝推断

建模中的样本偏差与拒绝推断》https://zhuanlan.zhihu.com/p/88624987 不过我也还是把他文章里的分类体系在这里重点再次分享一下。...其中,数据法中提到的3种方式都是比较好理解的。...方法一:简单说就是把模型应该拒绝的客户,按照一定规则(比如不那么坏的客户)给予审批通过的决策,后续观察其贷后表现,给未来的模型提供更丰富的数据; 方法二:指的是从其他机构或者类似产品中获得客户的贷后表现数据...06 总结一下 本文算是一个对拒绝推断的入门介绍了,让初涉模型的同学有一个相对来说比较清晰的全局认识,这里面涉及到的很多算法模型上的细节并没有展开来讲,因为我觉得这也会让阅读带来比较大的负担,公众号的文章还是要控制在几分钟内读完比较合适...Reference [1] 异常检测算法分类及经典模型概览 https://blog.csdn.net/cyan_soul/article/details/101702066 [2] 建模中的样本偏差与拒绝推断

1.6K30

ML | 建模老司机的几点思考与总结

ML」系列文章,主要是分享一下自己多年以来做金融的一些事一些情,当然也包括建模、机器学习、大数据等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步!...02 数据搜集处理(Data Curation) 当我们确定了要开发的模型之后,这个时候需要做的是搜集数据与处理数据了。...搜集数据,不需要等到所有的特征都搜集完才开始开发特征或者训练模型,有多少数据,就先搞多少数据。...在了解了以上的内容后,你就可以开始搜集所有相关的数据了,因为你的数据源会非常多,所以这里你必须做好数据的归档,不然后期会很乱,而且原始数据需要备份一份不要动,方便后续复盘使用。...具体可以参考我先前的一篇文章内容《分享8点超级有用的Python编程建议》 搞到数据后,需要做的事情大概可以分为: 1、消化所有的数据含义、逻辑; 2、对数据进行各种清洗,变成你熟悉的结构; 3、对数据进行质量控制

1.4K30

决策引擎经验

系统的作用在于识别绝对与标识相对风险,如果是绝对,则整套的审核结果便将是“拒绝”。既然结果必然是“拒绝”,则没必要运行完所有的规则,而主要单条触发“拒绝”即可停止剩余规则的校验。...由于最终还是数据“喂出来”的结果,的本质就是数据,而非主观臆断的设限,故而,随着数据样本与内容的不断发展,必然将会涉及到一些动态的调整,后期可能会发现原本设定的“参数”过于严谨而导致审核通过较低...三、记录与统计 最终到底是“跑出来”的,所以,整个系统对所有不同规则的触发需进行有效的记录与统计,以便后期可支持数据分析与模型调整的相关工作。...3、数据源内容 举例说明:某些规则是通过二次数据解析与汇总进行的,但原始数据需要进行保存,诸如手机账单的通话明细数据,此部分数据一是可作为规则使用,二是未来可用作于催收与贷后管理。...而评分卡的模式在另外一方面也作用于系统审核与人工信审,譬如高于X评分的订单申请,系统直接通过;处于X与Y之间的评分,则需人工审核,甚至通过电话联系;而低于Y评分的,则系统直接拒绝(半自动)。

1K30
领券