展开

关键词

2017年数据报告

二是通过大数据、云计算等手段,在风险防范、风险管方面实现了线上化和批量化。 其中,大数据技术解决了消费金融乃至小微金融领域的效率瓶颈。 目前,有能力推动大数据的主要为国有大行、股份制银行等大型银行,以及部分城商行等。互联网巨头、三运营商等由于掌握了庞大的个人数据,也开始加入到这一市场中来。 从国内金融机构应用大数据的情况看,主要将大数据应用在客户画像领域,包括风险管、运营优化、业务创新、优化营销策略等。 “白名单”主动预授信 在消费金融中,银行、互联网金融等机构开始采用前置的白名单邀请制,商业银行将主动授信用于实际业务,这是对以往被动授信模式的颠覆。 就国内商业银行而言,将风险评分等技术手段引入信用贷款模型,是一些银行信用贷款业务爆发、不良下降的核心原因。

79800

数据体系-简介

早期传统金融的主要利用了信用属性强大的金融数据,一般采用20个维度左右的数据,利用评分来识别客户的还款能力和还款意愿。 结合中国互联网发展,以及目前的征信监管要求,对可用数据及可用数据做一个全面的梳理。 2.数据来源 2.1 数据应用逻辑 常见流程中,客户准入时提供的资信材料有限,业务机构数据体量不足,仅仅根据内部风险数据进行风险评估会非常片面,无法全面的把某位客户的风险情况,所以通常需要依赖于第三方供应商提供数据作风支撑 未来百行能不能有效被使用上还有待观察,但人员可先了解其相关的资料。百行征信涉及的模块,主要包括以下方面: 报告相关数据:报告时间;查询原因;查询结果等。 4.2 明确需求 建议:回顾第二节数据应用逻辑关于业务类型、风险类型、流程、风险画像等的介绍。

1.5K63
  • 广告
    关闭

    腾讯云图限时特惠0.99元起

    腾讯云图是一站式数据可视化展示平台,旨在帮助用户快速通过可视化图表展示大量数据,低门槛快速打造出专业大屏数据展示。新用户0.99元起,轻松搞定数据可视化

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    中的大数据

    的意义 何为?字面含义就是对于风险的控制从而使财务不受到损失。对于任何一家金融机构(包括银行,小贷,P2P等)来说,的重要性超过流量、体验、品牌这些人们熟悉的指标。 做得好与坏直接决定了一家公司的生与死,而且其试错成本是无穷的,往往一旦发现出了问题的时候就已经无法挽回了。截止到2015年底,全国总共3000多家P2P平台里超过三分之一已经倒闭。 国际上传统的方法 的核心是要准确预测每一笔借款违约概率。显而易见,这需要量化的工具,也就是模型。 ◆◆◆ 4.机构在大数据领域的探索 我们所说的"大数据"并非指绝对的样本量的巨大,而是把常规的信贷征信数据以外的信息统一称为"大数据"。 大数据的挑战 伴随着机遇同样也有挑战。就像要有美味的菜肴,我们既需要好的材料,也需要好的厨师,当前大数据中运用的挑战主要还是在数据和人才这两方面。

    999120

    2018中国大数据调研报告:百亿大数据市场

    22120

    机器学习与大数据

    但机器学习在中的作用究竟如何,有哪些关键技术,其优势与缺点又有哪些呢?本期硬创公开课,雷锋网邀请百融金服风险总监郑宏洲,来讲讲机器学习与大数据的那些事。 嘉宾介绍: 郑宏洲,百融金服风险总监。 国内商业银行模型团队多年管理经验,专注于大数据机器学习、信贷风险策略、模型评分管理等领域。从事大数据分析和信贷风险管理近十年,在金融行业的数据分析、平台架构、模型研究和风险策略等方面有深刻的理解。 机器学习几乎在每一个有数据的场景都有应用。它主要是区别于纯粹人工经验去做决策。 雷锋网:目前来说,机器学习在大数据中是怎么样的地位?作用多大? 大数据是量化的一种新形式,出现主要的条件是,现代社会是一个信息社会,在信息和数据上极大的膨胀,这给我们有更全面衡量个体风险的机会。 区别于传统技术,大数据是在方法论上做了相应的革新。风险,即不确定性。风险管理实际上就是做量化风险。大数据是将贷款主体各个方面的属性维度做全面风险的量化。

    1.1K80

    【金融数据】消费金融:大数据那点事?

    数据同传统在本质上没有区别,主要区别在于模型数据输入的纬度和数据关联性分析。 大数据作为传统方式补充,主要利用行为数据来实施风险控制,用户行为数据可以作为另外的30%客户的有效补充。 风险评估过程中,如果数据纬度不全,高相关数据没有被考虑进来,对模型是一个的风险。信用风险评估模型缺少了重要风险因素的输入,其评估结果的偏离度就会较大,评估结果失效的可能性就很大。 大数据可以从数据纬度和分析角度提升传统水平,是一个必要的补充,可以让传统更加科学严谨,但是不是取代传统的模型和数据。 第二种是利用共享贷款数据机制,第三方企业或者的P2P,防欺诈联盟共享贷款平台的贷款记录。其他贷款平台可以依据申请人在其他平台的贷款记录来决定是否提供贷款,降低欺诈风险。

    1.4K51

    中必做的数据分析

    数据领域就没有不做数据分析的,大数据也不例外。 我的观点是和其他互联网业务都是互通的,本文介绍下风中必做的数据分析,用以说明数据分析是一通百通的。 工欲善其事,必先利其器。 01 业务理解 如果一家金融机构聘请你给他们的业务做咨询,你知道怎么办吗? 别告诉我,你想硬搬建模比赛的那套东西。不要掉价。 解决方案一定是针对当前业务和用户客群独家定制的。 转化流和行业一般情况做对比,就可以快速了解你的产品设计有没有的问题。 不同时期业务的重心可能不同,需要关注的转化也可能不同。 vintage分析把不同期的样本放在了一起,可以用来观察不同期客群风险的变化,然后确定是流量本身的变化,还是宏观形形势的变化,还是策略的变化等等。 如大家所见,在领域所在的数据分析,应该和其他互联网领域的数分并无本质区别。 因为和其他业务一样,本质都是用户生命周期管理。基于相同的底层逻辑,数据分析必然也并无二致。

    20030

    中的大数据和机器学习

    本篇文章只关注个人信用借款的。抵押贷,企业贷不在讨论范围中。 ◆ ◆ ◆ 1. 的意义 何为?字面含义就是对于风险的控制从而使财务不受到损失。 做得好与坏直接决定了一家公司的生与死,而且其试错成本是无穷的,往往一旦发现出了问题的时候就已经无法挽回了。截止到2015年底,全国总共3000多家P2P平台里超过三分之一已经倒闭。 机构在大数据领域的探索 我们所说的“大数据”并非指绝对的样本量的巨大,而是把常规的信贷征信数据以外的信息统一称为“大数据”。 大数据的挑战 伴随着机遇同样也有挑战。就像要有美味的菜肴,我们既需要好的材料,也需要好的厨师,当前大数据中运用的挑战主要还是在数据和人才这两方面。 2015年4月,基于8年累计的行业内最大最长的信贷历史数据,拍拍贷发布了业内第一个基于大数据建模的系统—魔镜。自从上线以来,魔镜在有效地控制风险的同时,也极大地提高了效率。 ?

    49630

    互联网金融中的数据科学

    宜人贷数据数据科学家王婷根据自己在行业的实践经验和专业知识,从三方面来分享互联网金融中的数据科学。 ? 背景 有了互联网之后,大家可以在线上进行理财借款。 传统都是使用一些基于规则的手段。线上随着用户量和数据量越来越大,我们会使用一些数据科学技术进行线上反欺诈中规则的提取或智能欺诈风险发现。 但在国内没有权威的征信机构来提供这些数据,对于互联网金融公司来说,收集这样的数据难度非常。而且传统评分卡的有效特征挖掘非常困难。 欺诈风险:欺诈风险包含了伪冒申请和欺诈交易。 建模中的数据科学 ? 在整个中,它是一个标准的机器学习流程。除了样本和数据与普通互联网机器学习不一样之外,其它基本都是一致的。 FinGraph是线上风险统中关键的一环 ? 总结:数据科学在互联网金融中发扬 图挖掘技术可以把风工作,从局部考量提升到全局考量。

    1.2K50

    电商社交数据在大数据的应用实践

    投稿来自卧龙大数据(公众号:DataWoLong) 大数据文摘欢迎各类优质稿件 请联系tougao@bigdatadigest.cn 随着普惠金融业务的深入,以及消费金融业务竞争的白热化,针对信用白户的显得尤为重要 如何面向信用白户进行快速有效的信用评级,卧龙大数据根据自己的实践经验,就电商、社交数据上的应用价值与大家进行一些分享。 数据匹配率可以达到50%及以上,具有较大的大数据分析潜力。 实名制的普及带来的是号码资源稀缺,最大化价值利用是黑产平台的主要特点,这也给我们基于大数据的反欺诈提供了线索。 三、电商社交数据建模应用 信用评估一直是金融领域的重中之重。 附:公司介绍 卧龙大数据专注于用大数据服务金融行业,利用互联网跨域关联数据为金融行业提供、营销相关的“数据、技术和解决方案”。

    99240

    金融数据管理——海量金融数据离线监控方法

    作者:housecheng  腾讯WXG工程师 |导语  解决金融数据监控“开发门槛高”“重复工作多”的痛点,实现PSI计算性能十倍速提升。 背景 在金融业务上,质量和稳定是生命线,我们需要对所有已经上线的要素,如策略、模型、标签、特征等构建监控。 在过去,我们部署监控的方式为: 要素负责同学在要素上线前,通过spark\sql完成对监控指标的运算并例行化; 将监控指标运算结果出库mysql\tbase,用于指标的展示和告警; 告警系统轮询指标是否异常 ,如多数要素都涉及PSI计算,只是告警阈值不一样;指标出库、配置告警等同样是重复相似操作。 小结 针对金融要素监控的“开发门槛高”“重复工作多”等问题,本文提出了“统一监控计算与检查工具”这一解决方案,本文详细论述了该方案TaskMaker、 Calculator、 Checker等各个模块的设计实现

    46810

    金融科技&大数据产品推荐: 数美金融—构建立体的全业务流程体系

    的产品投递 1、产品名称 数美全业务流程体系 2、所属分类 金融科技 · 、反欺诈 3、产品介绍 数美依托强大的AI技术与海量基础数据,为金融机构提供覆盖全业务流程的完整风解决方案。 信贷云也提供了一个可视化的规则引擎,该规则引擎集成数美所有的数据,并支持客户自定义的数据。客户可以利用这些数据,在web控制台灵活地配置各种规则策略。 ? 可信度和所有的风险判断结果都会反馈给客户的专家团队。 ? 信贷云集成了数美所有的数据维度,并且支持客户自定义数据,将自定义数据与数美数据联合使用。 对其进行自动的分析挖掘,补充数据维度。 这让金融企业面临着来自市场与黑灰产的双重挑战,并因此催生了对新金融的需求。 数美将企业沉淀数据与自身数据库相结合,一站式的帮助企业解决欺诈问题。

    86930

    跑路、欺诈风波不断,大数据威力何在?

    数据的市场格局 从整体来看,目前国内大数据市场上有两种体系:BAT与互联网金融公司内部的大数据体系;第三方大数据体系。 第二类是针对互联网金融企业和金融机构提供大数据服务的第三方大数据平台服务商。 由于互联网金融行业对大数据技术的需求爆炸性增长,诞生了一批第三方服务商,他们的大数据体系具有明显的“开放性”特征,与企业及各类金融机构“共享”或“共建”大数据服务。 企业做大数据面临的问题 尽管大数据已经得到业界认可,但市场上真正将大数据做好的公司却寥寥无几,原因是什么呢? 曾有专家指出,数据底层的技术是大数据的核心基础,如果没有过硬的技术实力,大数据也就无从谈起。 其次是数据源问题。一些平台在实施大数据过程中,收集的数据源很有限。

    624140

    【应用】揭秘互联网金融的大数据

    数据能够进行数据变现的商业模式目前就是两个,一个是精准营销,典型的场景是商品推荐和精准广告投放,另外一个是大数据,典型的场景是互联网金融的大数据。 金融的本质是风险管理,是所有金融业务的核心。典型的金融借贷业务例如抵押贷款、消费贷款、P2P、供应链金融、以及票据融资都需要数据识别欺诈用户及评估用户信用等级。 其他同信用相关的数据还有区域、产品、理财方式、行业、缴款方式、缴款记录、金额、时间、频率等 互联网金融的大数据并不是完全改变传统,实际是丰富传统数据纬度。 八、参考借款人社会属性和行为来评估信用 参考过去互联网金融的经验发现,拥有伴侣和子女的借款人,其贷款违约率较低;年龄的人比年龄低的人贷款违约率要高,其中50岁左右的贷款人违约率最高,30岁左右的人违约率最低 总之,互联网金融的大数据采用了用户社会行为和社会属性数据,在一定程度上补充了传统数据维度不足的缺点,能够更加全面识别出欺诈客户,评价客户的风险水平。

    64340

    金融科技&大数据产品推荐:易鑫大数据平台

    易鑫大数据平台综合了机器学习、网络爬虫、指标体系、规则引擎、图数据库、流式计算等核心技术,整合线上线下多维度数据,可支持反欺诈、信用评分、贷前审批、贷中监控、贷后追踪等全方位的金融场景。 的产品投递 1、产品名称 易鑫大数据平台 2、所属分类 消费金融 金融科技·、征信、反欺诈、大数据安全 3、产品介绍 易鑫大数据平台综合了机器学习、网络爬虫、指标体系、规则引擎、图数据库、 应用场景1:贷款在线审批 智能平台基于大数据进行实时数据收集、数据分析,并进行一系列规则计算、评分建模与智能决策,实现前置,帮助客户达到“秒级放贷”。 B 手段单一,欺诈专业性强,难以识别 汽车贷款额度以及政策激励下申请门槛的降低,催生了大量专业欺诈人员,导致欺诈行为识别难度加大。 成立三年多来,易鑫集团发展突飞猛进,目前,已完成智能数据控管理、资产管理三中心的核心布局。2016年,易鑫平台的交易量超过26万台,总交易规模超过270亿元。

    1.3K120

    手绘 | 深入解析8场景中的机器学习应用

    本文主要内容 本文详细梳理领域的基本概念,并将模型的使用场景分为8板块,逐一解析机器学习在其中的应用。 ? 领域的特点 领域是新兴的机器学习应用场景之一,其特点非常明显: 负样本占比极少,是均衡学习的算法的主战场之一。有标签样本稀缺,从而使得半监督和无监督算法在场景下大放异彩。 ? 数据源丰富。围绕着人展开的数据皆可用,而数据多样带来的就是新兴技术的井喷,结构化数据、图像、文本等等多个领域的方法都在领域有一定应用。 信用管理与风险 信用贷款的逻辑可以参见这幅漫画 ? 互联网金融体系主要由三部分组成:数据信息、策略体系、人工智能模型。 ? 数据信息:包括用户基本信息、用户行为信息、用户授权信息、外部接入信息。 但在很多真实场景下,数据集往往是不平衡的。也就是说,在数据集中,有一类含有的数据要远远多于其他类的数据。 ? 尤其是在场景下,负样本的占比要远远小于正样本的占比。

    44010

    漫画 | 深入解析8场景中的机器学习应用

    本文主要内容 本文整理自《智能:原理、算法与工程实践》一书。详细梳理领域的基本概念,并将模型的使用场景分为8板块,逐一解析机器学习在其中的应用。 image.png 领域的特点 领域是新兴的机器学习应用场景之一,其特点非常明显: 负样本占比极少,是均衡学习的算法的主战场之一。 数据源丰富。围绕着人展开的数据皆可用,而数据多样带来的就是新兴技术的井喷,结构化数据、图像、文本等等多个领域的方法都在领域有一定应用。 互联网金融体系主要由三部分组成:数据信息、策略体系、人工智能模型。 image.png 数据信息:包括用户基本信息、用户行为信息、用户授权信息、外部接入信息。 但在很多真实场景下,数据集往往是不平衡的。也就是说,在数据集中,有一类含有的数据要远远多于其他类的数据。 image.png 尤其是在场景下,负样本的占比要远远小于正样本的占比。

    1.4K40

    数据挖掘】写给新人大数据挖掘基础知识介绍

    还有很多和这一术语相近似的术语,如从数据库中发现知识(KDD)、数据分析、数据融合(Data Fusion)以及决策支持等。 数据关联是数据库中存在的一类重要的、可被发现的知识。关联分为简单关联、时序关联和因果关联。关联分析的目的是找出数据库中隐藏的关联网。 2 聚类分析 clustering 聚类是把数据按照相似性归纳成若干类别,同一类中的数据彼此相似,不同类中的数据相异。 6 偏差分析 deviation 在偏差中包括很多有用的知识,数据库中的数据存在很多异常情况,发现数据库中数据存在的异常情况是非常重要的。偏差检验的基本方法就是寻找观察结果与参照之间的差别。 2) 理解数据:收集初步的数据,进行各种熟悉数据的活动。包括数据描述,数据探索和数据质量验证等。 3) 准备数据:将最初的原始数据构造成最终适合建模工具处理的数据集。

    45060

    【ArchSummit干货分享】个推大数据金融算法实践

    本文将围绕大数据,结合个推实践,介绍金融机器学习的基本流程、算法实践和产品化建设等内容。 ? ? 流程 & 多维度特征 大数据的内容 数据的核心要素,大数据实际上就是对数据的处理、建模和应用的过程。大数据的流程主要分为四个阶段:数据获取、数据分析、数据建模、产品应用。 基本属性、资产、金融、行为偏好、社会属性、消费偏好、风险和稳定性构成了个推金融数据的八维度;个推利用数据的八维度,逾350种特征进行模型构建,并将其应用于金融各环节。 金融机器学习的基本流程 整个建模流程,在个推大数据平台上完成。 场景机器学习的算法实践 利用上述多维度特征和建模能力,增能于贷前、贷中和贷后全流程:拉、选、评、管、催五环节。 ?

    61130

    相关产品

    • 风控平台

      风控平台

      腾讯云星云风控平台(Risk Control Platform)提供实时、集中的一站式智能风险管控服务。打通数据采集、数据清洗、特征加工、规则模型、顶层场景的各个模块,从而形成符合实际风控场景的端到端服务平台。

    相关资讯

    热门标签

    扫码关注腾讯云开发者

    领取腾讯云代金券