展开

关键词

ML | 建模的KS

我们这做模型的时候,经常是会用KS值来衡量模型的效果,这个指标也是很多领导会直接关注的指标。今天写一篇文章来全面地剖析一下这个指标,了解当中的原理以及实现,因为这些知识是必备的基本功。 不过这不影响我们去使用它,我们只需要知道在中是怎么实现的,并且在实际场景中怎么去使用它就可以了。就如上面我们说的,KS在主要是用于评估模型的好坏样本区分度高低的。什么是区分度? 可以看下图: 从业务上来说,就是越往后的箱子,客户的质量越差,rate整体上呈现单调性,从而可以把大多数的坏人,直接从箱的维度上就可以区分开来了,在后续的策略使用体验上十分友好。 02 KS的生成逻辑 KS的生成逻辑公式也是十分简单: 好样本累计占比坏样本累计占比 在领域,我们在计算KS前一般会根据我们认为的“正态分布原则”进行分箱,一般来说分成了10份,然后再进行KS的计算 03 KS的效果应用 KS的值域在0-1之间,一般来说KS是越大越有区分度的,但在领域并不是越大越好,到底KS值与模型可用性的关系如何,可看下表: 004 KS的实现 首先我们来对上面展示的例子进行

14430

互联网金融7个问题

通过市场分析后不难发现,基础借贷产品还是市场主流,还有一些类似资本类产品或衍生产品,目前很多平台还是具有传统业务特点的,每个公司都是有自己的衡量‘点’的尺度,传统金融行业、民间金融或者互联网金融,本身因为其独特的形式活跃 纯互联网背景出身的互联网金融公司,应从哪几个方面去把关? 其实互联网金融公司和是不是纯互联网背景没有直接关系。关键是从事了互联网金融你怎么去经营。 首先,你的体系的建立是打算以哪种形态存在? 首先贵公司考虑进入市场方向、目标客户群体,打算以金融产品为市场导向,再去考虑掌握方向,先要把战略目标确定了,才能去确定有效的体系建立、市场推广方向等,现在就有很多家互联网背景的公司,他们的方向 ,目标人群是明确的,当然他们的互联网背景,也为他们带来了很多的优势,就是多年的用户和商户的数据累计,可以明确的进行数据分析、轨迹消费习惯测算,O2O供应链环节把、产业链上下游控制等等的防范措施,这就是他们的把握明确方向 ,在互联网金融和民间金融机构还是藏龙卧虎的。

1.5K50
  • 广告
    关闭

    开发者专享福利,1988元优惠券限量发放

    带你体验博客、网盘相册搭建部署、视频渲染、模型训练及语音、文字识别等热门场景。云服务器低至65元/年,GPU15元起

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    互联网金融模型「建议收藏」

    一、市场调研 目前市面主流的模型 1、互联网金融前10名排行榜(数据截止日期2017-09-12) 互联网金融公司排名分别是蚂蚁金服、陆金所、京东金融、苏宁金融、百度金融、腾讯理财通、宜信、钱大掌柜 、万达金融和网易理财。 数据还有很长的路要走,如量化投资风险评估与运营也属范畴,也可和推荐领域相结合。 总之,互联网金融核心还是服务客户,提升产品价值,最大程度的做到差异化的防范,智能化是的发展方向,京东金融从开始就致力于打造智能化的风险管解决方案。 因此风显的更加尤为重要。通过模型获取优质的资产。 二、模型 模型应该是从两个角度去考虑,第一个角度是资产端策略,第二个角度是资金端策略。

    11810

    互联网金融中的数据科学

    宜人贷数据部数据科学家王婷根据自己在行业的实践经验和专业知识,从三方面来分享互联网金融中的数据科学。 ? 背景 有了互联网之后,大家可以在线上进行理财借款。 互联网金融服务面临的风险 互联网金融——个人对个人的信用贷款 互联网金融除了借款人群还有出借人群,也就是我们常说的理财。它会给我们提供资金,这些资金会转化成债权去借给需要借贷的人群。 知识图谱在金融中的应用场景 互联网金融中的是一种机器学习的过程 互联网金融中风和机器学习一样要定义Y目标和X变量。 Y目标和普通机器学习Y目标的区别就在于正负比例非常悬殊。 建模中的数据科学 ? 在整个中,它是一个标准的机器学习流程。除了样本和数据与普通互联网机器学习不一样之外,其它基本都是一致的。 FinGraph是线上风险统中关键的一环 ? 总结:数据科学在互联网金融中发扬 图挖掘技术可以把风工作,从局部考量提升到全局考量。

    1.2K50

    ML | 建模的WOE与IV

    ML」系列文章,主要是分享一下自己多年以来做金融的一些事一些情,当然也包括建模、机器学习、大数据等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步! 第一次接触这两个名词是在做模型的时候,老师教我们可以用IV去做变量筛选,IV(Information Value),中文名是信息值,简单来说这个指标的作用就是来衡量变量的预测能力强弱的,然后IV又是

    16020

    关于互联网金融授信产品的建模

    作者 | xiaoyu 知乎 | https://zhuanlan.zhihu.com/pypcfx 介绍 | 一个半路转行的数据挖掘工程师 随着互联网渗透到生活中的各个角落,金融行业也似乎找到了与互联网的完美结合 本文将针对这些问题简单介绍互金行业中授信产品的建模过程,内容主要如下: 信用风险定义 信用风险评分卡类型 信用评分模型建立的基本流程 1信用风险定义 风险管理的概念 风险管理最早起源于美国。 1930年由美国管理协会保险部最先倡导风险管理,后面在全球流行开来,随着互联网的迅猛发展,大数据、数据挖掘和机器学习等新兴技术开始出现,让风险管理更为精准。 当然,这些技术的应用并不能百分百的保证零风险,因为有很多人为因素是不可控的,但是信用技术在很大程度上帮助金融企业进行了很好的风险管,通过降低风险减少损失来间接增加利润。 下面是一个真实的在线授信产品的建模的流程图,可参考进行理解: ? 以上是对信用评分分类以及建模基本流程的介绍,欢迎大家指正。

    76222

    【应用】揭秘互联网金融的大数据

    大数据能够进行数据变现的商业模式目前就是两个,一个是精准营销,典型的场景是商品推荐和精准广告投放,另外一个是大数据,典型的场景是互联网金融的大数据。 其他同信用相关的数据还有区域、产品、理财方式、行业、缴款方式、缴款记录、金额、时间、频率等 互联网金融的大数据并不是完全改变传统,实际是丰富传统的数据纬度。 常用的互联网金融大数据方式有以下几种: 一、验证借款人身份 验证借款人身份的五因素认证是姓名、手机号、身份证号、银行卡号、家庭地址。 黑名单和灰名单是很好的方式,但是各个征信公司所拥有的名单仅仅是市场总量的一部分,很多互联网金融公司不得不接入多个公司,来获得更多的黑名单来提高查得率。 总之,互联网金融的大数据采用了用户社会行为和社会属性数据,在一定程度上补充了传统数据维度不足的缺点,能够更加全面识别出欺诈客户,评价客户的风险水平。

    66040

    关于互联网金融授信产品的建模

    全文1253字 | 阅读需要6分钟 随着互联网渗透到生活中的各个角落,金融行业也似乎找到了与互联网的完美结合。互联网金融作为一个新的行业如今正在上升的势头上,因而也涌现了越来越多的P2P公司。 本文将针对这些问题简单介绍互金行业中授信产品的建模过程,内容主要如下: 信用风险定义 信用风险评分卡类型 信用评分模型建立的基本流程 1信用风险定义 风险管理的概念 风险管理最早起源于美国。 1930年由美国管理协会保险部最先倡导风险管理,后面在全球流行开来,随着互联网的迅猛发展,大数据、数据挖掘和机器学习等新兴技术开始出现,让风险管理更为精准。 当然,这些技术的应用并不能百分百的保证零风险,因为有很多人为因素是不可控的,但是信用技术在很大程度上帮助金融企业进行了很好的风险管,通过降低风险减少损失来间接增加利润。 下面是一个真实的在线授信产品的建模的流程图,可参考进行理解: ? 以上是对信用评分分类以及建模基本流程的介绍,欢迎大家指正。

    2.2K20

    信贷模型搭建及核心模式分类

    2.评分卡的意义 在互联网金融体系中,量化分析需要贯穿始终,评分卡模型是其中非常重要的一环。 3.评分卡的开发应用 在互联网金融评分卡开发过程中,我们仔细研究了企业操作流程,反复推敲了模型构建步骤,最后我们认为从业务应用角度,评分卡开发应用应遵循: 业务定义➡️风险定义 ➡️风险分解➡️ E.应用场景 模型的应用场景非常广泛,只要牵扯互联网金融的行业就缺少不了模型的存在,从借贷的角度来看,平台要评估借贷者的个人征信和还款能力从而保证投资者的收益;从投资者的角度,要保证平台的资金安全 从资金的角度来看,模型是为了评估用户还款能力和还款意愿,反欺诈反作弊,防止用户薅羊毛和保证平台安全等功能;从行业的角度,互联网模型体现在消费金融/供应链金融/信用借贷/P2P/大数据征信等方面。 所以说,模型的计算策略和机制在一个公司属于绝密,规则除了核心的员工,其他人是不能知道规则的。 四、的核心 如果说金融产品的核心是,那么的核心是什么?

    14010

    1.1 原则

    如果利差无法覆盖借款损失,那么这个损失就是UL了 答案是A 和坚叨叨:在2015年互联网金融比较火的时候,流行一句话就是操卖白粉的心,赚卖白菜的钱。 这个就是资金资产的利差无法覆盖借款损失了,说明很多互联网金融理财产品的UL太高了。

    1.2K40

    支付模型

    二、基于规则的 规则是最常用的,也是相对来说比较容易上手的模型。从现实情况中总结出一些经验,结合名单数据,制定规则,简单,有效。 常见的规则有: 1. 互联网金融离不开机器学习,特别是支付。 在各种支付模型中,决策树模式是相对比较简单易用的模型。 如下的决策树模型,我们根据已有的数据,分析数据特征,构建出一颗决策树。 虽然银行间的评分模型有很好的参考价值,但互联网公司由于业务和数据的不同,评分模型参考价值不大。 每个公司需根据自己的业务情况来制定评分模型,之后为各个指标指定权重比例。 这个过程,将在下一篇的架构中介绍。 五、模型评估 本质上是对交易记录的一个分类,所以对模型的评估,除了性能外,还需要评估“查全率”和“查准率”。 支付场景分析 ; 支付数据仓库建设 ; 支付模型和流程分析(本文); 支付系统架构 发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn

    15721

    ML | 中的异常检测原理与应用

    今天来介绍一下中的异常检测,从最基础的概念开始讲起,因为本人对这块的内容平时工作也做得不多,更多滴偏向于“纸上谈兵”,有什么说得不对的地方,也欢迎各位朋友指正~谢谢。 异常检测的概念 02 异常检测的难点 03 异常检测的分类及常见算法 01 异常检测的概念 异常检测(Anomaly Detection 或 Outlier Detection),又称为离群点检测,在我们领域很多地方都会用到

    17020

    告别野蛮生长,互联网金融布局 | b报道

    “有实力的企业正走向更完善的体系:他们的交易平台不是孤立的,而是先有好的平台,基于做资产交易平台,再做互联网金融平台,这才是互联网金融的精髓所在。” 大数据做互联网金融正走向2.0时代。有一些资产、再建一个网站——这种草根搭台的方式正走向困境,资产和架构的单调性难以抵御风险。 有实力的企业正走向更完善的体系:他们的交易平台不是孤立的,而是先有好的平台,基于做资产交易平台,再做互联网金融平台,这才是互联网金融的精髓所在。” 合众普惠副总裁向华胜认为,在互联网金融发展初期,大家都在努力扩展渠道,把自己做大,但大而不强很容易倒。“很重要,接下来就要基于监管要求进行整改,自我完善,提升能力。” 在房产领域,去年上半年,58同城收购安居客后,成为房产互联网最大的平台,他们对二手房、租房、新房做了分析和调研,整合场景和数据,联合资产端、理财端的合作伙伴,58金融开始提供资产理财的服务,或将做到住房贷款

    57070

    为本创新驱动,券商如何实现智能加速?

    合规始终是公司的首要核心竞争力,该券商不断推进全面风险管理体系建设,需要全方位提升主动合规控管理能力,进而提升风险管理精细化、智能化水平。 而由于合规处于企业核心竞争力的高度,原数据积累10年,数据量已超30TB。 非现场平台各项报表和查询生成时间逐渐拉长。夜间批量任务越来越慢,部分任务出现超时失败现象。 02 原合规数据库数据量巨大,原有的传统的备份手段难以实现数据的实时保护。 解决方案 沃趣科技以QData高性能数据库云平台作为数据库基础架构平台替换原传统“烟囱式”系统架构,承载合规核心数据库系统,助力业务处理效率大幅提升。 价值提升 1 通过QData数据库云平台大幅提升了系统的业务效率,日终调度业务从原十几个小时缩短至1.5小时,性能提升10倍以上。

    27110

    ML | 建模老司机的几点思考与总结

    ML」系列文章,主要是分享一下自己多年以来做金融的一些事一些情,当然也包括建模、机器学习、大数据等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步!

    29120

    模型–Odds含义

    发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/141728.html原文链接:https://javaforall.cn

    7120

    决策引擎经验

    一套完整的体系,在中,少不了决策引擎,今天就浅谈一下决策引擎。 一、优先级 决策引擎是一堆规则的集合,通过不同的分支、层层规则的递进关系进行运算。 系统的作用在于识别绝对与标识相对风险,如果是绝对,则整套的审核结果便将是“拒绝”。既然结果必然是“拒绝”,则没必要运行完所有的规则,而主要单条触发“拒绝”即可停止剩余规则的校验。 而一些通过对接外部三方征信的规则,需支出相关查询费用的,则靠后运行。此外,在外部三方征信的规则中,命中式收费的规则(如黑名单与反欺诈)又可以优先于每次查询式收费的规则(如征信报告)运行。 三、记录与统计 最终到底是“跑出来”的,所以,整个系统对所有不同规则的触发需进行有效的记录与统计,以便后期可支持数据分析与模型调整的相关工作。 具体的记录与统计内容,主要如下: 1、触发的具体规则 举例说明:通过两种不同的视角进行记录,一是用户与订单层面,记录其所触发的明细规则;二是规则层面,记录某条规则具体的触发率。

    11630

    建模整体流程

    确定建模目的 在信贷领域中建立模型是为了找出可能会逾期的客户,根据逾期的可能性和资金的松紧程度选择是否放贷。 在支付领域建立模型是为了找出可能存在非法经营的商户,保证商户没有违法经营。 确定好坏样本逻辑 在信贷领域中逾期大于x期(不同公司取值不同)的客户定义为坏客户(1),从未逾期的客户定义为好客户(0) 在支付领域中,有赌博、欺诈、套现、伪卡等行为的商户定义为坏商户(1)(具体根据模型要防的风险决定 特征工程 在领域一直都有这样一句话 “数据决定了机器学习的上限,而算法只是尽可能逼近这个上限”,这里的数据指的就是经过特征工程得到的数据。通俗的讲就是衍生变量去捕获风险客户。 模型上线 在支付领域如果模型验证没有问题,一般会上到线上,自动生成案例。在信贷中会模型搭配规则,判断申请贷款的人是通过放贷、拒绝放贷、还是转人工处理。 本文所讲的都是大致流程,没有深入展开分析,在之后的各期中会逐步展开这里所讲的每一小点,给所有需要从事模型的同学一点建议。 以上都是我在建模过程中的一点经验总结,有不正之处恳请指正!

    89220

    数据体系-简介

    早期传统金融的主要利用了信用属性强大的金融数据,一般采用20个维度左右的数据,利用评分来识别客户的还款能力和还款意愿。 信用相关程度强的数据维度大概在十个左右,包含年龄、职业、收入、学历、工作单位、借贷情况、房产,汽车、单位、还贷记录等;而互联网金融公司在利用大数据进行风的同时,会根据需求利用多维度数据来识别借款人风险 结合中国互联网发展,以及目前的征信监管要求,对可用数据及可用类数据做一个全面的梳理。 2.数据来源 2.1 数据应用逻辑 常见流程中,客户准入时提供的资信材料有限,业务机构数据体量不足,仅仅根据内部风险数据进行风险评估会非常片面,无法全面的把某位客户的风险情况,所以通常需要依赖于第三方供应商提供数据作风支撑 4.2 明确需求 建议:回顾第二节数据应用逻辑关于业务类型、风险类型、流程、风险画像等的介绍。

    1.6K64

    实时业务系统

    账号:垃圾注册、撞库、盗号等 交易:盗刷、恶意占用资源、篡改交易金额等 活动:薅羊毛 短信:短信轰炸 项目介绍 实时业务系统是分析风险事件,根据场景动态调整规则,实现自动精准预警风险的系统。 什么样的事件是有风险的,风险分析需要用到统计学,对异常用户的历史数据做统计分析,找出异于正常用户的特征 实时性,风险事件的分析必须毫秒级响应,有些场景下需要尽快拦截,能够给用户止损挽回损失 低误报,这需要人工经验 对各种场景风险阈值和评分的设置,需要长期不断的调整,所以灵活的规则引擎是很重要的 支持对历史数据的回溯,能够发现以前的风险,或许能够找到一些特征供参考 项目标签 轻量级,可扩展,高性能的Java实时业务系统 基于Spring boot构建,配置文件能少则少 使用drools规则引擎管理规则,原则上可以动态配置规则 使用redis、mongodb做计算和事件储存,历史事件支持水平扩展 原理 统计学 ; 扩展规则,针对需要解决的场景问题,添加特定规则,分值也应根据自身场景来调整。

    14510

    相关产品

    • 营销风控

      营销风控

      食品、饮料、酒类、日化等快消厂商的一物一码营销活动中,黑产会利用大量的小号、僵尸号码、甚至批量自动工具参与活动,给厂商造成损失。营销风控服务(Marketing Risk Management,MRM)通过独有的腾讯安全风控模型和 AI 关联算法,帮助您快速识别恶意请求,精准打击“羊毛党”,提升资金使用效率,还原数据真实性。

    相关资讯

    热门标签

    活动推荐

    扫码关注腾讯云开发者

    领取腾讯云代金券