之前有位读者朋友说有空介绍一下自动分箱的方法,这个确实在我们实际建模过程前是需要解决的一个问题,简单来说就是把连续变量通过分箱的方式转换为类别变量。关于这个话题,我也借着这个主题来系统的梳理总结一下几点:为什么要分箱?不分箱可以入模型吗?自动分箱的常用方法有哪些?评估分箱效果好坏的方法有哪些? 如果篇幅允许,就顺便把实现的Python代码也分享下,如果太长了就另外起一篇文章来讲。因此,本篇文章主要从下面几个模块来展开说说。
*本文作者:mcvoodoo,本文属 FreeBuf 原创奖励计划,未经许可禁止转载。 互联网金融这些年热火朝天,稍大一点的集团旗下都有互金业务,甚至一些根本和金融不搭边的公司,也搞起了互联网金融,也号称大数据,AI 智能普惠金融。一时间市场上鱼龙混杂,大干快上,而实际业务风控则呵呵了。 互金的一个挡箭牌是:利润超过逾期,我就是赚的。然而是不是赚的,还要看一个周期性的结果,这个月赚不代表什么,下个月几笔逾期就足以让你打回原形。于是,就有人开始利用互金公司的各种漏洞赚钱,本文介绍一些手法,供各位注意防(xue
虽然说当下几乎各行各业都在拥抱人工智能,但你是否知道人工智能曾经有过一段时间被忽视,且只能以数据挖掘、机器学习等其他称呼来进行代替? 近日由网易科技和网易智能主办的第七季 “网易开物沙龙” 在浙江大学
这个对于广告平台很有意义,我们不仅把用户按照性别、年龄、地理位置等维度进行用户细分,还可以通过用户行为对用户进行分类。
信贷业务,是一种基于信用的贷款业务,属于金融机构的资产性业务。我接触的产品形态,小额信贷、大额信贷、消费贷、小微企业贷、信用卡循环授信等。
风控,大家心目中的风控是什么?我们先来点传统的解释 首先了解两个概念:风险管理和风险控制。 风险管理:是指如何在项目或者企业在一定的风险的环境里,把风险减至最低的管理过程。 它的基本程序包括风险识别、风险估测、风险评价、风险控制和风险管理效果评价等环节。 风险控制:是指风险管理者采取各种措施和方法,消灭或减少风险事件发生的各种可能性,或者减少风险事件发生时造成的损失。所以其实风险控制是风险管理中的一个环节。 下面是对前期在群内收集到的问题的解答。 1. 目前最常用的风控模型是哪些? 风控模型:常用于担保公司
摘要:在互联网金融行业,不少人可能这样觉得:认为只要数据够“大”,就能有最牛逼的风控体系和行业最低的坏账率。
在近日举办的数字中国峰会展会上,蚂蚁集团全图风控技术负责人王兴驰发表现场演讲,首次公开分享蚂蚁全图风控技术架构。 图技术正成为风控市场的关注重点。把图技术应用于风控领域,可以构建风险关系网络,实现对风险全链路的、关系视角的刻画,从而解决传统风控碎片化的问题。近期IDC发布《中国金融行业反欺诈市场研究》报告指出,图技术的应用将成为未来的风控建设重点之一,来自蚂蚁集团的业内首个基于图架构的风控体系,入选为IDC应用图计算技术的典型案例。 据了解,全图风控是蚂蚁自研的智能风控技术体系“IMAGE”的组成部分,该体
如果一个小偷,用伪基站发送钓鱼短信,费尽心机偷了用户的支付宝密码,结果却死活拿不走里面的钱,这看得见吃不着的感受,该有多心塞呀!但,就是有这么憋屈的小偷。 事件回放: 广州用户黄XX,6月7日接到一条10086的短信(小偷通过伪基站发送的钓鱼短信),他点击了短信中的链接,依据指示先后输入了自己的身份证信息和银行卡信息,同时,手机中了木马病毒。 各类信息+木马,让小偷登陆了黄某的支付宝,并修改了密码。随后,小偷进入淘宝,下单购买一台iphone5。 就在小偷得意之时,他发现自己就是不能支付成功,而且很快,这
鉴于全球各国都把隐私保护提上了日程,拉高了Level ,企业对于这一块的工作也越来越重视了。
某日,一朋友深夜微信上问我,如果打码平台盯上了你,你该咋整? 政治正确的回答方式是:加强风控策略,多维度判断使用者意图,减低对验证码的依赖。 显然这不是我或者朋友真正想要的,现在不少企业面对打码平台有时候束手无策,只能放弃对验证码的依赖,我觉着有点可惜。 我们先来回顾一下,验证码的学名是啥? 图灵测试。 图灵测试的目的是为了区分人与机器,而打码平台的加入使得这个过程立即无效——打码平台上活跃的对象还真是人。 但这样就没辙了么? No。这“人”与“人”之间是有差别的。我们仔细想想,我们加入验证码的目的其实除
2020 年如果让我推荐一款大众向的数据采集软件,那一定是后裔采集器[1]了。和我之前推荐的 web scraper 相比,如果说 web scraper 是小而精的瑞士军刀,那后裔采集器就是大而全的重型武器,基本上可以解决所有的数据爬取问题。
在数字营销时代,广告的曝光形态、载体、频次、受众都发生了巨大的变化。盘踞在广告行业中的黑灰产越来越多的运用技术手段伪造虚假流量,以欺诈手段攫取收益,不但影响正常的广告投放曝光效果,也会导致广告主的判断失真,无法感知到消费者的真实想法。
天创信用总经理李文贤:金融科技加速金融变革
蚂蚁金服风控总监王黎强:智能风控助力新金融
广州用户黄XX,6月7日接到一条10086的短信(小偷通过伪基站发送的钓鱼短信),他点击了短信中的链接,依据指示先后输入了自己的身份证信息和银行卡信息,同时,手机中了木马病毒。
在经历过之前的黑色星期五、双十一和双十二等大促活动中,我们有些网友站长会选择海外主机商或者域名,但是我们有在注册购买海外主机的时候有出现风控和欺诈订单,我们无法进行注册和付款,或者是已经付款之后的被审核将会被退款和账户暂停,这个到底是什么问题引起的呢?
数据猿导读 在目前的互联网金融市场上,有60%的损失来自于欺诈,这60%里面又有80%—90%属于集团欺诈。因此,风险控制就成为互联网金融发展的必要基础。而在实施风控过程中,其核心在于如何通过大数据以
包银消费金融总经理助理汤向军:消费金融行业的大数据
曾经很热的“互联网金融”“P2P”等词汇,正在被 Fintech(金融科技,Finance和Technology的合成词)代替,金融领域开始从概念回归技术的位置。
一个普遍的看法是,机器学习等人工智能技术会最先在金融领域落地。金融行业是最早实现信息化的行业,有丰富的数据积累,且对于用技术提升效率有更多的需求。 现在也有越来越多的公司开始使用机器学习技术实现自动风险管理与放贷。但机器学习在风控中的作用究竟如何,有哪些关键技术,其优势与缺点又有哪些呢?本期硬创公开课,雷锋网邀请百融金服风险总监郑宏洲,来讲讲机器学习与大数据风控的那些事。 嘉宾介绍: 郑宏洲,百融金服风险总监。国内商业银行模型团队多年管理经验,专注于大数据机器学习、信贷风险策略、模型评分管理等风控领域。从事
“围剿”黑产,揭秘O2O、电商和互联网金融的大数据风控之道
一、当前风控模式现状 近年来,信用风险管理发展呈现出数据化、模型化、系统化、自动化和智能化的特点。传统的人工专家经验正逐步被模型与算法替代。 因此,科技较为领先的金融服务公司会选择采用模型方式完成对借款人的自动评估与审批。目前,对于信贷审核来说主要基于的风控模式为IPC、信贷工厂、大数据三种,每一种都有自己不同的侧重点。 二、最核心的风控模式分类 1.IPC模式 IPC模式起源于德国邮储银行,该模式重视实地调查和信息验证,主要通过对客户经理调查走访、信息交叉验证等方面。需要对客户经理进行至少2个月以上的专业技术培训,提升客户经理辨别虚假信息能力和编制财务报表的技能,从而防范信用风险。 IPC公司信贷技术的核心,是评估客户偿还贷款的能力。主要包括三个部分:一是考察借款人偿还贷款的能力,二是衡量借款人偿还贷款的意愿,三是银行内部操作风险的控制。每个部分,IPC都进行了针对性的设计。 这种模式主要运用于数据缺失、不具备财务管理环境、银行流水不完整,信用记录空白等的小微企业,其中,信贷员负责整个过程,从接受客户的申请到信用检查、现场信用、风险评估再到匹配贷款、付款催收和逾期付款。对信贷员的专业技能要求较高,信贷员对贷款全流程把关,一定程度上确保了项目的真实性。但又因为是以信贷员为核心,以信贷员的判断为依据,有一定的操作风险与道德风险。 2.信贷工厂模式 信贷工厂模式是新加坡淡马锡控股公司(Temasek Holdings)为解决小微企业信贷流程的弊端,推出了一种改善小微企业信贷流程的“信贷工厂”模式,“信贷工厂”意指银行像工厂标准化制造产品一样对信贷进行批量处理。 具体而言,就是银行对中小企业贷款的设计、申报、审批、发放、风控等业务按照“流水线”作业方式进行批量操作。在信贷工厂模式下,信贷审批发放首先要做到标准化,每个流程都有确定的人员分工,如客户经理、审批人员和贷后监督人员专业化分工。并且为了监控风险采用产业链调查方法,从不同角度对借贷企业进行交叉印证。 信贷工厂模式的特点是效率高,可以进行量化审核。过程之间环环相扣,对每个环节都有专人把控具体的把控。正因为这样,意味着需要消耗大量的人力成本,每个流程都需要对口的人员做支撑。 3.大数据模式 大数据风控模式是指通过对海量的、多样化的、实时的、有价值的数据进行采集、整理、分析和挖掘,并运用大数据技术重新设计征信评价模型算法,多维度刻画信用主体的“画像”,向信息使用者呈现信用主体的违约率和信用状况。 大数据模式是基于互联网的兴起,该模式利用互联网数据的连通性,对触及到的风险的数据进行筛选,大大减少了人工审核的时间成本,同时也保证了数据结果的真实性。 三、P2P公司个人信贷评分卡模型 我们先讨论下如何从实际业务出发,以怎样的开发流程才能建立一个有效、有用、有价值的模型,希望读后能给你一定的启发。
随着云计算技术的逐日发展,现在云服务器云硬盘这些云产品也正在成为网络产品中的主流。比起普通的服务器以及硬盘,云产品拥有更高的性能以及更优惠的价值,并且功能更加的强大和丰富,但是很多人对于云硬盘以及云服务器的支持并不太了解,现在就来了解一下云硬盘备份是什么意思。
“所见即所得”原则我记得在之前的文章中就提到过,但是没有详细说明。最近在体验一些产品时,发现很多交互设计上的坑都可以归纳到“所见非所得”上。
中国已到数字化革命阶段!如何把数据大变成大数据,如何把大数据变成数字产业经济已经成为一轮科技革命,那么最近有不少的做大数据的公司被查,又是为何?
域名是建立网站的核心,也是一个网站的标志,用于标记在网络当中网站的位置。而如何的申请域名呢,需要找到域名的服务商进行注册,如果是收费的域名通常会比较短,而且字母明晰不会有太多字符,域名申请可以自行完成也可以委托网络公司代为申请。域名注册通常会有使用时间,除非是一些大型企业一样买断域名,否则就会出现域名过期。域名过期了是什么意思,就是到了合约的服务期限之后,域名注册的企业未进行续费,导致域名无法正常使用。
目前互联网行业也因为云技术的逐步成熟而出现了一次革新,出现了分布式配置中心等一系列的新概念,不少中小型企业都开始采用分布式配置中心作为公司的核心,就连一些比较大型的互联网公司也开始逐步接受分布式配置中心,那么分布式配置中心是什么意思呢?下面为大家简单介绍分布式配置中心是什么意思?
微赞是一家专注微信生态的企业级直播营销服务提供商,其核心产品“微赞直播”集引流获客、交易变现、数据分析为综合一体,能够帮助客户开展在线内容营销。为提供客户更好的直播服务,微赞与腾讯安全展开合作,凭借微赞在私域营销领域的多年经验,腾讯安全在风控领域的强大技术能力,共同打造全场景、全行业直播解决方案,助力企业安全营销。
网页是网络的基础,很多操作都需要通过网站来进行,但是有时候打开某个网页,却会显示域名重定向,一些没有经验的人并不知道域名重定向是什么意思。下面来为大家介绍一下域名重定向是什么意思,以及域名重定向应该怎么处理?
伴随着近期信贷业务的新一波调整,银行的风控能力成为重要的一个考核标准,资金方做“甩手掌柜”的好日子一去不复返了。对于大银行来说建设自主风控能力相对容易,他们不缺用户,不缺数据,有足够的空间和时间推新产品、小步快跑做实验,模型先跑起来,慢慢完善,自主风控能力就算有了。
本文作者:蹲在角落数蝈蝈 大数据风控目前应该是前沿技术在金融领域的最成熟应用,相对于智能投顾、区块链等还在初期的金融科技应用,大数据风控目前已经在业界逐步普及,从BATJ这样的大企业,到交易规模比较大的网贷平台,再到做现金贷、消费金融的创业公司,都在通过大数据风控技术来控制贷款规模扩张中的风险。 现在提到互联网金融、Fintech,首先想到的就是大数据风控。随着网易北斗大数据风控平台的上线,业内包括BAT、网易在内的主要国内互联网巨头都开始在大数据和金融衍生应用领域进入了金融科技化阶段,和互联网金融第一阶
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/113498.html原文链接:https://javaforall.cn
网络技术的提高也带来了新事物的产生,伴随着新的网络技术出现,出现了一大批人们没有见过的新概念,比如堡垒机,目前很多公司或者企业都会使用堡垒机进行企业管理,但同样有很多人并不知道堡垒机是什么意思,想要正确发挥堡垒机的作用,必须要知道堡垒机是什么意思,所以下面为大家简单介绍堡垒机的意思以及使用堡垒机的原因。
域名一词频繁在大众视野出现,一些创业公司想要拥有自己的网站,必定需要购买自己域名,而且一个好听易记的域名也深受大众喜爱,人们在登录网站时只需输入域名后便会跳出一系列想要查找的信息,那么具体来说域名是什么意思呢?作用有哪些?今天就来具体讲解,希望对大家有所帮助。
在我们浏览相关网页的时候,其实并不了解网页到底是如何构成的,这背后有一个非常重要的因素,那就是域名。如果想要创立属于自己的网站,那么一定避免不了要设定二级域名。很多人都不知道二级域名是什么意思以及在什么时候使用二级域名会比较合适呢?接下来就带你一起了解一下。
网络在人们生活中日益普及,但网络的速度除了和用户接入的宽带速度有关,还有内容距离用户的物理距离有直接的关系。因此目前为了解决数据传输效率的问题,运营商通常都会建立分发内容系统。那么cdn节点是什么意思?Cdn节点的作用是什么呢?
域名虽然只是几个简单的字母,但不同的域名其实有着不同的影响力和其独特的含义,目前在世界上使用比较多的域名有COM、cn、org等等,其中con、cn等域名都非常受欢迎。那么org域名是什么意思?Org域名有哪些优势呢?
很多企业在制作企业主页时,往往都将这件事想得过于简单,认为只要制作出网站将其连接到互联网上就可以让其他人访问了,但其实网站建设还需要空间来存放需要域名来给访问者使用,那么空间域名费是什么意思?什么样的空间域名价格便宜呢?
做网站的人应该都知道域名的意思,域名的就好比是家门口中的那块门牌号,每家每户都有独立无二的门牌号。域名也是一个意思,都是全世界独立无二的域名,接通着ip地址,让人们通过域名的方式进行访问网站里面的内容。域名也有顶级之分,下面就给大家讲讲顶级域名是什么意思?
现在社会处于互联网飞速发展的时代,互联网技术的不断发展也让现在社会中信息传播速度越来越快,每个人随时随地都可以使用手机或者电脑访问互联网,在互联网上面会接触到各种各样的数据,无论是对于个人还是企业来说数据量都是非常庞大的,庞大的数据保存就是非常麻烦的问题,数据除了可以保存在各种存储硬件上面之外,现在还引入了数据湖的概念,那么数据湖是什么意思?数据湖有哪些价值?
CP是什么意思呢?相信大多站长并不清楚ICP是什么意思,就算是网站已经备案的也不了解ICP到底为何物。大家往往搞不清楚ICP备案和ICP证之间的区别。今天小编为大家讲解一下ICP是什么意思,ICP
昨天,网约车家族又迎来了一个新成员 —— 如祺出行。 这个由广汽与腾讯等合作方联手打造的共享出行产品,将在广州正式推出市场,以粤港澳大湾区为核心逐步向全国推广,计划一年内开拓5个城市,投放近一万辆新能源车型。 腾讯拿出了用户服务和营销、车联网和平台运营、地图和云服务、生态服务和安全五大核心能力,支持如祺出行。安全能力作为其他四大能力的基石,对出行平台的业务发展至关重要。腾讯安全在如祺出行上也拿出了一整套的解决方案,涵盖安全咨询、应用安全、风控安全,从战略视角帮助如祺出行构建全面的安全体系。 那么
在一台电脑中拥有很多种类型的软件,不同软件拥有不同的功能和作用,其中有的软件可以为大家提供视频服务并播放相应的声音,这种软件一般被称为音视频引擎,音视频引擎在目前有着较为广泛的使用,所以下面为大家简单介绍音视频引擎是什么意思以及音视频引擎异常有哪些原因。
本文作者:蹲在角落数蝈蝈 大数据风控目前应该是前沿技术在金融领域的最成熟应用,相对于智能投顾、区块链等还在初期的金融科技应用,大数据风控目前已经在业界逐步普及,从BATJ这样的大企业,到交易规模比较大的网贷平台,再到做现金贷、消费金融的创业公司,都在通过大数据风控技术来控制贷款规模扩张中的风险。 现在提到互联网金融、Fintech,首先想到的就是大数据风控。随着网易北斗大数据风控平台的上线,业内包括BAT、网易在内的主要国内互联网巨头都开始在大数据和金融衍生应用领域进入了金融科技化阶段,和互联网金融第一
我相信有很多朋友,还不太理解域名解析是什么意思,但是或多或少都会对域名和IP地址有所了解。域名解析的存在也自然是与这两样名词有关。可以说,域名解析在我们平时的日常使用互联网的过程中占据了很重要的地位。没有这项功能的话,我们将无法使用域名进行访问IP地址网站。那么如此重要的功能,该如何进行使用呢。
随着互联网技术的不断成熟,越来越多的公司工作时间会使用到电脑,每个电脑因为是由不同员工使用的,所以在管理的过程中就会出现各种问题,同一家公司内部很多电脑使用的账号都是同一个,也有很多公司会在同一个账号开通多台电脑同时使用的权限,虽然员工使用起来方便的,但是对于运维工作人员来说就会带来很多麻烦,所以现在很多公司都会使用运维审计堡垒机,那么运维审计堡垒机是什么意思?运维审计堡垒机该如何选择?
普通人平时使用计算机需要的计算能力是很小的,最多就是玩玩游戏或者进行办公,这些操作需要的数据运算并不多,而对于一些大型公司或者高新技术行业来说,普通的计算机是无法满足使用需求的,所以服务器就受到了大量的关注,服务器是管理计算机资源的,拥有更为强大的运算能力,也因为需求不同而分为了多种服务器种类,vps服务器就是现在非常受欢迎的一种,那么vps服务器是什么意思?vps服务器和云服务器有什么区别?
谈一下你最擅长的开发环境 (OS, Editor, Browsers, Tools etc.)
领取专属 10元无门槛券
手把手带您无忧上云