【独家】征信专题:坐在大数据金山上的Equifax

接上期:上期我们介绍了征信三巨头背后的大佬——费埃哲公司。他们的评分标准已经成为了美国征信业的事实标准。国内很多公司包括宜信等都是基于这个评分模型进行二次开发的。这期我们想通过一个大公司的案例来看看,这种数据类型的公司是如何赚钱的。

作为美国三大征信所之一,Equifax(艾可飞)公司存储着所有美国成年人以及另外16个国家公民的财务数据,其中包括全球5亿个消费者和8100万家企业。这些信息可谓是五花八门:哪些人在共享同一电话号码或地址、牙齿治疗贷款的申请、杂志订阅、租赁历史记录、房地产资产、投资理财、购买零售商品、纳税申报单类型、婚姻状况、就业状况、水电费缴付、有线电视账户、犯罪记录、债务收入比、地址更改、机动车档案、邮政信箱、推断某人能否支付账单、预测某人的支付意向,与过去和潜在的欺诈犯罪有无关系等。

这些看起来杂乱无章的海量信息,经过交叉分析和索引处理后,变成26 PB的数据。这个数字已经超过了美国联邦调查局的调查数据仓库(据说是联邦调查局最庞大的数据存储库)的10亿份不重复文档。

新产品的推出

Equifax在过去几年中,相继推出了大批基于大数据的新产品,这些产品旨在实现两个目标:为4.6万家企业客户降低风险,以及促进营销。

其中一款新产品可以帮助企业应用分析技术避免不良客户。据了解,Equifax的开发人员在这款产品中结合消费者个人信用评分和水电费支付历史记录而建立新的分析模型。分析结果将帮银行决定,是否值得花时间去争取那个信用卡支付曾到期未付的客户。Equifax还有一款新产品可以用来实时监测信用报告查询的系统,以及时发现犯罪苗头。Equifax综合数据解决方案部门副总裁Keith Manthey说:“骗子发现有效的行骗手段后,就会迅速共享和使用。该系统可以对查询速度及其他因素进行评分来判断这项申请是否为骗子所为。”

2011年,Equifax收购了一家商业智能工具公司和工作流软件开发商。事实上,在过去的5年中,Equifax共斥资17亿美元收购了多家数据收集和技术公司。这与Equifax在成立之初50年,一直采用纸张分类账的做法大相迳庭。

新IT架构的支撑

对海量数据的分析挖掘工作需要付出大量的IT成本。以往,拥有大量数据的公司需要建立大型数据仓库,并在大规模并行处理系统上运行。Brooks表示,建立大型数据仓库所需硬件成本太高,另外关系型数据库的架构也阻碍了对非结构化数据的查询。因此,Equifax存储和检索数据的方式一反传统,它并没有将这项工作视做处理查询,而是将它视做交付内容,将数据分布在低成本服务器集群上,由IT部门开发专有的分布式检索技术来查找信息。

Brooks说:“由于我们对数据量、交易查询量和响应时间的要求都很高,因此,我们一直小心谨慎,以免盲目跟随行业标准的做法。业内的传统做法需要建设庞大而复杂的基础设施,但如果换个角度考虑,其实这些基础设施建设就变得没有必要。”

目前,Equifax的数据专家要花时间对从公共和私人来源整合而来的数据进行重复数据删除和清洁处理,但他们不会一味地要求一个消费者只有惟一的一份信息。“上下文更重要。”他说,“实际上,他们是对的。现在,我们更多地考虑观察结果,而不是所谓的事实。”

人成为挖掘的对象

挖掘宝贵信息的一个常用方法是,对数据集进行混合搭配,寻找其中关系。例如,单身女性的百货商店签账卡的信用额度是否表明了她们有租赁汽车的意向?这种看似不着边际的尝试也许为营销人员带来非常有用的结果。

益百利最近发现,使用社交媒体的成年人比其他互联网用户更愿意逛星巴克。因此,星巴克或与之竞争的咖啡店可能希望在Facebook上加大广告投放力度。

在Equifax看来,宝贵信息有时还来自高管的灵光乍现。2011年春,CNN报道了一则关于涉案价值达50万美元的信用卡欺诈的新闻。新闻称,两兄弟与贝弗利山一家牙科诊所的雇员密谋,捏造了数百名的病人信息。他们伪造病人姓名、社会保障号码及其他个人数据,然后由诊所雇员向假病人发放牙齿治疗贷款。之后,该雇员再将贷款和虚假支付记录上报给益百利,以Garnik Dumanov和Grisha Stpanov之类的姓名建立了信用历史记录。

这起案件激发了Webb的想象力,Equifax能不能识破这样的骗局?

Brooks、Manthey及其他同事进一步详细了解了这起欺诈案件,从Equifax的众多记录中调阅相关数据(不仅仅是信用报告)。然后,他们开始测试分析信息的新方法,以期获得他们已经知道属实的结果:比如,Stpanov之流不可能真有其人。

Brooks说:“正常人会在许多方面留下痕迹,但虚构的人不会。”拥有有效身份信息的人即便没有信用记录,通常也会因缴付话费或订阅杂志等原因出现在其他一些文件中。而虚构的人则会在申领到信贷额度后会“人间蒸发”。最终,这种逆向分析促成了新的欺诈检测工具,Equifax的安全团队可以与客户一起使用该检测工具。

一年多来,三大征信所接到了来自美国银行、富国银行及另外19家银行关于采用诸如此类虚假身份申请信用卡的查询请求,银行看到良好的信用评分后才予以审批。另外,移动运营商和汽车经销商在办理新手机账户和提交客户购车贷款前也都要先查询这三大征信所的消费者信用数据。

财务报告之外

在Webb看来,抵押贷款领域的新法规给Equifax带来了另一个机会。

2010年出台的《多德-弗兰克华尔街改革和消费者保护法案》要求金融机构对不良贷款负更大的责任。Webb表示,金融专家们评估抵押贷款风险时意识到,简单的信用评分无法为银行决定该不该批准为大额贷款提供足够信息。

Equifax迅速推出了未公开债务监测(Undisclosed Debt Monitoring)服务,这项服务用来监测借款人从抵押贷款获审批到截止日期这段时间内的主要支出情况。例如,借款人可能因在抵押贷款获批后办理汽车贷款,从而改变借款人的还款风险评估状况,这将超出银行为其抵押贷款交易而设定的条件。

此外,Equifax还将这种技术融入到了创收产品中,以适应完全不同的情况。比如,实时的身份验证有助于电信公司避免遭到欺诈。Equifax可以为电信公司证实用户是否确有其人,此前是否一直按时缴纳手机账单。经过这样的身份验证,电信公司就可以放心地将手机卖给用户。

电信公司还可以向Equifax购买市场营销服务。Equifax可以告诉电信公司,相应指定用户的财富评分是否够高,在夏季是否有开支很大的习惯,在使用社交媒体方面是否很积极。电信公司依此情况,可以采用向上销售手段,向用户推销售价更高的手机,如果用户随后又介绍了两个社交媒体朋友与电信公司签约,用户的数据服务方案还可以打折。

“当客户与商家接触时,这种向上销售的效果最好。”Webb介绍道,“但商家在几星期后给客户邮寄小册子,甚至几天后发电子邮件,销售效果都要差很多。”趁客户还在,实时的身份验证和“决策”服务可以让零售商、电信公司及其他商家成交更多、价值更高的单子。

现在Equifax的涉猎范围已经远远超出了金融领域,身份也绝不局限于一家征信所。如果病人和医务人员需要在网上向医院提交身份证明,可以使用该公司的身份验证技术,这项技术会提出一些问题,只有答题者本人知道答案。2011年,Equifax开始帮助美国国土安全部和美国公民及移民服务局核查移民的就业资格。

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2014-02-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏CIT极客

【极客资讯】快来看看极客界出了什么新鲜事!

40460
来自专栏镁客网

「镁客·请讲」超级队长王磊:做好线下实体店运营,从传统行业找到+VR

11900
来自专栏腾讯云安全的专栏

“准备一百万,或者你公司不要了”——揭秘某游戏公司遭DDoS勒索始末

“ 每天电话一响,最怕听到说服务器被DDoS了,只有做过运维或被DDoS攻击过的人才能明白DDoS的可怕之处。闻D色变在游戏行业毫不夸张,甚至游戏人自嘲,“没...

39420
来自专栏大数据文摘

D-News | 洲际旗下12家酒店遭大规模数据泄露 Snap收购以色列明星AR公司

16520
来自专栏安恒信息

“网络神探:白客比黑客更有挑战性

范渊两次登上黑帽大会讲台,为奥运、世博建“铜墙铁壁” 人物简介 范渊,1975年生于浙江,美国圣何塞加州州立大学计算机科学硕士,2007年回...

31240
来自专栏安恒信息

移动办公暗藏风险 企业高管需注意

对越来越多的上班族而言,工作和生活的界限正变得模糊。移动办公提升了效率,也暗藏极大风险。近日知名信息安全科技企业安恒公司在APT网络战攻击预警平台发布会上表示能...

369130
来自专栏黑白安全

欧洲议会要求全面审计 Facebook:评估个人数据安全性

北京时间10月26日上午消息,据美国科技媒体TechCrunch报道,在Facebook出现一系列数据泄露丑闻之后(包括此前“剑桥分析”事件),欧洲议会提出要对...

11160
来自专栏知晓程序

微信早报 | 西瓜足迹回应指控,有借鉴没抄袭;越南澄清禁用微信支付、支付宝

16620
来自专栏知晓程序

微信早报 | 微软第一款微信小程序正式发布;微信将管制「互骂群」;腾讯官方感谢 360

18640
来自专栏安恒信息

环球人物专访:“网络神探”——白客比黑客更有挑战性

范渊两次登上黑帽大会讲台,为奥运、世博建“铜墙铁壁” 人物简介 范渊,1975年生于浙江,美国圣何塞加州州立大学计算机科学硕士,2007年回国创...

36650

扫码关注云+社区

领取腾讯云代金券