大数据在P2P借贷上的四大要素

现在P2P借贷领域的许多人,包括我自己,都喜欢使用借贷平台提供的大数据来分析趋势和帮助自己更好地了解借款人,以及分析他们的行为,从而来控制我们在 P2P借贷市场上的风险。借贷平台的网络属性使得许多早期的零售投资者是以技术为导向,因此一直存在着一种误解就是,要想成为一名成功的投资者,你需要学 会了解并利用大数据。如果你愿意自学一些信贷和金融技术来帮助你在P2P借贷领域做出更好的投资决策,你就会知道事实并非如此,而且可谓是大错特错 大数据并不能解决所有问题,你需要了解在关于大数据在P2P借贷上的四大要素。 要素1:大数据只记录过去绩效 任何曾经从经纪人处卖出过(或曾打算卖出)互惠基金、股票、债券或则其他投资资产的人,都听说过或者接触过这个条款——过去的表现并不能预示未来 的结果。这是真的,它确实无法预测。那些我们从历史记录得到的重要信息,如支付历史、FICO信用得分和贷款清单上的不良信用者,都只是向我们展示了我们 的借款人的过去行为。他们是否有按时还贷的历史记录?这并不意味着他们将来就会按时清偿贷款,但的确,特别是在无重大变化发生时,如失业或者重大疾病等, 清偿的可能性会比较高。没有人知道未来会发生什么,我们需要记住的是历史记录无法预测未来,它只是过去的记录。 要素2:贷款池小且新 以Lending Club为例,它从2006建立至2012年11月发行了它的第一个10亿美元的贷款。到2013年5月(6个月后),他们成功发行了第二个10亿美元的 贷款。到2013年11月,即他们第一个10亿贷款发行一年后,他们发行了第三个10亿美元贷款,达到了30亿美元的总发行额。这意味着今年的5月至11 月之间,他们发行了另一个10亿美元的贷款。所有这些都是从Lend Academy 上的Lending Club月度交易量分析中得出的。这意味着所有贷款中,有2/3的贷款期限都不超过1年。有些人会说我们无法收集任何有意义的数据,但是许多人会同意,我 们能从历史记录中获取最有意义的数据,并分析出早期支付违约的可能性。如果我们能够获取所有数据,我们会发现,我们可以用作参考的长期数据贷款池是很小 的。 我们贷款资产组合面临最大的问题是早期支付违约,即前六个月以内的违约。我们建立了一个贷款期为六个月以上的20亿美元贷款数据库,用来查看哪些人延迟支付,以及哪些人早期违约了。而且,由于议定贷款的最新出现,造成获取那些有意义的数据十分困难。 要素3:大数据将那些相互影响的因素独立开来 数据的有效性十分重要,你可以研究在周二发放,且限定于FICO分数为750的CA借款人的债务重组贷款。大数据的一个好处是你可以使用它来研究 任何有意义或具有潜在意义的变量。我们在此讨论的一些变量包括FICO得分,不良借款信息,公共文件,所在州,房产,受雇年限等等。对我们而言利弊兼有。 好处是显而易见的,我们可以对这些我们认为重要的因素进行研究,来降低我们的风险。 问题 使用大数据研究所有的这些变量所存在的问题就是,它会孤立这些变量,正如如果我想通过公众文件来进行核实。起初这听起来这并不坏,甚至听起来是件 好事。问题是,这些因素中的一些是彼此相关的,孤立他们来进行研究是没有意义的,孤立他们会减弱这些变量的价值。例如,信用得分就取决于很多我们之前讨论 的因素,其中包括:最近支付记录、良借款人信息、公开呈报、信用调查、循环可用信贷和债务收入比等等。当我们通过信用评分筛选时,我们已经将这些因素考虑 进去了,因此将这些因素割裂开来看实属多余,甚至对质量筛选有害。因此,如果我们需要高的信用得分及无不良记录,同时,我们也知道无不良记录会提高信用得 分,那么我们也就是在重复计算这些因素,因而与其他信用相关的因素形成对立。 要素4:相互关系不是因果关系 科学家和研究者都深谙此道。也就是说两件事物相关并不意味着一件事物的发生会引起另一个事物的发生。举一个典型的例子:我关于通过所在州进行筛选 的主题。我们提到CA拥有最高的违约率。它也拥有到目前为止最多的贷款数量,因此,如果你拒绝CA的贷款,你将会明显地减少你的可利用贷款池。这也意味着 所有CA的贷款都会因为筛选标准而被排除在外。无疑是一棒子打沉一船人。信用得分就是个很好的例子。自然,公开呈报会降低借款人的信用得分,而且确实是这 样。然而,这种影响无处不在,可大可小,取决于类别和时间。一个很小的来自五年前的信息同对一个六个月前的借款人的判断是不同的,虽然他们都是公开呈报。 前者,由于是在六个月内,因此很明显地影响了借款人的信用得分,而后者,对分数只有很小的影响,正如同我们对借款人偿付能力的看法是一样的。 结论 你无需成为一个擅长于操纵数据的人,或许你不是这类人更好。因为,当我们考虑所有那些可利用的大数据时,所有人都会很容易掉入陷阱。当我们在进行 数据分析时,如果能够记得所有这些因素:大数据只是对过去的记录而不具备预测性,而我们的贷款池小且新,大数据将相互依存的变量孤立开来,相互关系不意味 着因果关系,我们就会在P2P借贷领域领先于其他投资者一步,并且非常清楚我们贷款组合所面临的风险。

译者:马骏 来源:p2plendingexpert

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2014-01-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏华章科技

我们都是大数据时代的海狸

1973年,AlexPentland还只是个大三学生,他到美国国家宇航局环境研究所实习,做一名电脑程序员。分给他的一项任务是开发一个利用人造卫星,从外太空数清加...

1124
来自专栏老九学堂

编程学习不“瞎忙”,8张图测试你的努力有没有效!

瞎忙族是没有目标和方向的忙碌,每天好像做了很多事,好像忙得团团转,焦头烂额,却又没有一点效果。

1413
来自专栏精讲JAVA

你给我月薪三千,我凭什么给你干出八千的工作量

那年我刚毕业,幸运的面上了一家软件公司,工资三千,二线城市,勉强生活,但是老板人很热情,我来的时候还专门把我叫到办公室,对我说,我非常喜欢年轻人,...

1022
来自专栏新智元

田渊栋:博士五年之后五年的总结(续)

从小到大,常听长辈们说:“好好读书,好好学习,长大了才有好工作。”,似乎只要努力十几年,接下来就如童话般有一个美好的结局。但等我们真的到了而立之年,真的去找了一...

1425
来自专栏数据猿

【案例】国家信息中心:国家公共资源交易服务平台一期工程决策支持服务系统定制项目

国家公共资源交易服务平台一期工程决策支持服务系统定制项目采用先进的大数据框架和SOA架构相结合方式实现,提供四个层面的应用功能:数据仓库层、数据分析层、主题数据...

3718
来自专栏狮乐园

我为什么选择离开了Liferay

距离离开Liferay还剩下用指头可以数出来的日子了,心中不禁感慨万千。这一个月除了做一些交接工作和下一份工作的准备意外,剩下的时间基本都在思考在Liferay...

2.1K3
来自专栏PPV课数据科学社区

【掌握】如何长时间高效学习?

建立外部大脑(知识管理) 一.重点笔记 我用的是OneNote,配合斯巴达浏览器(可以直接在网页上书写,标注),当然用别的也一样,方便顺手就好,毕竟不是个讨论工...

3498
来自专栏小樱的经验随笔

给信息安全爱好者的一封信

我从华为回来以后,陆续收到了很多封来信,其中提到最多的就是该如何学习信息安全这一领域的东西。我相信很多朋友无非就是对电影里面的黑客几行代码入侵政府网站的场景十分...

1692
来自专栏腾讯社交用户体验设计

天天P图"前世青年照”设计故事

1201
来自专栏zhisheng

感悟《疯狂的程序员》

本文来自群友:Octopus恋 对《疯狂的程序员》感悟 ---- 1、你不会造车,但可以去卖车;你不会下蛋,但可以炒蛋炒饭卖。而且卖车的肯定比造车的更会卖车,炒...

39510

扫码关注云+社区

领取腾讯云代金券