专栏首页大数据文摘CapOne:一直在做随机试验

CapOne:一直在做随机试验

真正让CapOne卓然领先的是它真的愿意去做实验。CapOne不满足于对客户行为的历史数据分析,而是通过做随机试验主动参与到市场当中。

2006年,CapOne做了28 000多个实验——28 000个关于新产品、新广告策略以及新合同条款的实验。在信封上印“此优惠有时间限制”或者“新开账户利率2.9%”,哪个更有效呢?CapOne把潜在客户分为两类,看哪种方法的成功率更高一些。

这看起来挺简单。然而,通过计算机程序做抛硬币实验,把正面朝上的次数和背面朝上的次数区别对待,这是大数据分析最强大的技术之一所隐含的核心思想。

如果仅看历史数据,很难弄清楚因果关系。挖掘历史数据,如果想搞明白化学疗法是不是比放射疗法更有效,就必须控制其他所有因素,比如病人的特点、环境等可能影响结果的所有因素。但是,大型随机研究不需要控制这些因素。我们不需要控制住病人是否吸烟或者是否得过中风,我们可以相信对大量数据随机划分后,每个治疗组吸烟病人的比重都相同。

样本大小至关重要。如果样本足够大,那么我们就可以非常确定正面朝上的组数和背面朝上的组数在统计意义上相等。然后,如果我们干预正面朝上组,那么就可以衡量干预的净效应。大数据天才们称之为“干预效果”。这就是数据分析的因果关系圣杯:随机划分数据使这两个组在其他所有方面都相同,然后我们就可以确信这两组结果的任意变化都是由不同的干预引起的。

CapOne长期以来一直在做随机试验。追溯到1995年,CapOne做过一个更大型的实验,生成了600 000个潜在客户的信件列表。CapOne把这些客户分为100 000人一组,给每组寄出的优惠利率的优惠幅度和优惠期限不同。这样,随机试验帮助CapOne得到了两类数据。第一类数据是CapOne最初通过计算机拋硬币实验产生的数据,它用这类数据来决定是否该把某个潜在客户划分到某个组中。更重要的是第二类新数据,即不同客户组的反馈,这类数据只有人为干预才会产生。比较统计上相似的客户组的反馈率,CapOne就可以看出不同优惠的效果。CapOne通过这个大规模的随机研究得知,提供6个月4.9%的优惠利率比提供12个月7.9%的优惠利率要更赚钱。

多年来,学术界一直在医疗及其他领域进行随机试验。但一大变化是,企业界也在依赖随机试验重新制定公司决策。他们能看到什么最管用,并马上改变公司策略。如果学术界发表了一篇文章称在篮球里刮胡子有益,就不会有什么改变。但是如果企业投入大量资金做随机试验,他们这么做是希望用实验结果来指导决策。

其他企业也开始这么做了。CreditIndemnity是南非最大的小额信贷银行之一,全国有150多家分支银行。2004年,Credit Indemnity利用随机试验来推销其“现金贷款”业务。与美国的“工资日贷款”类似,现金贷款也是针对“穷忙族”的短期、高利率贷款。这种贷款在南非市场广阔,每时每刻都有高达660万人借款。一般来说,每笔贷款只有1 000兰特(150美元),大约是借款人月收入的1/3。

Credit Indemnity给老客户寄出50 000多封直邮邀约。跟CapOne的邮件类似,这些邀约提供的利率也是从3.25%到11.75%不等。作为经济学家,令我感到欣慰的是,Credit Indemnity的实验表明贷款利率越低,需求越大。

然而,不仅只有利率。这个实验真正让人感兴趣的是,Credit Indemnity还同时对邀约的其他方面也做了随机干预。这使得Credit Indemnity了解到,只要在邀约信封的角上加上一张微笑女孩的图片,对于男性客户反馈率的提升效果就与降低4.5%的利率一样。Credit Indemnity还发现:在发出邀约信前一周,让营销调研公司致电客户并只是问这样的问题——“您是否介意告诉我们,你预计在未来几个月是否会有大笔开支,如修缮房屋、交学费、买电器、重要仪式(如结婚),或者偿还大笔借款?”——效果会更好。

谈一下建议的威力吧。为客户准备一张让人身心愉悦的图片,或者为他们考虑可能需要贷款的情况,这些非市场的行为就大大提高了客户接受邀约的概率。

我们怎么知道高反馈率是因为图片或电话的缘故?答案又是抛硬币。在50 000个人中随机寄发邮件,使得平均来说看到图片和没看到图片的人在其他所有方面应该都相同。因此,两组客户平均反馈率的任何差异一定是由干预引起的。

当然,随机并不意味着信封上有图片和没有图片的客户每个人都一模一样。如果考察收到有图片邀约的客户身高的话,可能会看到钟形曲线分布。重点在于,对于收到没有图片邀约的客户来说,我们也可以观察到同样的钟形曲线。由于随着样本数的增加,两组客户的分布会越来越相近,那么我们可以把不同客户组的平均反馈率的差异归因于干预的差异。

在实验室做实验时,研究人员会认真控制一切因素,以期产生除了被测因素以外其他条件都相同的对比组数据。在实验室外做实验时,有时不可能产生所有相关方面都相同的配对数据。企业可以通过随机选择来生成数据,尽管这些数据并非完全是配对数据,但随机选择可以生成配对分布。因此,随机选择可以使大数据天才进行等价的控制实验,而不必像实验室一样匹配,也不必控制数十个甚至数百个可能的干扰变量。

随机营销试验对于利润提升的意义非常明显。为什么不附上一张图片,而非要把利率降低5%呢?Credit Indemnity得知此项研究结果时,他们正打算那么做。但是实验结果分析后不久,这家银行就被收购了。新银行不仅停止了今后的所有实验,而且裁减了Credit Indemnity的大量员工——包括那些曾极力主张实验的人。极具讽刺意义的是,这些员工中有些人记住了随机试验的经验,现在在Credit Indemnity的竞争对手那里找到了新工作。

摘自:《大数据思维与决策》

图书简介:

《大数据思维与决策》是大数据时代的奠基之作,耶鲁大学计量经济学家伊恩·艾瑞斯早在20世纪末就洞察到大数据浪潮的到来。本书通过讲述各个领域有关大数据分析与决策的经典案例,为读者解答了一系列关系到现在与未来的问题,如为什么谷歌和亚马逊比你还了解你自己的喜好、医生如何利用数据分析做出正确诊断、教师是否要摒弃自身创造性为孩子提供精确有效的教育指导,以及政府、法院如何在推动信息公开的同时制定出有益于未来的制度和法案等。希望读者在阅读后,可以迅速在信息变革中把握机遇,充分利用大数据分析做出优质决策。

出版社: 人民邮电出版社; 第1版 (2014年10月1日)

平装: 212页

作者简介

伊恩•艾瑞斯(Ian Ayres) 计量经济学家、律师,耶鲁大学法学院和管理学院教授,stickK.com网站的创始人,《法律、经济学和组织机构期刊》(Journal of Law, Economics, and Organization)编辑,曾著有11本书,发表过100篇文章。他是《福布斯》杂志的专栏作家,著名公共广播节目《Marketplace》的时事评论员,是《纽约时报》“魔鬼经济学”博客的专栏作家之一。 其著作《Insincere Promises: The Law of Misrepresented Intent》获得了由美国艺术与科学学院颁发的Scribes图书奖。他成就卓著、名声斐然,曾受到《黄金时间实况》、《奥普拉脱口秀》、《早安美国》节目以及《时代周刊》《Vogue》等杂志的采访,可以说伊恩•艾瑞斯是那一代人里成就最多、文章观点被引用最多、名气最大的法学教授。

目录

第1章 数据天才的时代 1 棒球界的奥利·阿什菲尔特 8 酒后吐真言 11 我为什么写此书 15 本书框架 18 第2章 谁在替你思考 19 eHarmony:大数据帮你找到另一半 24 用数据分析挑选职位应聘者、细分客户 29 比起消费者自己,企业知道的更多 33 消费者的反击 35 预测有多准确 38 Google:个性化数据挖掘 39 牵连效应 40 寻找“神秘数字”,杜绝欺诈 42 第3章 抛硬币创建数据 45 CapOne的掷色子试验 49 你正在浏览的网页是随机选择的吗 52 谁更有用,更有创造力 56 随机选择的作用仅仅是促进营销吗 57 别做白日梦,主动参与创建新数据 59 第4章 得数据者得天下 63 花钱是为了省钱 65 真正可以检验想法的“实验室” 68 时刻关注机会 69 充满机会的世界 72 第5章 大数据颠覆传统医疗 79 医疗信息数字化:对误诊说不 82 打破“医学神话” 86 搜索:超级大数据的最佳伙伴 90 数据决策的成功崛起 93 第6章 专家与大数据天才的王者之争 101 友好的跨学科竞赛 103 一本“引发纷扰的小书” 108 要有数据支持,不能“画饼充饥” 109 枪和游泳池,哪个更危险 111 有趣的测验——预测正确率区间 111 晃过的可乐是不是会喷出来 113 大数据天才与专家能和平共处吗 115 避免往冰激凌上抹烤肉酱 116 给“断腿”事件找到安全出口 120 新型大数据天才的转变 122 第7章 大数据天才的崛起 127 数字化生活 129 大数据交易 133 走出“数据竖井” 134 大数据天才告诉你,为什么是现在 137 打造“神经元网络”的超级大数据天才 139 “我们不拍烂电影” 142 打赢“书名大战” 147 无处不在的“聪明的灰尘” 151 第8章 谁将是受损者 153 小山羊能阻止偷车贼吗 155 教育界的激烈论战 158 我是谁,摆设吗 161 “小山羊”的反击 162 让人肃然起敬的“摆设” 164 你会从大数据天才那里买二手车吗 167 Epagogix的烦恼 168 当心大数据天才的礼物 171 正视大数据分析的歧视 172 没有隐私——忘了它 173 谁是约翰·洛特(John Lott) 178 天才犯错了该怎么办 181 第9章 大数据思维与决策的美好未来 189 和安娜一起思考 191 未来的女人/男人 193 你了解教授给学生打分的习惯吗 198 可能的群体领袖 199 男性和女性的智商对决 201 帮助新手妈妈生出聪明的宝宝 204 时刻关注女性健康 208 在大数据时代安居乐业 210

大数据文摘,WeMedia自媒体联盟成员之一

本文分享自微信公众号 - 大数据文摘(BigDataDigest)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2015-01-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 德勤:大数据时代下的新商务战略

    大数据文摘
  • 教育部最新:283所高校获批数据科学与大数据专业(附完整名单+公益计划)

    大数据文摘
  • 重磅:大数据与开放数据的政策框架

    大数据文摘
  • elasticsearch2.3.1 集群安装

        ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elastic...

    尚浩宇
  • 编写高性能HTML网页应用

    你怎么能提高网页性能?   大多数开发者会通过JavaScript和图片来优化,通过服务器配置,压缩文件和合并文件 - 甚至调整CSS(合并小图片)。   可...

    用户1667431
  • Web前端:浅析“HTML+CSS的基本应用”

    Hyper Text Markup Language,简称HTML,超文本标记语言,因页面中可以包含图片、链接、音乐、程序等非文本元素,所以称为超文本。 ? H...

    企鹅号小编
  • 右下面弹出框实现代码 原

    slidedown 一般是隐藏的div 向下慢慢滑动,全部显示,此例子刚开始向上滑动慢慢全部显示,原因是样式定义了position:fixed;left 及 r...

    tianyawhl
  • 工具推荐|目标域名收集之subDomainsBrute

    Github地址:https://github.com/lijiejie/subDomainsBrute

    陈殷
  • Ansible3:ansible.cfg

        Ansible默认安装好后有一个配置文件/etc/ansible/ansible.cfg,该配置文件中定义了ansible的主机的默认配置部分,如默认是...

    py3study

扫码关注云+社区

领取腾讯云代金券