投行凭“大数据”预测世界杯

6月11日 《美国大数据治理下的新问题》

摘自:东方早报

作者:John Carlo Bertot系美国马里兰大学信息科学学院教授,信息政策与获取中心主任和政府信息季刊(Government Information Quarterly,SSCI期刊)主编

译者:郑磊系复旦大学国际关系与公共事务学院副教授、数字与移动治理实验室主任

4月14日《恐怖的奇点——论机器进化》

作者:杨静,中国经济网经营顾问

微信号:杨静lillian(ID:lillian_yang_1111)

公号介绍:[以思想变革未来] 发现智慧之本我、探索美好新世界.分享高智慧含量的新科技及新媒体观察;关注新社会、新经济趋势与新文化、新生活方式;建设兼具深度与推动力的精英社交圈.

===========【致歉】===========

今日文章:投行凭“大数据”预测世界杯

“巴西国家队在2014年世界杯上将顺利出线,在1/8决赛中以3比1淘汰荷兰,随后3比1胜乌拉圭晋级半决赛,2比1取胜德国后巴西将与南美洲另一劲旅阿根廷国家队相会里约热内卢,最终3比1战胜梅西率领的球队而赢得世界杯。”……

近日,在长达60页的报告中,美国知名投资银行高盛这样预测世界杯。在巴西世界杯即将开哨的档口,这段话恐怕会激起无数球迷的欢呼或怒骂。

而离开了股票交易厅和资本运作“黑箱”,投行在绿茵场上说的话“靠谱”吗?

预测胜负和“最佳阵容”

投行预测世界杯不是什么新鲜事,从上世纪50年代开始,在几乎所有关键赛事开球前,投行分析师们都要说两句。的确,每次世界杯之前的各种孰强孰弱的热闹讨论从来也少不了这些投行的名字。

2010年南非世界杯之前,各大投行都集中精英分析师预测世界杯的结果。其中,高盛和丹麦丹斯克银行都认定巴西国家队能够最终取得世界杯,但最终结果让两家投行失望。而著名投行瑞银在赛前就笃信西班牙国家队,成功预测。

当然,仅仅预测谁夺冠并不能显示投行的庞大数据分析能力,它们每届的目标“不仅是赢结果,还要赢过程”。

每届世界杯前,高盛的预测报告总是包括球队参加各轮比赛场次的赢面、负面,以及最终能够“走多远”。事实上,在2010年南非世界杯和2006年德国世界杯的预测中,高盛均预测出四强中的两支球队,至少在预测四强的领域赚了些面子。不过,在2002年世界杯前,高盛看好能进四强的球队没有一支“应验”,成了“乌鸦嘴”。

也许是为了避免过分尴尬,投行分析师们预测的往往是夺冠或球队获得某一成绩的百分比。例如,在今年世界杯的预测中,高盛认定,巴西的夺冠机会是48.5%,第二名是阿根廷,夺冠机会只有14.1%,第三名是德国,夺冠机会是11.4%。排在第四的是卫冕冠军西班牙,但夺冠几率已经不足10%。

当然,相对而言,预测谁不能夺冠似乎更容易。高盛在所有参加世界杯决赛圈比赛的球队中列出日本、加纳、哥斯达黎加、洪都拉斯、喀麦隆、阿尔及利亚六支国家队“彻底没戏”。当然,还有包括葡萄牙、法国等在内的大量球队夺冠几率不超过1%。这些预测看起来比那份夺冠名单“靠谱得多”。

仅仅预测球队的胜负还不够刺激,投行们希望在参加世界杯的近千名球员中预测出最终的最佳阵容。相比夺冠或球队的走势,最佳阵容的预测变数更大,不光得看球员的能力状态,至少还得分析球员意外拉肚子的可能性。

2010年南非世界杯前夕,高盛就给出了那届世界杯的最佳阵容预测名单。在这个“433”阵型的阵容中,三名前锋是欧洲几大联赛中最受欢迎的三名球员:梅西、C罗和鲁尼。结果,这个“最佳前锋线”总共攻入一球,还是C罗在葡萄牙国家队7比2横扫朝鲜国家队时贡献的。这一最佳阵容反倒成了媒体、同行调侃高盛的“最佳素材”。

不过,高盛似乎对自我的选择比较执着。为2014年世界杯预测的最佳阵容中,梅西和C罗还是箭头人物,只不过把鲁尼换成了巴西球员内瓦尔。据说,高盛当年选择鲁尼的原因是原来的首席分析师吉姆·奥尼尔是英国曼联足球俱乐部的忠实球迷,如今新的分析师更看好最近几年表现不错的东道主球员内瓦尔。

球队表现和薪资是“大数据”

投行是怎样预测世界杯的呢?是在分析师们在烟雾缭绕俱乐部里讨论的结果,还是派出密探到各个国家足球队的训练基地“刺探军情”?

其实,熟悉社会科学近几十年发展的人都清楚,这些预测无非是通过数据整合统计分析得出的,可能还引入了各家投行自创的数学公式“秘方”。说得时髦一点,这种方式就是最近两年炒得很火的“大数据”。

说白了,“大数据”就是海量数据,随着互联网的发展,分析师再也不用在纸片满天飞的环境中比较发掘数据的能力,用各种方法分析数据成了研究的课题。而在足球这个充满偶然性的领域中,人们也开始尝试用数据开启“上帝模式”,玩得最好的当然是投行了。

统计学领域,数据分析的基础是寻找变量。某一个数据是否对最终分析结果产生影响,取决于这个数据与事实如何相关,又有多大关系。不同的分析师可能对某一个变量的“决定性数据”看法不一,也就有了针对结果的不同预测。

之所以瑞银在2010年世界杯前夕看好西班牙国家队,是因为瑞银的分析师认定,与世界杯夺冠与否关系最大的数据是整支球队在世界杯之前特定时间段中的表现。当时,西班牙在预选赛中全胜,在其他赛事中表现抢眼,在这一“决定性数据”上脱颖而出。

不过,在瑞银的分析中,还有一个“决定性数据”是球队的薪资结构,也就是球员身价综合最高的球队可能更容易获得世界杯。要是照这个标准,英格兰理应表现不错。但结果证明,这支以4.7亿欧元(1欧元约合8.39元人民币)总身价排名第二的球队延续了世界杯上扮演“悲情英雄”的角色。

巴西是最热门的夺冠球队

时间到了2014年,瑞银对数据的理解似乎有变。这家投行开始看好巴西队,因为历年东道主球队的表现看上去很关键。如果把这一数据当成“决定性数据”,那巴西自然是最热门的夺冠球队。

丹斯克银行分析师与瑞银的理解不一样。他们认为,社会经济变量是在世界杯上良好表现的“决定性数据”。按照这家投行的说法,那些富有、人口多的国家有更加丰富的人才储备。在世界杯上的表现一定是最好的。除了社会经济变量,国际足联排名也在这家投行分析师眼中相当重要,不过,他们认定排名越靠后的球队在世界杯上表现会越好。

很明显,这个数据分析标准解释不了为啥美国国家队一次也没拿过世界杯,印度国家队为啥一次都没进过世界杯决赛圈,更不用说人口世界排第一的中国国家队。

事实上,所有研究人文社会科学的学者都明白,数据分析或“定量研究”的解释力是有限的,因为没有任何人能够概括对某一事件能够产生影响的所有因素;而任何单一因素可能都会有解释力,但这种解释力永远不可能洞悉事件的全部真相。换句话说,投行们乐此不疲、基于数据整合对世界杯做出的预测“可能都对,也可能都错;可能都有意义,也可能都是无稽之谈”。

“投行加足球,等于各种宣传”

既然手里的“水晶球”不可能完全准确,明知道不可能预见未来,投行为什么还要纷纷戴上兜帽、煞有介事地启动“见证奇迹的时刻”呢?

按照投行们自己的解释,预测世界杯是因为足球对于我们生活的星球“很重要”。

高盛在那份名为《足球与经济不同寻常的结合》的60页预测报告中就对足球的重要性做出“逻辑阐述”:“从逻辑上看,足球比经济重要得多。利物浦队的一名教练曾说过,足球比生与死这样的事情都重要得多。经济恰恰相反,很少有经济事件能比生与死还要重要。所以结论肯定就是,逻辑归纳起来,足球比经济重要得多。”

这个充满了亚里士多德“三段论”的哲学诡辩的确讨巧,但恐怕难以让人信服,连高盛自己估计也是这么想的。

于是,这家大名鼎鼎的投行在下面补充了一段:“你要是不相信这个逻辑,考虑下面的事实:每一个英国人都知道‘三狮军团’(英格兰队)1966年赢得了世界杯,但又有多少人知道哪年的经济情况呢?……如果英国赢得2014年世界杯,那今年不管是经济好还是坏,英国人都会记得。当然,我们觉得那不太可能,英国赢世界杯预计要到2062年。”

不过,问题在于投行不是服务大众娱乐的机构,而是追逐经济收益的。难不成,投行分析师们的信条真的是“没有永恒的经济周期,只有永恒的足球”?

其实,在投资圈里有这么一句话:“投行加足球,等于各种宣传。”说到底,没有人会记得投行究竟预测失败了多少次世界杯,人们只会记得某年世界杯被某投行成功预测成功;没有人会记得同行预测失败了百分之多少的比赛结果,人们只会记得某投行成功预测了百分之多少的比赛结果。

对于投行而言,在一个充满不确定性的世界中,希冀用程序化、标准化的分析方法猜中连蝴蝶动一动翅膀都能产生变化的人情世故,本身就是个小概率事件。如何击中小概率事件?就靠多多尝试吧。

在行业中,不同投行之间的竞争焦点是怎样能够包装客户融资、取得更好的发展。怎样争取到优质客户、赚取最大佣金呢?那就要向客户们证明,投行能够洞悉世态炎凉,拨拨小算盘就能知道下一步应该去向何方,连最具偶然性的足球都时不时能预测成功。

当然,“自我宣传”说是投行预测世界杯的一种解释。对于不少热爱足球的人来说,这种解释未免过于严肃,他们更倾向于相信足球的魔力。

摘自:国际先驱导报,记者 宿亮

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2014-06-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据挖掘DT机器学习

【时讯】看“大数据”如何完胜华尔街

今年有一 流行语“在大数据面前,你连底裤都不剩”。而足球绝对是世界上运用大数据最领先、最成功的领域。就在刚刚结束的巴西世界杯,包括百度、微软等互联网...

30550
来自专栏人称T客

监测报告|金蝶大招频出显风采,网友们有点 “花心”

撰文 | 卿云 此次ERP检测报告由T客汇和云鸽企业头条监测中心联合发布。本次报告,我们推出国内ERP市场监测情况分析,时间段从2017年6月14日至201...

33370
来自专栏CDA数据分析师

最后,请让我以这样的方式说再见:从球员数据看Kobe

文 | 吕鸿福 杨一凡(北大数院在读) 原创文章 转载请注明来源 ? When we first met, I was just a kid. When you...

20350
来自专栏大数据文摘

网络理论解释巴萨足球为何与众不同

16140
来自专栏量子位

人类一败涂地!OpenAI血虐Dota2半职业战队!马斯克仅评价了两个字

北京时间早上5点58分,人类半职业Dota高手队对战OpenAI Five第二局接近尾声,被称为“大老师”的dota plus大数据对人类战队宣判了死刑。

10000
来自专栏人称T客

监测分析:管理软件厂商SAP和用友本月关注度对比 SAP明显占优

最近看到网上很多关于管理软件的排名,真的无法分辩哪些是真哪些假?有一些排名水份较大,有花钱买排名的,今天咱们来个准确的排名,别看广告咱们看疗效。从典线图来看,S...

27830
来自专栏Forrest随想录

从《最后一球》聊聊Coach的作用

假期刷了几部电影,《无双》剧情很精彩,《动物世界》比较烧脑,其中看到的《最后一球》最让人感动,这种感动来自于团队和集体的共患难,以及共同努力之后收获的喜悦。

18020
来自专栏ACM算法日常

谁是史上最强将领?算法证明:拿破仑

编者按:本文编译自towardsdatascience原标题为Napoleon was the Best General Ever, and t...

11110
来自专栏DT数据侠

NBA的三分球革命:数据揭秘“三分策略是否真有效”?

新赛季的NBA已经在本周打响了第一枪,热血的全球第一篮球联赛的热情高涨,同时高涨的还有大家对数据科技的追求。本期DT数据侠与纽约数据科学学院合作的数据专栏中,作...

12620
来自专栏科技向令说

响铃:世界杯来了,移动办公的“世界杯”怎么踢?

北京时间6月14日晚,让中国人艳羡“别人家公司”的世界杯终于来了。本届世界杯既有巴西、阿根廷、德国、法国、西班牙、葡萄牙、英格兰等传统强队,也有冰岛等强势黑马,...

9010

扫码关注云+社区

领取腾讯云代金券