专栏首页大数据文摘投行凭“大数据”预测世界杯

投行凭“大数据”预测世界杯

6月11日 《美国大数据治理下的新问题》

摘自:东方早报

作者:John Carlo Bertot系美国马里兰大学信息科学学院教授,信息政策与获取中心主任和政府信息季刊(Government Information Quarterly,SSCI期刊)主编

译者:郑磊系复旦大学国际关系与公共事务学院副教授、数字与移动治理实验室主任

4月14日《恐怖的奇点——论机器进化》

作者:杨静,中国经济网经营顾问

微信号:杨静lillian(ID:lillian_yang_1111)

公号介绍:[以思想变革未来] 发现智慧之本我、探索美好新世界.分享高智慧含量的新科技及新媒体观察;关注新社会、新经济趋势与新文化、新生活方式;建设兼具深度与推动力的精英社交圈.

===========【致歉】===========

今日文章:投行凭“大数据”预测世界杯

“巴西国家队在2014年世界杯上将顺利出线,在1/8决赛中以3比1淘汰荷兰,随后3比1胜乌拉圭晋级半决赛,2比1取胜德国后巴西将与南美洲另一劲旅阿根廷国家队相会里约热内卢,最终3比1战胜梅西率领的球队而赢得世界杯。”……

近日,在长达60页的报告中,美国知名投资银行高盛这样预测世界杯。在巴西世界杯即将开哨的档口,这段话恐怕会激起无数球迷的欢呼或怒骂。

而离开了股票交易厅和资本运作“黑箱”,投行在绿茵场上说的话“靠谱”吗?

预测胜负和“最佳阵容”

投行预测世界杯不是什么新鲜事,从上世纪50年代开始,在几乎所有关键赛事开球前,投行分析师们都要说两句。的确,每次世界杯之前的各种孰强孰弱的热闹讨论从来也少不了这些投行的名字。

2010年南非世界杯之前,各大投行都集中精英分析师预测世界杯的结果。其中,高盛和丹麦丹斯克银行都认定巴西国家队能够最终取得世界杯,但最终结果让两家投行失望。而著名投行瑞银在赛前就笃信西班牙国家队,成功预测。

当然,仅仅预测谁夺冠并不能显示投行的庞大数据分析能力,它们每届的目标“不仅是赢结果,还要赢过程”。

每届世界杯前,高盛的预测报告总是包括球队参加各轮比赛场次的赢面、负面,以及最终能够“走多远”。事实上,在2010年南非世界杯和2006年德国世界杯的预测中,高盛均预测出四强中的两支球队,至少在预测四强的领域赚了些面子。不过,在2002年世界杯前,高盛看好能进四强的球队没有一支“应验”,成了“乌鸦嘴”。

也许是为了避免过分尴尬,投行分析师们预测的往往是夺冠或球队获得某一成绩的百分比。例如,在今年世界杯的预测中,高盛认定,巴西的夺冠机会是48.5%,第二名是阿根廷,夺冠机会只有14.1%,第三名是德国,夺冠机会是11.4%。排在第四的是卫冕冠军西班牙,但夺冠几率已经不足10%。

当然,相对而言,预测谁不能夺冠似乎更容易。高盛在所有参加世界杯决赛圈比赛的球队中列出日本、加纳、哥斯达黎加、洪都拉斯、喀麦隆、阿尔及利亚六支国家队“彻底没戏”。当然,还有包括葡萄牙、法国等在内的大量球队夺冠几率不超过1%。这些预测看起来比那份夺冠名单“靠谱得多”。

仅仅预测球队的胜负还不够刺激,投行们希望在参加世界杯的近千名球员中预测出最终的最佳阵容。相比夺冠或球队的走势,最佳阵容的预测变数更大,不光得看球员的能力状态,至少还得分析球员意外拉肚子的可能性。

2010年南非世界杯前夕,高盛就给出了那届世界杯的最佳阵容预测名单。在这个“433”阵型的阵容中,三名前锋是欧洲几大联赛中最受欢迎的三名球员:梅西、C罗和鲁尼。结果,这个“最佳前锋线”总共攻入一球,还是C罗在葡萄牙国家队7比2横扫朝鲜国家队时贡献的。这一最佳阵容反倒成了媒体、同行调侃高盛的“最佳素材”。

不过,高盛似乎对自我的选择比较执着。为2014年世界杯预测的最佳阵容中,梅西和C罗还是箭头人物,只不过把鲁尼换成了巴西球员内瓦尔。据说,高盛当年选择鲁尼的原因是原来的首席分析师吉姆·奥尼尔是英国曼联足球俱乐部的忠实球迷,如今新的分析师更看好最近几年表现不错的东道主球员内瓦尔。

球队表现和薪资是“大数据”

投行是怎样预测世界杯的呢?是在分析师们在烟雾缭绕俱乐部里讨论的结果,还是派出密探到各个国家足球队的训练基地“刺探军情”?

其实,熟悉社会科学近几十年发展的人都清楚,这些预测无非是通过数据整合统计分析得出的,可能还引入了各家投行自创的数学公式“秘方”。说得时髦一点,这种方式就是最近两年炒得很火的“大数据”。

说白了,“大数据”就是海量数据,随着互联网的发展,分析师再也不用在纸片满天飞的环境中比较发掘数据的能力,用各种方法分析数据成了研究的课题。而在足球这个充满偶然性的领域中,人们也开始尝试用数据开启“上帝模式”,玩得最好的当然是投行了。

统计学领域,数据分析的基础是寻找变量。某一个数据是否对最终分析结果产生影响,取决于这个数据与事实如何相关,又有多大关系。不同的分析师可能对某一个变量的“决定性数据”看法不一,也就有了针对结果的不同预测。

之所以瑞银在2010年世界杯前夕看好西班牙国家队,是因为瑞银的分析师认定,与世界杯夺冠与否关系最大的数据是整支球队在世界杯之前特定时间段中的表现。当时,西班牙在预选赛中全胜,在其他赛事中表现抢眼,在这一“决定性数据”上脱颖而出。

不过,在瑞银的分析中,还有一个“决定性数据”是球队的薪资结构,也就是球员身价综合最高的球队可能更容易获得世界杯。要是照这个标准,英格兰理应表现不错。但结果证明,这支以4.7亿欧元(1欧元约合8.39元人民币)总身价排名第二的球队延续了世界杯上扮演“悲情英雄”的角色。

巴西是最热门的夺冠球队

时间到了2014年,瑞银对数据的理解似乎有变。这家投行开始看好巴西队,因为历年东道主球队的表现看上去很关键。如果把这一数据当成“决定性数据”,那巴西自然是最热门的夺冠球队。

丹斯克银行分析师与瑞银的理解不一样。他们认为,社会经济变量是在世界杯上良好表现的“决定性数据”。按照这家投行的说法,那些富有、人口多的国家有更加丰富的人才储备。在世界杯上的表现一定是最好的。除了社会经济变量,国际足联排名也在这家投行分析师眼中相当重要,不过,他们认定排名越靠后的球队在世界杯上表现会越好。

很明显,这个数据分析标准解释不了为啥美国国家队一次也没拿过世界杯,印度国家队为啥一次都没进过世界杯决赛圈,更不用说人口世界排第一的中国国家队。

事实上,所有研究人文社会科学的学者都明白,数据分析或“定量研究”的解释力是有限的,因为没有任何人能够概括对某一事件能够产生影响的所有因素;而任何单一因素可能都会有解释力,但这种解释力永远不可能洞悉事件的全部真相。换句话说,投行们乐此不疲、基于数据整合对世界杯做出的预测“可能都对,也可能都错;可能都有意义,也可能都是无稽之谈”。

“投行加足球,等于各种宣传”

既然手里的“水晶球”不可能完全准确,明知道不可能预见未来,投行为什么还要纷纷戴上兜帽、煞有介事地启动“见证奇迹的时刻”呢?

按照投行们自己的解释,预测世界杯是因为足球对于我们生活的星球“很重要”。

高盛在那份名为《足球与经济不同寻常的结合》的60页预测报告中就对足球的重要性做出“逻辑阐述”:“从逻辑上看,足球比经济重要得多。利物浦队的一名教练曾说过,足球比生与死这样的事情都重要得多。经济恰恰相反,很少有经济事件能比生与死还要重要。所以结论肯定就是,逻辑归纳起来,足球比经济重要得多。”

这个充满了亚里士多德“三段论”的哲学诡辩的确讨巧,但恐怕难以让人信服,连高盛自己估计也是这么想的。

于是,这家大名鼎鼎的投行在下面补充了一段:“你要是不相信这个逻辑,考虑下面的事实:每一个英国人都知道‘三狮军团’(英格兰队)1966年赢得了世界杯,但又有多少人知道哪年的经济情况呢?……如果英国赢得2014年世界杯,那今年不管是经济好还是坏,英国人都会记得。当然,我们觉得那不太可能,英国赢世界杯预计要到2062年。”

不过,问题在于投行不是服务大众娱乐的机构,而是追逐经济收益的。难不成,投行分析师们的信条真的是“没有永恒的经济周期,只有永恒的足球”?

其实,在投资圈里有这么一句话:“投行加足球,等于各种宣传。”说到底,没有人会记得投行究竟预测失败了多少次世界杯,人们只会记得某年世界杯被某投行成功预测成功;没有人会记得同行预测失败了百分之多少的比赛结果,人们只会记得某投行成功预测了百分之多少的比赛结果。

对于投行而言,在一个充满不确定性的世界中,希冀用程序化、标准化的分析方法猜中连蝴蝶动一动翅膀都能产生变化的人情世故,本身就是个小概率事件。如何击中小概率事件?就靠多多尝试吧。

在行业中,不同投行之间的竞争焦点是怎样能够包装客户融资、取得更好的发展。怎样争取到优质客户、赚取最大佣金呢?那就要向客户们证明,投行能够洞悉世态炎凉,拨拨小算盘就能知道下一步应该去向何方,连最具偶然性的足球都时不时能预测成功。

当然,“自我宣传”说是投行预测世界杯的一种解释。对于不少热爱足球的人来说,这种解释未免过于严肃,他们更倾向于相信足球的魔力。

摘自:国际先驱导报,记者 宿亮

本文分享自微信公众号 - 大数据文摘(BigDataDigest)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2014-06-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 数据告诉你,百万年薪如何炼成

    大数据文摘
  • 公开课 | 看了10集《老友记》就被系统推荐了10季,Hulu如何用深度学习避免视频推荐的过拟合

    大数据文摘
  • 微软全球副总裁洪小文:创造力可能有一个算法吗?

    大数据文摘
  • Python isalnum()方法

    如果 string 至少有一个字符并且所有字符都是字母或数字则返回 True,否则返回 False

    周小董
  • python基础二

    掌握好文件处理的步骤很好理解,对于其他文件的处理不懂的(数据库)之类的,可以先了解open()即可。

    不断折腾
  • 世界杯大数据揭秘不眠的北上广深

    2018俄罗斯世界杯终于完美落幕了,相信有不少球迷已经变为“夜店”达人。不管你是为比赛本身,还是为球星,为颜值,为热闹,如果你没有在世界杯的夜晚感受过一群人的狂...

    DT数据侠
  • SYSTEM 表空间管理及备份恢复

    SYSTEM表空间是Oracle数据库最重要的一个表空间,存放了一些DDL语言产生的信息以及PL/SQL包、视图、函数、过程等,称之为数据字典,

    Leshami
  • jbpm5.1介绍(11)

    Jbpm-gwt-console源码编译 从svn下载,svn的下载地址是 http://anonsvn.jboss.org/repos/soag/bpm-c...

    cloudskyme
  • Rcash推出一站式数字货币交易平台,提供大数据分析工具

    据悉,Rcash是一个全球数字货币一站式量化与套利交易平台,目前已经完成产品的初步开发,下一步将集合大数据和人工智能系统,进行深度开发。此外,Rcash近期已准...

    BestSDK
  • 用大数据抓J.K.罗琳的“马甲”

    2013年4月,一本普通的破案小说“The Cuckoo’s Calling”(中文译名:《布谷鸟的呼唤》)上市了,作者是Robert Galbraith,一名...

    小莹莹

扫码关注云+社区

领取腾讯云代金券