2018年俄罗斯世界杯于7月15日星期日结束,法国捧起大力神杯,紧随其后的是克罗地亚和比利时。世界杯开赛后,几乎涉及人工智能领域的企业都对这场体育盛会做出了“预测”。研究人员和科学家们试图利用人工智能(AI)和统计数据来预测世界杯64场比赛的结果,可它有多可靠呢?
AI预测结果
微软的智能系统预测决赛将在巴西和德国之间展开,巴西队夺冠,位列三四的分别是西班牙和葡萄牙。高盛集团同样将大力神杯颁给巴西,投行高盛今年也依靠机器学习模拟了世纪杯,高盛为每只球队总共建立了 200,000 个模型,但严格控制了参数,仅通过分析球队战绩和个人球员属性数据,来帮助预测特定的比赛得分。最后模拟了 100 万次比赛的变化分析,计算出每个球队的晋级概率。得出结论:预计巴西将以 1.70:1.41 的比分击败德国,赢得第六次世界杯冠军。
除了高盛和微软,早在5月18日,瑞银集团则直接给出了各球队的夺冠概率,德国队夺冠概率高达 24%,紧随其后的是巴西和西班牙队,夺冠概率分别是 19.8% 和 16.1%。再往后依次是英格兰、法国和比利时队,夺冠概率分别是 8.5%、7.3% 和 5.3%。而丹麦银行则预测巴西将夺冠,德国商业银行预测德国队卫冕捧杯。可见各家的预测结果也并非一致。在其他的预测版本中,结论基本都不超出巴西、德国、西班牙的范畴。
然而,事实表明,各家AI预测结果差强人意。
人工智能如何预测?
高盛在撰写其2018年世界杯预测报告时写道:“我们使用最先进的统计方法仔细捕捉世界杯比赛的随机性,并且在此过程中考虑了大量信息。据了解该人工智能运行了200,000个模型来预测每场比赛的分数,通过逾一百万次模拟来预测谁将在每轮比赛中取得胜利。”
微软的AI和数据科学专家Sorin Peste的预测过程则更加完善。以大数据预测为底层逻辑的AI,常用的模型有泊松回归、排序算法以及随机森林,本次预测中微软科学专家Peste采用的便是随机森林模型。这种模型的优点在于能够绕开普通的决策树模型都会遇到的过渡拟合问题,避免了决策出现严重扭曲的情况。
人工智能的预测系统必定和街头的神算子不同,天气、裁判、球员心情、球场状态、球员身体状况、伤势和在比赛中的碰撞都会影响比赛结果。
目前,对世界杯的预测系统大多数基于以往的经验及大数据进行预测,而人工智能则是这些基础之上加以运用机器学习,深度学习等更加复杂的人工智能算法,可以快速吸收读取上千场球赛的数据进行预测。
为什么人工智能会失败?
事实上,人工智能预测世界杯是一种数据分析的手段。人工智能预测则是基于以往众多数据,综合考虑如足联排名、球员身价、伤病情况、教练年龄、天气、裁判等多重因素,进行算法设计,再由机器进行理性计算得出的。
例如不公平的裁判、天气、政治状况、球员的个人问题等外部因素,这些重要的特征通常很难被测量和收集。此外,还存在一些随机性因素,例如,乌龙球的出现或是重要性错误的发生,这是不容易预测的。这些数据不但会影响赛场发挥,也无法收集有效数据,反哺模型算法。
“世界杯的预测存在非常大的难度,根本原因是球队之间交战记录太少,同时球员阵容四年一次更换,没有足够的历史数据沉淀帮助建模。”北京猜猜科技CEO谢波表示,“如果谁宣称自己能够预测世界杯比赛胜负,基本上是对基本面数据的重构和深度建模,但是放在具体样本来看,效果也差强人意”。
此外,业内人士认为,数据本身也具有一定的欺骗性,毕竟在统计时,一脚世界杯进球和对方的乌龙球都会成为比分牌上的数字“1”,但这个数字却无法完全真实反映场上的情况。
总的来说,在足球赛事上,缺乏大量有效的数据支撑,同时球赛的影响因素充满着不确定性,无法通过数据反哺模型训练,这样就很难做出正确的预测。
文章来源:劳动报、网易科技、b2b圈
参展请联系
汉诺威米兰展览(上海)有限公司广州分公司
联系人:丁书宁 女士 / 沈元 女士
传真:020-8626 6690
电话:020-8626 6696 转8005/8001
电邮:dennise.ding@hmf-china.com
fion.shen@hmf-china.com
参观及媒体请联系
汉诺威米兰展览(上海)有限公司广州分公司
联系人:梁升好 女士 / 王学熹 先生
电话:020-8626 6696 转8010/8003
电邮:grace.liang@hmf-china.com
terry.wang@hmf-china.com
更多资讯扫我关注!
领取专属 10元无门槛券
私享最新 技术干货