最近世界杯正在打得火热,同时各个小组的排位赛也打得如火如荼。因此想着能不能用历年以来的世界杯成绩来模拟预测今年的夺冠球队呢?
恰好,在Kaggle官网上,有两份数据可以使用:
因此我们可以利用这两份数据进行数据分析。在模型中,利用随机森林进行预测,可以得到具体的模型结果。
那话不多说,我们直接看看具体的预测结果把。
小组赛预测
1
A组比赛结果
最后出线名单为:荷兰、厄瓜多尔
2
B组比赛结果
最后出线名单为:英格兰、伊朗
3
C组比赛结果
最后预测出线名单为:阿根廷、波兰
这一组中,从预测结果知道,目前阿根廷已经输了沙特,所以预测结果特别不准确。
而且身为“亚洲之光”的沙特,确实成为这一小组的黑马角色。
4
D组比赛结果
最后预测出线名单为:法国、丹麦
5
E组比赛结果
最后预测出线名单为:西班牙、德国
这一组被称为死亡之组,第一轮小组赛中,日本凭借顽强的意志力连入两球,亚洲足球与欧洲足球的差距越来越小。真的是梦想照进现实:
6
F组比赛结果
最后预测出线名单为:比利时、克罗地亚
这组比较正常,模型预测和实际的第一轮结果类似。
7
G组比赛结果
最后预测出线名单为:巴西、瑞士
这组巴西独一档,出现基本没有问题。
8
H组比赛结果
最后预测出线名单为:葡萄牙、乌拉圭
这一组由于韩国第一轮逼平了与乌拉圭,导致这个小组出线也扑朔迷离:
夺冠之路
整体总结
1.有亚洲球队的小组,模型会偏向于预测亚洲球队输球。但是实际情况来看,亚洲球队在本届世界杯,发挥都相当不错,目前取得了3胜一平的好成绩。(沙特、日本、伊朗分别赢了阿根廷、德国、威尔士)说明亚洲足球水平有明显的提升。
2.今年,巴西夺冠的概率很明显,看好今年巴西可以夺得大力神杯
3.E组不愧被称为死亡之组,模型大部分都预测错了,目前来看出线形势一片混乱。
4.最后,模型预测不一定百分百准确,只图大家一乐
好了,以上就是本期的具体内容了,具体可以关注我的知乎/公众号"算法一只狗"
我是leo,我们下期再见~