请问:你是不是不知道看世界杯哪一场球?
作为一个小白,本来就不懂世界杯,但是热度还是要蹭的。
那么接下来的目标就是 ——如何最低成本地伪装成一个懂球帝?
我和博士陷入了沉思。
所谓懂球者,必懂的取舍也,是故知哪一场球该看,哪一场球该舍。
何也,因世界杯小组赛就有 48 场比赛,如果不知取舍,未进入到决赛阶段,必卒也。
所谓取舍,是必须基于一定条件的。
经过广泛查阅资料和深度探索,在掉了 188 根头发的智力活动之后,老夫决定用以下几个条件判断是否该看一场比赛。
1. 悬念大小:比赛要充满悬念,跌宕起伏;
2. 球员名气:巨星云集才有话题性;
3. 进球概率:进球越多当然越精彩。
我们先要搜集数据。
首先,采集比赛数据,去FIFA官网我们采集了所有的比赛对阵和赔率数据
去Instagram上,我们可以找到世界杯每个队伍身价前五的球员的粉丝数、发帖数,我们看到,C罗和梅西的分析加起来有 2 亿了,有的球员居然队内前五也就几万粉丝。
果然,互联网时代,粉丝就是第一生产力啊。
然后,经过一晚上的努力,我和博士在互联网上继续找寻,我们就搜集到了以下四类数据:
1)48场比赛对阵和博彩赔率数据;
2)32支球队和其世界排名数据;
3)每支球队球员身价和身价前五的球员的Instagram粉丝数据;
4)32支球队2017~2018年国家队比赛、比分、时间数据。
有了这四类数据,我们就做了三个综合模型(你可以假装你看懂了):
模型1:球员名气越大,越好看
计算代码如下(同样请假装你看懂了):
模型2:双方有来有回,实力差距不大,越好看
计算模型如下:
如果实力差距越小,赔率差距越小,悬念越大,就是 uncertainty 越大。
计算代码如下(同样请假装你看懂了):
模型3:进球期望越多,越好看
我们计算每场比赛从历史比赛数据来看球队每分钟的进球期望,可以看出这场比赛大概的进球数(粗略)。
计算代码如下(同样请假装你看懂了):
结论
经过模型计算和输出
我们计算出一组你看得懂的数据
综合最值得看的 3 场比赛推荐
球星最有名 3 场比赛推荐
比分预期最多的 5 场比赛
注:以上数据模型没有经过仔细调试,完全是平均计算.
最后经过一晚上的熬夜,我和博士都冒起了星星眼,来一个程序员的合照,给你们感受下。
关注友学堂公众号
回复
世界杯数据
可以获得本推文中所有所需数据包
以及核心代码
感谢你把本文分享给你的X球迷朋友们