用深度学习预测世界杯胜率,有多大把握?

四年一届的世界杯今天在战斗民族俄罗斯开幕!

迷足球的小伙伴们一定要开启通宵看球模式了

当然,除了看过程,结果想必也是球迷们关注的焦点

前有章鱼哥神算预测胜负,最近人工智能这么火,是不是也可以预测呢?

小编今天来和大家一起开开脑洞,看看如果用深度学习预测世界杯,有多大把握?

预测其实是需要综合多方面因素考量的,数据维度可能爆炸到无法统计,同样如果想借助深度学习预测,在开始之前一定要确保避开这几个雷区

数据不规律+量少

虽说深度学习要靠算法撑起一片天,但是兄dei,光有算法是远远不够滴!

深度学习可以根据大数据进行预测,并且数据量要非常非常大,这样算出的模型才能较为准确的预测。

比如说,有些小伙伴可能会有这样的认知,深度学习入门了三个月后,想要开始知识变现,于是乎决定预测股票,通过预测结果指导行为,走上迎娶白富美成为大富翁的人生赢家之路。然而,事实是,受到金融数据完整性、数据量级(很多数据券商不会对外)等等影响,可能根本无法训练出收敛的模型;就算是可以获得数据,搭建模型计算其中的规律也需要大量的资源和时间,可不是速成的事儿啊,等你搭建完,说不定参考的股票都退市了。

所以,想要一夜暴富,还是出门左转买个彩票吧~

预测的事情,不可控影响因素多

预测嘛,本身就是一个概率可能性的推测。所以必定得有东西是确定的,才能找到其中的规律探索出可能性。

比如说,如果用深度学习预测房价。如果单说房价预测,有足够多的数据量,比如买卖房产数据以及购买人的基本信息,理论上讲是可行的。现实生活中,美国也有不少房产科技公司在做房价趋势预测。

然鹅小伙伴们,如果背景换成中国,那么请大声读出这四个字:宏观调控

众所周知,房子的价格除了受到市场中的价值规律影响,和政策调控之间也具备强相关的关系。因此,如果想要借助深度学习预测中国的房价走势,准确率emmmm

笃定要预测100%准确

虽说AI目前备受追捧,但是要客观的说,预测不是结论,不会100%准确,如果100%准确,那叫过拟合。

比如你知道小红一三五星期天打伞,二四六不打伞,那么持续收集一年数据之后,模型在周三大概率会计算出小红打伞这件事,但是这是个预测结果,不是最终一定会发生的,这里面永远存在着:小红不想打伞了、小红的伞丢了等等因素。所以预测不存在百分百这个数值。

那怕你说你连续预测一千万次也没有出错过,也不能说100%准确,只能说——在这一千万次的预测中,模型的准确率是100%的,超过这一千万次,每次预测都有新的可能性。

看了这么多,肯定有小伙伴想,说这么多,世界杯到底能不能用深度学习预测?

综合咱上面的“雷区”以及实际情况,有一点是明确的:借深度学习想要预测球赛结果很难,但是预测球员的进球率是有轨迹可循的。小编在此提供几个做进球率预测的关键要素,感兴趣的小伙伴可以试试~

1.球员的个人基本信息。诸如球员的身高、体重和奔跑速度、年龄、训练过程中的各种体征,这样的数据,要尽可能的准确、丰富。至于获取途径,靠大家自己想象了。

2.球员往期进球的数量统计数据。这个数据在国内外的网站或许是有统计结果的,在收集到之后,进行一定的预处理,再结合天气、土壤、主场等几十种因素,或许就是你模型的重要组成部分。

3.球员的进球视频。通过得到进球视频,能够进行图像识别,找到球员的奔跑轨迹和进球轨迹,深度学习能够运用模型计算出运动员可能会进行的奔跑轨迹,进而就能判断本场进球的概率。

至于数据量,多多益善,不然可能你的模型根本不会收敛,也无法进行预测。

那么,如果拿到数据,就可以借助PaddlePaddle实现初步预测

操作步骤就是

数据预处理——使用PaddlePaddle建立模型—训练模型—得出模型结果——找到比赛当天的数据输入——得到预测的进球率

有了进球率,那么谁赢谁输这个事儿,也就有一定的把握度啦~~

期待各位小伙伴们看球愉快,预测顺利~

原文发布于微信公众号 - PaddlePaddle(PaddleOpenSource)

原文发表时间:2018-06-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

腾讯AI Lab开源800万中文词的NLP数据集 | 资源

该数据包含800多万中文词汇,相比现有的公开数据集,在覆盖率、新鲜度及准确性上大幅提高。

6663
来自专栏量子位

世界杯押注还得看技术流,这个预测AI把赔率也算上了

732
来自专栏机器人网

【漫画】通俗易懂讲清楚什么是机器学习?

来源:伯乐在线,作者:玻璃猫 ------ 【导读】 ------ 理解机器学习真的没那么难。 在一个风和日丽的周末…… ? ? 故事一:瑞雪兆丰年 ? ...

3644
来自专栏华章科技

干货 :数据挖掘中易犯的11大错误

5. 使用了未来的信息(Accept Leaks from the Future)

882
来自专栏大数据文摘

周博磊知乎热答:如何评价何恺明大神斩获ICCV 2017最佳论文

1653
来自专栏新智元

【深度学习创作】用《权力的游戏》前五部训练RNN生成第六部(原理解析)

【新智元导读】 近日,一位名叫Zack Thoutt的工程师在开源社区Github上发起了这样一个项目:基于《冰与火之歌》前面五部作品,训练RNN(循环神经网络...

3595
来自专栏杨熹的专栏

机器学习的技术栈及应用实例脑洞

之前写了一篇入门级的学习列表: 简单粗暴地入门机器学习 好多小伙伴觉得不太过瘾,今天补充一些脑洞! 本文结构: 机器学习技术栈 职位 项目实例 ---- 1. ...

3787
来自专栏CVer

爱可可老师24小时热门分享(2018.11.26)

来源: https://media.weibo.cn/article?id=2309404310724141806413

1522
来自专栏数据科学与人工智能

【数据挖掘】客户价值分析

使用RFM方法(最近购买日Recency, 各期购买频率Frequency, 各期平均单次购买金额Monetary)能够科学地预测老客户(有交易客户)今后的购买...

27810
来自专栏CDA数据分析师

数据挖掘中最易犯的10个错误,请绕行!

按照 Elder 博士的总结,这 10 大易犯错误包括: 0、缺乏数据( Lack Data ) 1. 太关注训练( Focus on Training ) 2...

1929

扫码关注云+社区

领取腾讯云代金券