贺中国男子接力获银牌,看数据如何主力体育!

喜讯!在昨日的北京田径世界锦标赛上苏炳添、张培萌、谢震业和莫有雪组成的中国队在男子4×100米接力决赛中,以38秒01的成绩获得银牌,创造了中国田径史上该项目的最好成绩。

“数据分析”能否助力体育赛事?请看我们今天推荐的文章。另,在大数据文摘后台,回复“体育”可看系列文摘。

大数据文摘翻译作品,欢迎个人转发朋友圈;其他机构、自媒体转载,务必后台留言,申请授权。

作者|Emerging Technology From thearXiv

翻译|王珏 校对|魏子敏

在一种全新的运动能力评估模型中,通过三个数字就能够反映运动员在短距离、中距离及长距离跑步比赛的能力。

将短跑运动员与长跑运动员来进行能力对比显然是不公平的。长跑与短跑对身体有着不同的要求,这也就是为什么好的短跑运动员完全无法适应马拉松对身体的要求,而长跑运动员则在短跑中表现平平。

然而,长跑与短跑间的交集到底在哪呢?多长的距离才能作为这两种极端之间(例如,100米世界纪录保持者博尔特和奥运会10000米金牌得主莫法拉之间)公平竞赛的距离呢?

如今,柏林洪堡大学Duncan Blythe和伦敦大学的Franz Király的工作成果给了我们答案。他们开发出一种新的模型来说明短距离、中距离与长距离跑步运动员所需的运动表现。

该模型甚至能够基于运动员在其他距离的表现,预测他在某一距离的能力。这也就是他们如何找到博尔特与莫法拉公平竞争距离的方法。

运动科学家早已知道,各种距离的跑步世界纪录遵循着一种幂律分布。当博尔特在2009年8月打破100米世界纪录时,他的速度刚超过每秒10米。而1英里的奔跑速度世界纪录刚超过每秒7米。2014年,肯尼亚选手DennisKimetto打破了马拉松世界纪录,在超过42公里的距离中,他的速度在每秒6米以下。

换句话说,平均速度的小幅提升将显著缩短能够打破世界记录的距离。但速度和距离之间的关联实际上是比这更为复杂。

当研究人员绘制的世界纪录的速度和距离的关系图时,发现该图呈现出一条带有一个奇怪拐点的幂律曲线。就好像是一条幂律曲线控制距离小于一英里的奔跑速度,而另一条控制距离大于一英里的奔跑速度。

对此,传统的解释是短跑运动员以无氧的方式消耗能量,而长跑运动员则以有氧的方式。拐点出现在运动员能量消耗中的交界点。

这个理论模型的问题是它的预测能力很有限。基于短跑运动员在中短距离的表现,模型无法测算出他在长距离跑步中的表现。同样,也无法测算马拉松运动员的短跑能力。

而Blythe和Király的工作成果在这一问题上有所突破。他们在英国建立了一个庞大的运动能力数据库,涵盖了从1954年至今的数据。他们采集了近150万个数据样本,包括男女老少及从业余水平到精英水平的所有人的跑步时间与距离。这些记录运用于10种不同的距离:100米,200米,400米,800米,1500米,1英里,5公里,10公里,半程马拉松(21公里)和42公里的全程马拉松。

然后,他们用机器学习算法找到了一个方程式,并通过利用这些数据,能够基于每个人在其他距离的表现,预测其在某一距离的表现。这个方程式也产生了著名的“折断的”幂律图,用以描述世界纪录的成绩分布。

找到能够描述任何分布的方程式并不难。只需要尽可能多的获取附加参数并以正确的方式调整曲线。果不其然,机器就找到了这样一个方程式。

但出人意料的是,这个方程式只使用了三个参数来描述数据库中的每一个人的表现。

在这个模型中,第一个参数是一个普通的幂律,它描述了一个人的整体表现。能够基于世界记录的分布来描述个人的整体表现,这一定程度上是令人惊讶的。然而,另外两个参数对该幂律图进行了修正,产生了折断的幂律图。

第二个参数描述运动员有着更大的耐力还是更快的速度。第三参数描述运动员在中距离的表现是否比短距离或者长距离更好。

这三个参数完整地描述了一个运动员在所有距离的个人表现,形成了一个全新的运动能力模型。“我们的研究提供了强有力的证据,证明通过这三个数值的汇总,能够捕捉到运动员的生理行为或社会行为特征,例如,训练状态、专长,以及运动员选择尝试的距离。”Blythe和Király说道。

在发现和测试了这个模型后,Blythe和Király利用它首次了解到了一些有关运动员的重要问题。例如,马拉松运动员一直所思考的一个问题:是提升更高的最快速度还是提升耐力?

Blythe和Király认为他们的模型给出了一个明确的答案:“只有一种方法能够成为一个快速的马拉松运动员,即具有高水平的耐力——而不是平稳地保持一个相对高的最快速度。”他们说道。

该模型还建议,如果一个运动员在超过10公里的距离上不具备世界级的水平,那么也就不会是42公里马拉松上有所建树。

研究人员甚至可以对每个运动员进行预测。其中就包括了5000米与10000米世界记录保持者埃塞俄比亚长跑运动员Kenenisa Bekele。Blythe和Király表示,他们的模型预测出Bekele能够在2小时36秒内跑完马拉松,这几乎比目前的世界纪录快了3分钟。

那么,回到长跑运动员与短跑运动员公平比赛的距离到底是多少这个原始问题,Blythe和Király同样也找到了答案。“我们预测,莫法拉和博尔特之间公平的竞赛的距离大概在492米”他们说道。

这是一场值得期待的比赛。

来源:http://www.technologyreview.com/view/537496/machine-learning-algorithm-calculates-fair-distance-for-a-race-between-usain-bolt-and/?utmcampaign=socialsync&utmmedium=social-post&utm_source=twitter

参考资料:arxiv.org/abs/1505.01147 :Prediction and Quantification of Individual Athletic Performance

Ref: arxiv.org/abs/1505.01147 : Prediction andQuantification of Individual Athletic Performance

大数据文摘编译者简介

有意联系栏目组成员的朋友,请给“大数据文摘”后台留言,附自我介绍及微信ID,谢谢。

王小珏

毕业于上海外国语大学,精通德语与英语,现就职于安永(中国)企业咨询有限公司,担任IT咨询业务线高级顾问。欢迎各位同行及对新技术感兴趣的朋友共同学习交流。

魏子敏

香港中文大学新闻学硕士。硕士期间利用大数据分析媒体报道的政治偏向,2012年美国大选期间参与美国加州民主党竞选工作,搜集选民数据并统计数据反映的政治走向。希望用更科学的数据做更好的新闻。

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2015-08-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

我用一只母鸡,就能把股市给你讲明白了

从前,在一片广阔的大草原上,有很多只母鸡,他们,吃着火锅唱着歌,吃着青草下着蛋。但是,母鸡们又不愿意像这样日复一日的吃草,下蛋。于是,一场革命性的变革即将到来…...

2928
来自专栏专知

2017年度中国计算机学会CCF优秀博士学位论文奖初评结果公布

来源:中国计算机学会 依据关于评选中国计算机学会(CCF)优秀博士学位论文奖的有关条例,CCF从2017年8月25日起,开始受理2017年度CCF优秀博士学位论...

3168
来自专栏新智元

【CVPR最强参会指南】深度学习走下神坛,中国AI独角兽强势抢镜

1813
来自专栏专知

谷歌2018博士生奖研金出炉:39人上榜,8位华人学生入选

【导读】Google 博士生奖研金项目(Google Ph.D Fellowship Program)创立于2009年,以奖励表彰在计算机学科及其相关学科或者其...

3746
来自专栏DT数据侠

影像数据揭秘下,一座城市到底能有几幅面孔?

如果一座城市的楼房、街道、汽车、人、树木、都可以被标记,并被转化为可量化的评分体系,那么人与空间的感知关系则会拥有更多可能。上周的数据侠实验室,DT君邀请到城室...

1213
来自专栏量子位

ImageNet这八年:李飞飞和被她改变的AI世界

李杉 安妮 编译自 QZ 量子位 报道 | 公众号 QbitAI ? 2006年,李飞飞开始考虑一个想法。 当时刚刚出任伊利诺伊大学香槟分校计算机教授的她发现,...

4786
来自专栏AI科技评论

学界 | 如何提高NIPS论文命中率?这里有一份详细的分析

在学术界,NIPS大会在论文方面的争议似乎比其他学术会议更为突出一些。例如去年在ML圈子里影响颇大的SARM论文撤稿事件就是在NIPS,以及像这位叫Thang ...

4527
来自专栏AI科技评论

大会 | CVPR VUHCS Workshop征稿啦,附带5项极具吸引力的比赛

AI 科技评论按:CVPR 2018 将于 2018 年 06 月 18-22 日在美国盐湖城举办,除了主会议程,各式各样的 Workshop 也值得大家一探究...

2814
来自专栏CDA数据分析师

22本数据分析、挖掘的好书推荐—绝对干货,不看后悔!

1. 深入浅出数据分析 这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分。 难易程度:非常易。 2.啤酒与尿布 通过案例来说事情,而且是...

2245
来自专栏专知

16个国际顶尖计算机期刊介绍与作者教程【附写作模板】

【导读】撰写成功的研究论文不仅仅是传播您的知识。大多数期刊都会在提交之前规定适用于您的内容的详细创作指南。许多研究论文甚至因为没有遵循期刊的指导原则而被拒绝。为...

1081

扫码关注云+社区

领取腾讯云代金券