前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >贺中国男子接力获银牌,看数据如何主力体育!

贺中国男子接力获银牌,看数据如何主力体育!

作者头像
大数据文摘
发布2018-05-21 15:17:45
5840
发布2018-05-21 15:17:45
举报
文章被收录于专栏:大数据文摘大数据文摘

喜讯!在昨日的北京田径世界锦标赛上苏炳添、张培萌、谢震业和莫有雪组成的中国队在男子4×100米接力决赛中,以38秒01的成绩获得银牌,创造了中国田径史上该项目的最好成绩。

“数据分析”能否助力体育赛事?请看我们今天推荐的文章。另,在大数据文摘后台,回复“体育”可看系列文摘。

大数据文摘翻译作品,欢迎个人转发朋友圈;其他机构、自媒体转载,务必后台留言,申请授权。

作者|Emerging Technology From thearXiv

翻译|王珏 校对|魏子敏

在一种全新的运动能力评估模型中,通过三个数字就能够反映运动员在短距离、中距离及长距离跑步比赛的能力。

将短跑运动员与长跑运动员来进行能力对比显然是不公平的。长跑与短跑对身体有着不同的要求,这也就是为什么好的短跑运动员完全无法适应马拉松对身体的要求,而长跑运动员则在短跑中表现平平。

然而,长跑与短跑间的交集到底在哪呢?多长的距离才能作为这两种极端之间(例如,100米世界纪录保持者博尔特和奥运会10000米金牌得主莫法拉之间)公平竞赛的距离呢?

如今,柏林洪堡大学Duncan Blythe和伦敦大学的Franz Király的工作成果给了我们答案。他们开发出一种新的模型来说明短距离、中距离与长距离跑步运动员所需的运动表现。

该模型甚至能够基于运动员在其他距离的表现,预测他在某一距离的能力。这也就是他们如何找到博尔特与莫法拉公平竞争距离的方法。

运动科学家早已知道,各种距离的跑步世界纪录遵循着一种幂律分布。当博尔特在2009年8月打破100米世界纪录时,他的速度刚超过每秒10米。而1英里的奔跑速度世界纪录刚超过每秒7米。2014年,肯尼亚选手DennisKimetto打破了马拉松世界纪录,在超过42公里的距离中,他的速度在每秒6米以下。

换句话说,平均速度的小幅提升将显著缩短能够打破世界记录的距离。但速度和距离之间的关联实际上是比这更为复杂。

当研究人员绘制的世界纪录的速度和距离的关系图时,发现该图呈现出一条带有一个奇怪拐点的幂律曲线。就好像是一条幂律曲线控制距离小于一英里的奔跑速度,而另一条控制距离大于一英里的奔跑速度。

对此,传统的解释是短跑运动员以无氧的方式消耗能量,而长跑运动员则以有氧的方式。拐点出现在运动员能量消耗中的交界点。

这个理论模型的问题是它的预测能力很有限。基于短跑运动员在中短距离的表现,模型无法测算出他在长距离跑步中的表现。同样,也无法测算马拉松运动员的短跑能力。

而Blythe和Király的工作成果在这一问题上有所突破。他们在英国建立了一个庞大的运动能力数据库,涵盖了从1954年至今的数据。他们采集了近150万个数据样本,包括男女老少及从业余水平到精英水平的所有人的跑步时间与距离。这些记录运用于10种不同的距离:100米,200米,400米,800米,1500米,1英里,5公里,10公里,半程马拉松(21公里)和42公里的全程马拉松。

然后,他们用机器学习算法找到了一个方程式,并通过利用这些数据,能够基于每个人在其他距离的表现,预测其在某一距离的表现。这个方程式也产生了著名的“折断的”幂律图,用以描述世界纪录的成绩分布。

找到能够描述任何分布的方程式并不难。只需要尽可能多的获取附加参数并以正确的方式调整曲线。果不其然,机器就找到了这样一个方程式。

但出人意料的是,这个方程式只使用了三个参数来描述数据库中的每一个人的表现。

在这个模型中,第一个参数是一个普通的幂律,它描述了一个人的整体表现。能够基于世界记录的分布来描述个人的整体表现,这一定程度上是令人惊讶的。然而,另外两个参数对该幂律图进行了修正,产生了折断的幂律图。

第二个参数描述运动员有着更大的耐力还是更快的速度。第三参数描述运动员在中距离的表现是否比短距离或者长距离更好。

这三个参数完整地描述了一个运动员在所有距离的个人表现,形成了一个全新的运动能力模型。“我们的研究提供了强有力的证据,证明通过这三个数值的汇总,能够捕捉到运动员的生理行为或社会行为特征,例如,训练状态、专长,以及运动员选择尝试的距离。”Blythe和Király说道。

在发现和测试了这个模型后,Blythe和Király利用它首次了解到了一些有关运动员的重要问题。例如,马拉松运动员一直所思考的一个问题:是提升更高的最快速度还是提升耐力?

Blythe和Király认为他们的模型给出了一个明确的答案:“只有一种方法能够成为一个快速的马拉松运动员,即具有高水平的耐力——而不是平稳地保持一个相对高的最快速度。”他们说道。

该模型还建议,如果一个运动员在超过10公里的距离上不具备世界级的水平,那么也就不会是42公里马拉松上有所建树。

研究人员甚至可以对每个运动员进行预测。其中就包括了5000米与10000米世界记录保持者埃塞俄比亚长跑运动员Kenenisa Bekele。Blythe和Király表示,他们的模型预测出Bekele能够在2小时36秒内跑完马拉松,这几乎比目前的世界纪录快了3分钟。

那么,回到长跑运动员与短跑运动员公平比赛的距离到底是多少这个原始问题,Blythe和Király同样也找到了答案。“我们预测,莫法拉和博尔特之间公平的竞赛的距离大概在492米”他们说道。

这是一场值得期待的比赛。

来源:http://www.technologyreview.com/view/537496/machine-learning-algorithm-calculates-fair-distance-for-a-race-between-usain-bolt-and/?utmcampaign=socialsync&utmmedium=social-post&utm_source=twitter

参考资料:arxiv.org/abs/1505.01147 :Prediction and Quantification of Individual Athletic Performance

Ref: arxiv.org/abs/1505.01147 : Prediction andQuantification of Individual Athletic Performance

大数据文摘编译者简介

有意联系栏目组成员的朋友,请给“大数据文摘”后台留言,附自我介绍及微信ID,谢谢。

王小珏

毕业于上海外国语大学,精通德语与英语,现就职于安永(中国)企业咨询有限公司,担任IT咨询业务线高级顾问。欢迎各位同行及对新技术感兴趣的朋友共同学习交流。

魏子敏

中国香港中文大学新闻学硕士。硕士期间利用大数据分析媒体报道的政治偏向,2012年美国大选期间参与美国加州民主党竞选工作,搜集选民数据并统计数据反映的政治走向。希望用更科学的数据做更好的新闻。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-08-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据文摘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档