「体育大数据」分析解读NBA背后的大数据

从古希腊、古罗马到日不落帝国,到当今的美利坚合众国,自古以来强盛的王朝似乎从来都是和发达的体育分不开的。但是身处科技、金融、军事、体育强国的美国现在似乎是把体育玩到了一个新的境界,那就是:“大数据驱动的体育”。

NBA是美国各个职业体育中的佼佼者,虽然在总营业额上次与美式足球NFL和职业棒球MLB列第三位,但是由于所需要的球员数目远远少于前面二者,NBA球员的年平均工资(515万美金,2012年数据),中位工资(230万美金)都远远高于所有职业体育项目。NBA的成功商业运作背后有着非常成功的IT支持。

经常看NBA比赛的朋友一定知道,NBA比赛是一场视+听的盛宴,“视”不用多说,高清分辨率,多镜头多视角,精彩镜头慢动作回放等等,依赖最专业的摄像设备。“听”的部分呢?除了解说员熟悉的声音魅力,本身的体育经验和素养之外,在NBA比赛的解说中充满了有趣的、智慧的有关球队、球员,球赛的知识,让大家有“如数家珍”的感觉,例如:在圣诞节的NBA比赛中,解说员会告诉我们从1947年开始NBA圣诞节特别节目开始,纽约尼克斯队48次出现在圣诞节比赛中,洛杉矶湖人队39次,波士顿凯尔特人队29次参与圣诞比赛。又例如:解说员经常会说类似“到第三节时,科比和奥尼尔合起来得分超过55分,湖人队没有输过”,“姚明背靠背比赛的得分比两场比赛间休息2天的得分平均高2.6分”等等。

那么,这些“如数家珍”是如何做到的呢?

其实NBA比赛的背后,有着强大的数据统计,数据挖掘系统。首先,NBA对一个体育比赛描述的量化是到了极致的地步,从得分,进攻,防守,做球等几大类统计了多达90多项技术指标,例如我们比较好理解的得分,得分率,三分球命中率等等,还有一些不太常见的,如:对手得分,对手丢球,进攻篮板获得率等等。我见过的最奇怪的技术指标是PIE(Player Impact Estimate),

中文大约翻译为“球员贡献度”吧,可以看出公式极复杂,大致的意思是把一个球员整场比赛的得分,阵地战得分,罚球得分等主动得分,助攻、抢断等技术指标加权相加,减去犯规、丢球等负面的技术指标……说实话,这个指标恐怕就是在教练员那里有用吧,好像还从来没有在电视上听过把球员这样比较,但是相信这些指标在某些场景是非常有用的。相信还有一些类似A球员和B球员得分相关性或者得分总和对球队胜率影响的二级统计指标出现吧,才能指导解说员在比赛过程中解释得精彩、生动。

有了这样的严格、精细地量化,就有了科学的态度,也就有了科学的指导思想和手段, 这些数据不单单是为NBA的教练员来策划比赛,或者老板们决定球员生杀的时候用的,NBA非常聪明,把这些数据开放出来,让大家都对它们感兴趣,让每个球迷都有可能“如数家珍”,增加球迷们对球星们的迷恋程度,也从而增加对NBA比赛的热爱程度,

在NBA的官方网站上,有专门的统计页面,这里面把NBA历史上收集的几乎所有球员、球队信息以非常易用的方式提供出来,后台使用了SAP HANA这样的内存分析数据库,以应对网站数以万计的访问者的访问,提高随机、灵活查询的速度,提供了一种前所未有的用户体验,对上百个指标的不同过滤、统计、排序等等,可以定制分析报表,而不需要大量固化报表格式和场景。 一个看似并不“高科技”的体育项目,都可以如此利用“大数据”的手段,以提供非常优秀的用户体验,从数据收集到数据统计和挖掘,到优秀的数据展现,非常值得我们的企业们学习。

本文分享自微信公众号 - 大数据文摘(BigDataDigest)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2014-01-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏腾讯社交用户体验设计

ISUX Xcube智能一键生成H5

51620
来自专栏腾讯高校合作

【倒计时7天】2018教育部-腾讯公司产学合作协同育人项目申请即将截止!

16220
来自专栏钱塘大数据

中国互联网协会发布:《2018中国互联网发展报告》

在2018中国互联网大会闭幕论坛上,中国互联网协会正式发布《中国互联网发展报告2018》(以下简称《报告》)。《中国互联网发展报告》是由中国互联网协会与中国互联...

13850
来自专栏Ken的杂谈

【系统设置】CentOS 修改机器名

18430
来自专栏前端桃园

知识体系解决迷茫的你

最近在星球里群里都有小伙伴说道自己对未来的路比较迷茫,一旦闲下来就不知道自己改干啥,今天我这篇文章就是让你觉得一天给你 25 个小时你都不够用,觉得睡觉都是浪费...

22640
来自专栏微信公众号:小白课代表

不只是软件,在线也可以免费下载百度文库了。

不管是学生,还是职场员工,下载各种文档几乎是不可避免的,各种XXX.docx,XXX.pptx更是家常便饭,人们最常用的就是百度文库,豆丁文库,道客巴巴这些下载...

44830
来自专栏钱塘大数据

理工男图解零维到十维空间,烧脑已过度,受不了啦!

让我们从一个点开始,和我们几何意义上的点一样,它没有大小、没有维度。它只是被想象出来的、作为标志一个位置的点。它什么也没有,空间、时间通通不存在,这就是零维度。

35230
来自专栏haifeiWu与他朋友们的专栏

复杂业务下向Mysql导入30万条数据代码优化的踩坑记录

从毕业到现在第一次接触到超过30万条数据导入MySQL的场景(有点low),就是在顺丰公司接入我司EMM产品时需要将AD中的员工数据导入MySQL中,因此楼主负...

31040
来自专栏FSociety

SQL中GROUP BY用法示例

GROUP BY我们可以先从字面上来理解,GROUP表示分组,BY后面写字段名,就表示根据哪个字段进行分组,如果有用Excel比较多的话,GROUP BY比较类...

5.2K20
来自专栏怀英的自我修炼

考研英语-1-导学

英二图表作文要重视。总体而言,英语一会比英语二难点。不过就写作而言,英语二会比英语一有难度,毕竟图表作文并不好写。

12410

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励