不加班,上班可以打游戏,年薪20万起,什么职位这么牛逼...

“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”——全球知名咨询公司麦肯锡

数据分析师与体育产业

数据分析师指的是不同行业中,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人员。

在传统体育项目中,譬如职业足球、职业篮球,相关的球队都配备了相应的数据师团队,他们的作用是为他们的竞技项目做出科学、合理的分析,以便做出正确的决策,拿NBA为例,在一个赛季82场比赛中相应产生的数据达到以亿计算,在观看直播时每位球员的控球率,得分率,助攻率,又细节到该球员在球场各个不同位置的命中率,以及许多我们看不到的数据记录,大大小小的数据充斥着职业赛场的比赛,也成为比赛双方研究对方的样本。

我国女排就有专门的数据分析师,袁灵犀,作为中国女排数据分析师,他不仅懂排球业务,懂各种排球打法,还要懂数据分析。他通过数据分析软件通过临场的数据分析告诉教练组最佳对应策略,以及如何调整攻击防守模式。

你了解电竞数据分析师吗? 

电竞爱好者规模

国内电竞已形成巨大市场,具备深入商业化基础我国拥有世界55%电竞爱好者和33%的电竞观众。我国拥有全世界最大、增速最快的电竞爱好者和电竞观众群体,但电竞爱好者比例较低。中国电竞爱好者在过去保持了17%的年均复合增长,总人数已在2014年突破4000万人,在世界8900万电竞爱好者总数中的占比超过55%。我国电竞人数增长在未来有望得到保持,并预计在2017年达到6200万人。2014年我国电竞游戏直播用户规模已超过3000万人,在全球8900万电竞直播用户中的比例达33%。但相对我国5.17亿游戏玩家,电竞爱好者比例仅占7.7%,比例过低。 

电竞市场规模

中投顾问发布的《2016-2020年中国电子竞技产业深度调研及投资前景预测报告》数据显示:2010年我国电竞市场规模仅为44.1亿元,到2015年则达到269.1亿元,6年间增幅达513.6%。2015年包括端游、网游、社交游戏、移动游戏、单机游戏在内的中国游戏市场销售收入达1407亿元。其中电子竞技占比19.2%,中国也已经超过美国,成为全球第一大电子竞技市场。

电竞用户规模

2014年国内整体电竞用户规模(除移动电竞游戏及赛事用户)达7300万人。预计2014到2018年,中国电竞用户规模会以20%以上的速度连年增加。2015年是中国电竞用户数量增加最快的一年,达到9800万人左右,增幅为35.3%,2016年有望突破1亿大关。中国电竞用户主要分为“观看电竞赛事”(64.4%)、“参与电竞赛事”(10.7%)、“经常玩电竞游戏”(54.9%)三类。在“观看电竞赛事”和“经常玩儿电竞游戏”的用户中,均有将近6成的用户“只看不比赛”和“只玩不比赛”,围观用户不占少数。而由于电子竞技设定类似体育项目严格的规则和一定的难度系数,使得“参加比赛”的电竞用户仅占10.7%。

电竞市场投资

电竞可谓是近几年来发展最迅猛的行业之一,而且其发展趋势也未见放缓,仍然保持着快速增长。很多人特别是家长,对电竞的看法产生了很大改变,从以前的抵制排斥到逐渐接受甚至有的支持它,投资者亦此。每年都有一些有眼光的投资者投身电竞行业,这无疑对电竞业的发展提供了巨大动力,为人乐道的电竞投资案例也随口能说出不少,例如中国万达集团董事长之子、被称为中国第一富二代的王思聪在2011年大手笔打造电竞帝国创立IG电竞俱乐部,以及NBA球队或球员收购电竞战队,台湾艺人周杰伦创办J Team战队等等。香港电竞圈传出劲爆消息,香港首富李嘉诚斥资5,000万美元加入电竞行业!

电竞数据分析师

在DOTA2(http://dota2.uuu9.com/)的赛场上,选手们的比赛行为也让我们从中能寻觅到蛛丝马迹,我们平时大多从DOTAMAX上查询我们的比赛数据,实际上,在电竞职业化发展的今天,新兴诞生了一门职业——电竞数据分析师。  

通过分析BP数据,能够在一定程度上反应某些队员更偏爱、擅长那些英雄。DOTA2比赛中,关于眼位的分析还是有迹可循的,各个战队每个队员都有自己的习惯性眼位,比如FY如果在夜魇,他在给下路列单的三冰插完线眼保护眼后,如果还剩一个假眼他有80%会插在下路河道附近。例如我们队自己的眼位就有一定的规律,这也说明我们的眼位做的并不好,容易被对手研究。

这些数据还是挺有用的,比较能够反应选手和团队的特点。作为对手,应充分利用这样的信息。

----国内某DOTA2队伍的数据分析师

如果你看到这儿,你可能大概猜到题目中那个职位是干什么的了。各位,您看好了,这是猎聘网上海某企业电竞机器学习工程师的招聘JD:

各位看官看到了吧,只要你掌握机器学习算法,有一年1上的项目经验,那么你就有可能拿到这个无数人羡慕嫉妒恨的"别人家的工资"。

机器学习工程师到底是个什么鬼?

机器学习是数据挖掘的一种方法,特点是利用计算机的算力从海量数据中提取有规律的知识,相较于数据分析,机器可以自己从数据中提取数据特征并建立关联关系。而机器学习工程师就是袁灵犀一样从数据中挖掘价值的技术专家,他们除了要掌握必要的数学知识和熟悉业务场景,还要掌握机器学习算法、分布式编程框架和平台。 如果还不了解机器学习,请阅读本文底部的相关阅读,此处不再过多赘述。

如果你想进入这个领域,我们对大多数入门者我们提供了一个比较通用的学习路径,希望能降低大家的学习门槛。 这个学习路径如下:

机器学习是一个将数学/算法理论和工程实践紧密结合的领域,需要扎实的理论基础帮助引导数据分析与模型调优,同时也需要精湛的工程开发能力去高效化地训练和部署模型和服务。

下面就上述图中的部分,展开来说明:

一、数学基础

基本所有常见机器学习算法需要的数学基础,都集中在微积分、线性代数和概率与统计当中。

1)微积分

  • 微分的计算及其几何、物理含义,是机器学习中大多数算法的求解过程的核心。比如算法中运用到梯度下降法、牛顿法等。
  • 凸优化和条件最优化 的相关知识在算法中的应用随处可见,如果能有系统的学习将使得你对算法的认识达到一个新高度。

2)线性代数

  • 大多数机器学习的算法要应用起来,依赖于高效的计算,而大多数的循环操作可转化成矩阵之间的乘法运算,这就和线性代数有莫大的关系了。
  • 向量的内积运算更是随处可见。
  • 矩阵乘法与分解在机器学习的主成分分析(PCA)和奇异值分解(SVD) 等部分呈现刷屏状地出现。

3)概率与统计

  • 极大似然思想、贝叶斯模型 是理论基础,朴素贝叶斯(http://www.ppvke.com/Blog/archives/25093)(Naive Bayes (http://www.ppvke.com/Blog/archives/25211))、语言模型(N-gram)、隐马尔科夫(HMM)、隐变量混合概率模型是他们的高级形态。
  • 常见分布如高斯分布是混合高斯模型(http://www.ppvke.com/Blog/archives/24049)(GMM)等的基础。

二、典型算法

  • 处理分类问题的常用算法包括:逻辑回归(工业界最常用),支持向量机,随机森林,朴素贝叶斯(NLP中常用),深度神经网络(视频、图片、语音等多媒体数据中使用)。
  • 处理回归问题的常用算法包括:线性回归,普通最小二乘回归(Ordinary Least Squares Regression),逐步回归(Stepwise Regression),多元自适应回归样条(Multivariate Adaptive Regression Splines)
  • 处理聚类问题的常用算法包括:K均值(K-means(http://www.ppvke.com/Blog/archives/25352)),基于密度聚类,LDA等等。
  • 降维的常用算法包括:主成分分析(PCA),奇异值分解(SVD) 等。(http://www.ppvke.com/Blog/archives/35335)
  • 推荐系统的常用算法:协同过滤算法(http://www.ppvke.com/Blog/archives/27413)
  • 模型融合(model ensemble)和提升(boosting)的算法包括:bagging,adaboost,GBDT,GBRT
  • 其他很重要的算法包括:EM算法(http://www.ppvke.com/Blog/archives/35474)等等。

三、编程语言、工具和环境

python有着全品类的数据科学工具,从数据获取、数据清洗到整合各种算法都做得非常全面。

1.pandas:模拟R,进行数据浏览与预处理。

2.numpy:数组运算。

3.scipy:高效的科学计算。

4.matplotlib:非常方便的数据可视化工具;

5.scikit-learn:远近闻名的机器学习package;

6.libsvm:高效率的svm模型实现;

7.keras/TensorFlow:机器学习框架,对深度学习感兴趣的同学,也很方便地搭建自己的神经网络了。

8.nltk:自然语言处理的相关功能做得非常全面,有典型语料库,而且上手也非常容 易;

9.ipython notebook:能直接打通数据到结果的通道,方便至极。强力推荐。

四、如何获取数据和项目经验

第一是积极参加国内外各种数据挖掘竞赛,数据直接下载下来,按照竞赛的要求去不断优化,积累经验。国外的Kaggle和国内的DataCastle 以及阿里天池比赛都是很好的平台,你可以在上面获取真实的数据和数据科学家们一起学习和进行竞赛,尝试使用已经学过的所有知识来完成这个比赛本身也是一件很有乐趣的事情。和其他数据科学家的讨论能开阔视野,对机器学习算法有更深层次的认识。

第二是找一份和数据打交道的实习工作,从实践中获取项目经验。

如果你一定有编程经验,想走捷径,可以参加一些《机器学习和深度学习》的课程。

END.

原文发布于微信公众号 - PPV课数据科学社区(ppvke123)

原文发表时间:2018-03-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏镁客网

人类打游戏又输了!OpenAI以2:1战胜DOTA 2半职业选手 | 热点

北京时间早晨五点多,来自OpenAI的人工智能“OpenAI Five”在5v5的战局中,以3:2的成绩战胜了人类半职业DOTA高手队。这是继6月份对战之后,“...

10130
来自专栏京东技术

「仓储网络智能库存管理问题」最好的答案 | GOC大赛

本篇特约全球运筹优化挑战赛-仓储物流智能库存管理赛题冠军 TP_AI队伍分享赛题解析。来自清华大学经管学院的闵旭和来自北京大学人工智能创新中心的马思源因为比赛走...

45820
来自专栏新智元

更正 |《财富》万字长文回溯深度学习革命,盘点 16 大历史时刻

【新智元导读】《财富》封面文章报道深度学习推动的人工智能如何在整个计算生态系统引发革命。文章从深度学习发展的历史关键点入手,介绍重大的标志性技术突破,讲述了 H...

34870
来自专栏华章科技

万字长文回溯深度学习革命,盘点 16 大历史时刻

编译来源:http://fortune.com/ai-artificial-intelligence-deep-machine-learning/

13340
来自专栏PPV课数据科学社区

《财富》万字长文回溯深度学习革命,盘点 16 大历史时刻

【导读】《财富》封面文章报道深度学习推动的人工智能如何在整个计算生态系统引发革命。文章从深度学习发展的历史关键点入手,介绍重大的标志性技术突破,讲述了 Hin...

37780
来自专栏新智元

深度 |《财富》万字长文回溯深度学习革命,盘点 16 大历史时刻

【新智元导读】《财富》今日刊文,深度报道阐述深度学习推动的人工智能如何在整个计算生态系统引发革命。文章从深度学习发展的历史关键点入手,介绍重大的标志性技术突破,...

34950
来自专栏PPV课数据科学社区

干货分享 | 千人专家朱晓天:大数据与人工智能在金融领域的应用

12月9日,以“数智金融-大数据的创新与应用”为主题的第二届中欧大数据金融论坛在深圳举行,国家千人计划金融领域特聘专家、北京大学汇丰商学院金融实验...

39250
来自专栏AI科技大本营的专栏

热门 | Google Brain前员工深度盘点2017人工智能和深度学习各大动态

翻译 | AI科技大本营 参与 | shawn 编辑 | Donna 2017年是人工智能井喷的一年。Google Brain团队前成员Denny Britz在...

31860
来自专栏机器之心

谁来治好AI的「幻觉」?面对众多对抗样本攻击,深度神经网络该何去何从

选自Wired 作者:Tom Simonite 机器之心编译 参与:路雪、黄小天 2 月 3 日,来自 MIT、UC Berkeley 的 Athalye 等人...

37160
来自专栏镁客网

重磅 | 周志华的“开学第一课”:南大携手英特尔,首家AI研究中心今日成立

英特尔和南大的携手,既能够带来最先进学术研究服务产业,也可以让学生了解到最新的硬件和技术发展。

10710

扫码关注云+社区

领取腾讯云代金券