数据分析师的能力和工具体系

文章来自天善智能大数据社区 www.hellobi.com 博客专栏 陈丹奕 欢迎更多在大数据、数据分析、数据挖掘和商业智能 BI 领域的一线技术爱好者、咨询顾问、CTO等加入 www.hellobi.com 社区,开启您的个人博客专栏,共同推动大数据行业和技术的进步。

数据分析师的能力体系

如下图所示

数学知识

数学知识是数据分析师的基础知识。

对于初级数据分析师,了解一些描述统计相关的基础内容,有一定的公式计算能力即可,了解常用统计模型算法则是加分。

对于高级数据分析师,统计模型相关知识是必备能力,线性代数(主要是矩阵计算相关知识)最好也有一定的了解。

而对于数据挖掘工程师,除了统计学以外,各类算法也需要熟练使用,对数学的要求是最高的。

分析工具

对于初级数据分析师,玩转Excel是必须的,数据透视表和公式使用必须熟练,VBA是加分。另外,还要学会一个统计分析工具,SPSS作为入门是比较好的。

对于高级数据分析师,使用分析工具是核心能力,VBA基本必备,SPSS/SAS/R至少要熟练使用其中之一,其他分析工具(如Matlab)视情况而定。

对于数据挖掘工程师……嗯,会用用 Excel 就行了,主要工作要靠写代码来解决呢。

编程语言

对于初级数据分析师,会写 SQL 查询,有需要的话写写 Hadoop 和 Hive 查询,基本就OK了。

对于高级数据分析师,除了SQL以外,学习 Python 是很有必要的,用来获取和处理数据都是事半功倍。当然其他编程语言也是可以的。

对于数据挖掘工程师,Hadoop得熟悉,Python/Java/C++至少得熟悉一门,Shell 得会用……总之编程语言绝对是数据挖掘工程师的最核心能力了。

业务理解

业务理解说是数据分析师所有工作的基础也不为过,数据的获取方案、指标的选取、乃至最终结论的洞察,都依赖于数据分析师对业务本身的理解。

对于初级数据分析师,主要工作是提取数据和做一些简单图表,以及少量的洞察结论,拥有对业务的基本了解就可以。

对于高级数据分析师,需要对业务有较为深入的了解,能够基于数据,提炼出有效观点,对实际业务能有所帮助。

对于数据挖掘工程师,对业务有基本了解就可以,重点还是需要放在发挥自己的技术能力上。

逻辑思维

这项能力在我之前的文章中提的比较少,这次单独拿出来说一下。

对于初级数据分析师,逻辑思维主要体现在数据分析过程中每一步都有目的性,知道自己需要用什么样的手段,达到什么样的目标。

对于高级数据分析师,逻辑思维主要体现在搭建完整有效的分析框架,了解分析对象之间的关联关系,清楚每一个指标变化的前因后果,会给业务带来的影响。

对于数据挖掘工程师,逻辑思维除了体现在和业务相关的分析工作上,还包括算法逻辑,程序逻辑等,所以对逻辑思维的要求也是最高的。

数据可视化

数据可视化说起来很高大上,其实包括的范围很广,做个 PPT 里边放上数据图表也可以算是数据可视化,所以我认为这是一项普遍需要的能力。

对于初级数据分析师,能用 Excel 和 PPT 做出基本的图表和报告,能清楚的展示数据,就达到目标了。

对于高级数据分析师,需要探寻更好的数据可视化方法,使用更有效的数据可视化工具,根据实际需求做出或简单或复杂,但适合受众观看的数据可视化内容。

对于数据挖掘工程师,了解一些数据可视化工具是有必要的,也要根据需求做一些复杂的可视化图表,但通常不需要考虑太多美化的问题。

协调沟通

对于初级数据分析师,了解业务、寻找数据、讲解报告,都需要和不同部门的人打交道,因此沟通能力很重要。

对于高级数据分析师,需要开始独立带项目,或者和产品做一些合作,因此除了沟通能力以外,还需要一些项目协调能力。

对于数据挖掘工程师,和人沟通技术方面内容偏多,业务方面相对少一些,对沟通协调的要求也相对低一些。

快速学习

无论做数据分析的哪个方向,初级还是高级,都需要有快速学习的能力,学业务逻辑、学行业知识、学技术工具、学分析框架……数据分析领域中有学不完的内容,需要大家有一颗时刻不忘学习的心。

以上,就是我对数据分析师能力的总结。

数据分析师的工具体系

一图说明问题

可以从图上看到,Python 在数据分析中的泛用性相当之高,流程中的各个阶段都可以使用Python。所以作为数据分析师的你如果需要学习一门编程语言,那么强力推荐 Python~

原文发布于微信公众号 - 数据的力量(shujudeliliang)

原文发表时间:2016-09-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

大数据如何在企业落地

经常听到很多大数据的概念和趋势,但是落地而务实的介绍相对较少。笔者根据在互联网和数据领域的实际从业经验,总结出数据价值金字塔在企业运营中的应用模型。该...

3278
来自专栏CDA数据分析师

大数据如何在企业中落地

经常听到很多大数据的概念和趋势,但是落地而务实的介绍相对较少。笔者根据在互联网和数据领域的实际从业经验,总结出数据价值金字塔在企业运营中的应用模型。该模型对应的...

25910
来自专栏互联网杂技

类目场馆建设设计方法-交互研究思路总结

Part 1:全流程交互设计-馆区建设 在馆区建设与版本迭代中,交互在其中扮演着重要的角色;一个全流程的馆区交互设计应该综合考虑:运营策略分析、竞品分析、数据分...

3417
来自专栏腾讯研究院的专栏

芝加哥大学James A. Evans:大数据的大蓝图

大数据似乎在一夜之间迅速走红,它势不可挡地冲击着金融、零售等各个行业。云计算将如何改变计算的世界?未来将有怎样的应用前景?如何解决“信息孤岛”的问题?大数据...

3266
来自专栏张俊红

读书笔记|互联网运营之道

关于本书 运营的重要性在互联网公司发展中是不可或缺的,尤其是在产品同质化越来越厉害的当下,运营成了同质化产品竞争的法宝,越到产品后期,运营为产品带来的差异化价值...

3415
来自专栏人工智能快报

美国国家科学基金会投3至5千万美元研发协作式机器人

2015年12月,美国国家科学基金会(NSF)宣布将投资3至5千万美元用于研发协作式机器人,相关经费将用于支持25至70个科研项目。NSF将从14个重点方向开展...

3278
来自专栏Java学习网

程序员从优秀到卓越的几点建议

程序员从优秀到卓越的几点建议 和其他技术一样,编程也有层次阶段之分——业余爱好者、普通级别和专家级别。关于这个问题我问过很多很多次—— 如何从优秀到卓越?这是一...

3166
来自专栏架构师之旅

为什么你总成为不了架构师?

一、什么是架构师? 其实架构师的概念并不是从程序开发专业一诞生就有的职位概念,架构师(Software Architect)仅仅是最近几年提出来的一个职位,貌似...

22510
来自专栏云计算D1net

2015是云计算3.0及云端融合的时代

最近几年,云计算的应用及落地被谈论了很多,也在很多方面被实践着。黄罡,北大软件所副所长,一直专注于云计算技术领域的研究,在他看来:云计算是新一代IT引擎,从技术...

4219
来自专栏数据的力量

小蚊子:如何成为一名合格的数据分析师?

1092

扫码关注云+社区