数据分析师都做些什么

数据分析师,简单切词为“数据”,“分析”,“师”。因此,获取必要的数据,分析这些数据,然后从数据中发现一些问题提出自己的想法,这就是一个数据分析师的基本工作内容。

自己做了两年数据分析师,真的觉得古语说的对,“功夫在诗外”。一名好的数据分析师,接到一个需求时,会更多考虑这个需求本身,包括要做的东西是什么,为什么这么做,还可以怎么做,怎么去做,关键点是什么。都想清楚了,才去动手做。建议任何一名数据分析人员,都能在做以前把问题想清楚,确认清楚,不要等到做完才发现自己做错了,那样会很浪费时间。自己这方面曾犯过N多错误。

下面简单谈下做一名数据分析师要经历的几个步骤:

(1)获取数据

获取相关的数据,是数据分析的前提。每个企业,都有自己的一套存储机制。比如淘宝,所有的数据都在hadoop上,很多数据都要经过HADOOP,hive来获取。因此,基础的SQL语言是必须的。具备基本SQL基础,再学习下HIVE的细节的语法,基本就可以通过HIVE拿到很多数据了。每个需求明确以后,都要根据需要,把相关的数据获取到,做基础数据。

(2)数据处理

获取数据,把数据处理成自己想要的东西,是一个关键点。很多时候,有了数据不是完成,而是分析的开始。数据分析师最重要的工作就是把数据根据需求处理好,只有数据跟需求结合起来,才能发挥数据的价值,看到需求的问题和本质所在。如果连数据都没处理好,何谈从数据中发现问题呢?

对于数据的处理,有两种形式:

a>如果初步提取的数据是在LINUX上,建议学一门脚本语言,比如AWK,或者PYTHON。如果掌握一门脚本语言,不仅可以在LINUX系统上写很多自动脚本来运行,会大大节省自己的时间,而且可以通过脚本语言把基础数据处理成自己想要的任何形式,直接可以使用。

b>如果数据没有在LINUX上,那可以download,然后通过其他统计软件来处理。个人推荐Sas或者R语言。SAS的强大,不必多说。没有SAS解决不了的问题,而且SAS也有SQL,处理起来也方便。R语言最近也很火,而且免费,packages越来越多,画图也简单,类似Matlab。如果前期数据处理的好,后续只需要通过R或者SAS画一些图就可以了。在数据分析师的世界,按照价值排序,图>表>文字。

(3)分析数据

这里的数据,包括图,表,数字几种。分析数据是整个分析的关键,也考验分析师的水平。好的分析师,可以根据趋势图,对比数据,敏锐的观察到很多问题。可是这需要对业务,对数据有很深的了解,才会把数据和业务结合起来,发挥两者的价值,完成需求。所以,一名数据分析师,要把更多的时间放在了解业务上。只有业务了解,细节清楚,才会明白业务变动可能引起的数据指标的变动,也会在后续的需求分析中,更快更全面的解决其他人提出的问题。可能很多人都很困惑,怎么才能“敏锐”的观察到数据的变动呢,我为什么怎么也发现不了问题呢?个人感觉可以通过以下方法,来慢慢锻炼:

a>多问几个为什么。比如,看到一些指标,就想想这些指标代表什么,用自己的话可以怎么理解;看到一条趋势线有波动,就想想为啥子某个点异常波动呢?多问问问题,自己就会加深对业务和指标关联的敏感性。

b>借鉴统计方法。统计学中,都会有一些横纵对比,趋势分析等等。对比,在分析师数据时候,是一个很重要的东西。任何东西,也因为了对比,才会有高有低,有长有短。另外,分布,也是一个很好的东西。分布的变化,就意味着变动,变动的发展结果,就能知道业务发展的好坏。再次,占比啊等等,都是很简单但是实用的方法。

c>向师兄请教。有的时候,一个问题,自己沉迷其中不能自拔,旁观者一句话,就能点清自己的思路。当自己分析数据不得要领的时候,就多请教师兄。

(4)展示成果

分析数据以后,解决需求的问题,就需要汇总分析的成果,给到其他人。可能分析的过程,拿到的数据有很多,需要全部给其他人么?怎么去罗列这些数据呢?可能很多人都犯难。有一次,一个同学来问我,她有很多数据,但是就是不知道该怎么组织,才能证明自己的结论是对的。其实,作为一名数据分析师,就是根据数据,把问题解决,提出一两条参考建议给到需求方就OK了。因此,回复的结果简单明了就好。如果是回复一封邮件,可以这样来做:

a>邮件正文,先写主要结论,即根据数据和需求,有什么结论。这样大家第一眼就能抓到最关键的东西,可能不需要看那些详细的数据;

b>如果觉得有必要,就在下面再把分析过程写进去;

c>如果图和图表不多,可以添加到邮件第三部分。毕竟放上数据,任何同学有疑问,可以随时去看数据。如果图和图表实在太多,就放到附件!

其实,做一名数据分析师,真的不容易,不仅要懂业务,还要会技术,更要敏锐发现问题,总结,还要提出建议。自己干了N多工作,最后还不一定能得到一个好的结果。做了两年数据分析师,自己的重心也在慢慢的转移。从刚开始技术学习,到后面技术+业务的结合,到现在自己又钻到业务,研究业务,慢慢发现:一名好的数据分析师,是一个好的产品的规划者和行业的领跑者。

原文发布于微信公众号 - PPV课数据科学社区(ppvke123)

原文发表时间:2014-02-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏cloudskyme

有效的沟通技巧

完整的沟通过程:信息发送、接收、反馈 【管理名言】面对面的沟通是最好的沟通方式 ? 沟通的过程是一个完整的双向沟通的过程:发送者要把他想表达的信息、思想和情感,...

3527
来自专栏高性能服务器开发

如何招到一个靠谱的程序员

我的上一份工作是在一家世界500强金融集团担任架构师,当时,公司的IT团队规模将近2000人。与其他IT公司一样,程序员的流动性也比较高,而作为架构师,我需要为...

1422
来自专栏编程

我给所有新手程序员的建议

欢迎来到编程的世界! 1. 编程真的很难 无论你多擅长编程,唯一能降低开发速度的,就是学习和解决问题的能力。而当你越是擅长编程的时候,这种情况就可能越明显。这是...

1869
来自专栏Java帮帮-微信公众号-技术文章全总结

​【大牛经验】技术做产品的经验教训

摘要: 一个程序员开发自己的产品,是需要跳出技术的小圈子的 反思自己 做自己的手机应用并销售,到现在,大概有 3 个月的时间了,特别是新版本出来的 20 多天,...

4035
来自专栏华章科技

张小龙内部分享:我们只做一件事情,产品只有一个定位

张小龙说:“用户要的是你给他提供了什么新的体验。”一起来学习一下张小龙牛掰的产品思维吧。

1551
来自专栏Java后端技术栈

怎么样才算一个靠谱的程序员!

我的上一份工作是在一家世界500强金融集团担任架构师,当时,公司的IT团队规模将近2000人。与其他IT公司一样,程序员的流动性也比较高,而作为架构师,我需要为...

631
来自专栏后端技术探索

架构的本质

目前讨论架构实操(术)的文章较多,讨论架构理念(道)的较少,本文基于作者在大型电商系统架构方面的一些实践和思考,和大家聊聊架构理念性的东西,希望能够抛砖引玉,推...

962
来自专栏程序员互动联盟

嵌入式,过时了没?

疑惑一 作者你好,我是本科生,之前是学java的,但是后来签的工作是嵌入式软件开发,我对嵌入式开发不太了解的,这行有前景吗? 这是小编在后台接收到的小伙伴的疑惑...

3867
来自专栏数据科学与人工智能

【数据分析】创建定性用户画像

在产品研发过程中,确定明确的目标用户至关重要。不同类型的用户往往有不同甚至相冲突的需求,我们不可能做出一个满足所有用户的产品。   为了让团队成员在研发过程...

2719
来自专栏程序手艺人

技术人的公众号

38211

扫码关注云+社区

领取腾讯云代金券