前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据分析师,你是什么段位?

数据分析师,你是什么段位?

作者头像
herain
发布2022-04-27 16:30:40
5000
发布2022-04-27 16:30:40
举报
文章被收录于专栏:数据指象

文章期号:20190702

不断磨练,不断进阶,你就是王者

数据分析师的每一个段位的成长都是围绕着“数据分析链条环”技能提升和工具改造来完成数据分析能力的进阶。

数据分析师的成长”离不开【两个维度】的关联分析:成长段位+数据分析链条环的升级。

数据分析能力的提升过程简单的描述为:从感性经验的依赖开始不断的逼近理性数据的描述推断。

数据分析本身是:数学统计+工程效用产生的数据科学,是一个交叉性的学科。

这里为了更好的作答,我们将数据分析师的成长段位分为:青铜,白银,黄金。

数据分析链条环:资料数据的收集,资料数据的清理,资料数据的存储,资料数据的分析,资料数据的可视化。

1,青铜阶段的分析链条环 (薪资:8k-10k):

  • 怎么收集呢?我们百度搜索,下载,复制,粘贴,手工录入excel等,偏向耗时耗力的人工操作。
  • 怎么清洗数据呢?人工验证,手动修复,excel的查找替换。
  • 怎么存储数据呢?存储在excel,csv文件,U盘,电脑磁盘。
  • 怎么分析数据呢?计算器(为零,为零的那种),excel做简单的数据描述,最大值,最小值,平均值,求和
  • 怎么可视化呢?excel绘制简单的条形图,饼图,折现图,制作PPT

纵使我们的excel熟练了掌握各种内置函数,宏,LOOKUP 等高级技巧,也无妨突破excel在大数据面前的苍白与无力。好比一位熟练了刀枪棍棒的武林大侠,也敌不过小米步枪的致命一击。数据分析师能力的进阶第一步是要突破工具本身对自己的物理制约。需要不断的学习新工具,寻找更高的天花板。也只能做做漂亮的数据图表:

2,白银阶段的分析链条环 (薪资:15k-25k):

  • 怎么收集呢?python网络爬虫,shell日志批处理等开始依赖计算机程序来收集。
  • 怎么清洗数据呢?SPSS软件工具,R语言,python脚本。
  • 怎么存储数据呢?存储到关系型数据库或者非关系数据库,如:ACCESS, MYSQL, SQL sever,mongodb等。
  • 怎么分析数据呢?利用数据查询语句SQL, 聚合函数,分组,排序, PYthon工具包numPy,Pandas。
  • 怎么可视化呢?结合echart.js, Pivot Tables,matplotlib程序化出图。

这里顺便科普数据分析常用的Python工具包,祝你升级加薪:

代码语言:javascript
复制
numpy:数组、 向量、 矩阵、 数值运算等
scipy:统计推断、 统计检验等
pandas:数据读取、 数据整合、 数据清洗整理等
statsmodel:统计建模、 模型验证等
scikit-learn:数据清洗、 机器学习建模、 交叉验证等
matplotlib:绘图
nltk:自然语言处理

3,黄金阶段的分析链条环 (薪资:25k-35k):

  • 怎么收集呢?集成的数据平台,负责实时同步业务数据,离线日志数据格式化到数据库。
  • 怎么清洗数据呢?程序业务逻辑控制,保证数据的格式统一,数据维度和指标的语意清晰。
  • 怎么存储数据呢?存储在hadoop集群的hdfs, Hbase, Apache Kylin, Baidu Palo 等分布式存储平台。
  • 怎么分析数据呢?HIVE,SPARK结构化查询,异常值监控,ABtest,多渠道流量监控,用户细化管理,机器推荐,搜索优化,交易预测。
  • 怎么可视化呢?图表一次定制多次可用,预测走势图,核心指标监控仪表盘,分层用户转化漏斗,AB测试等多样化。

黄金阶段:需要脱离对数据的简单描述,迈向深层次的分析推断,数据最大的价值就对未知事态的判断预测,机器学习实现对无规则海量数据完成普遍性的归纳。

4,最高的进阶 (薪资:40k+):

数据分析师在数据和图表的基础上,能说话,有话说,说的好,意见建议能落地。能够主导一个业务的流程优化。才是数据分析师最高的能力,也只有这样才能发挥出一个优秀数据分析师的真正价值。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-07-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据指象 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档