专栏首页接地气学堂数据分析师发展的五大问题,一次扫清!

数据分析师发展的五大问题,一次扫清!

马上就是2020年了,新年将至,很多同学都在思考职业发展路径问题。最近咨询陈老师的也很多,一个很普遍被问到的,就是:数据分析师的红旗,到底能打多久?今天集中解答一下。还是陈老师的一贯风格,不吹不黑,客观说事。我们一起来看看,面向2020年,数据分析师们最纠结的五个问题:

▌问题一:数据分析会不会被人工智能取代?

答:不会!

首先,看到提“人工智能”四个字的所有标题,大家都能认为是引发焦虑的伪问题。真正懂行的都说:算法、机器学习,或者干脆直插CV,NLP,推荐等某个具体领域。其次,这俩玩意根本就是两件事。算法的发展不仅不会取代数据分析,反而会让数据分析更轻松。

为啥?

因为本质上,算法对抗的是低效率。通过人工标注-模型训练-预测检验的循环,算法可以大量替代以往需要耗费人力的工作。但是算法实现这个目的是有前提的:第一,需要明确的结果:人工标注的图形、信用违约/未违约记录等等。第二,需要大量的特征数据,用于训练模型。正是因为如此,我们看到算法应用最成功的就是CV领域。比对人脸、比对证件等就是特征丰富,结果明确。传统的风控、推荐等领域,也有相应进步。NLP领域进展相对较慢,就是被复杂的语境折腾的七荤八素。

本质上,数据分析对抗的是不确定性。当我们想要分析问题的时候,更多是:

  1. 没有数据:新业务刚上线,过往不重视数据采集
  2. 有假数据:业务操控,流程缺失,利益驱动
  3. 乱七八糟:口径不统一,流程不规范,使用瞎胡闹
  4. 人为扭曲:业务方为了保住KPI睁眼睛说瞎话
  5. 不会判断:只知道写同比环比,不会解读意义
  6. 主观臆断:做数据只为证明自己是对的,强词夺理

这种时候,就相当于根本没有标注,或者人工瞎几把标,模型压根训练不出来。还摸个屁。

正是如此,我才有了数据分析的五大问题:

  1. 是什么(量化结果,获取数据)
  2. 是多少(树立标准,评价好坏)
  3. 为什么(寻找原因,验证假设)
  4. 会怎样(综合评估,做出取舍)
  5. 又如何(预测前景,探索可能)

通过不断循环的解答这五个问题

  • 我们量化监控业务走势,把不确定变成确定;
  • 我们做出客观的评估,发现问题,沉淀经验;
  • 我们合理预测前景,探索新可能,发现新道路;
  • 最终推动业务持续进步和改善。

这种摸着石头过河的力量,才是算法不可取代的。当然,石头摸清楚了,数据质量好了,经验总结差不多了,这时候有些传统的工作可以用模型来干。比如在风控、推荐领域,传统业务经验越来越让位给模型。同样的,在的领域,数据分析继续做着开路先锋。

比如2019年,陈老师主导的项目,就有大量的社交电商、分享裂变、网红带货、私域流量转化的项目,这些项目往往是业务模式创新和数据分析齐头并进的。在这些新领域,各个行业都在摸石头,当然得带着有本事测量深浅的水文师。不然一脚下去踩坑里咋死的都不知道。

有意思的是,所谓的“人工智能会取代数据分析师”,正是来自对数据分析工作的无解。在不懂行的人眼里,数据分析师和算命大师没啥区别,不需要数据采集、不需要数据清洗、不需要数据治理、不需要分析建模、不需要积累经验、不需要你测试验证。只要眉头一皱、掐指一算,咒语一念,符咒一烧,算盘一拨,天上咔嚓一道炸雷掉下一道圣旨:明年业绩1257亿!在不懂行的人眼里,算法、数据分析、算盘、《周易》没啥区别,反正过程他都看不懂,最后咔嚓一声能出个好牛逼的结果。有这种幼稚理念,当然会觉得人工智能会取代数据分析了,毕竟阿尔法狗比算盘听起来屌吗。

当然还有一种论调,来自:以后能自动提数了,数据分析师就要下岗了。这个更幼稚了,谁TM跟你说数据分析师就是人肉跑sql师了!要我说,这种智能BI越早出越好!正好把那些每天2000行sql的小哥们解放出来,正好把那些无穷无尽的临时取数挡掉,正好可以让市场部那些只懂心机不懂技术的妹子们对着机器咆哮去:“这是总监要的,下班必须给!”这话都冲着阿尔法狗喊去,那画面想想都爽。我们就有更多的时间,来分析问题,来设计实验,来挖掘深层因素,以后出的成绩还多一点。

So,时代淘汰的不是数据分析师,而是只会写sql的肉鸡,是只会到处问“有没有模板抄抄”的菜鸡,是只会写同步环比的草鸡。大家大可安心。

▌问题二:数据分析会不会被会写sql的运营取代?

答:不会

这个问题陈老师有专门的分享,想看的可以戳文末的链接。这里不再赘述,只说结论:“运营做数据分析是有原罪的,叫:本位主义”。只要丫的身份还是运营,丫的数据分析结果就是屁股决定脑袋,就是短视且功利的,这一点跳进黄河都洗不清。况且运营也就只会写sql而已,你让他弄数仓,搞ETL,搞数据治理试试,不累死也恶心死。这又是“只见高楼起万丈,不见地基累又脏”所产生的误解。所以做数据的同学们不要嫌弃这些脏活累活,这反而是我们的一个护城河(虽然里边都是泥巴)。

当然,那些只会写“本月比上月少了1000万业绩,连续三个月下跌”的数据分析师,铁定被运营取代呀。这种玩意只要眼睛不瞎,且识字,都能写呀!连我们家小爷coco都会看着爸比画的条形图说:“这根短了”,他再学会一句“要搞高”,就能去很多互联网公司当“数据分析师”了呀。这种不被取代就见鬼了。

▌问题三:数据分析就业难不难?

答:难

第一,因为算法被炒得太热,所以很多人会希望数据分析师懂算法,从而增加了面试难度。是滴就是那些不明真相的吃瓜群众,总想着:“算法这么牛逼的都会了,分析还不会吗?”抓着做分析的往死里问算法,进了公司才发现,他喵子的除了交易流水屁数据没有,算法个蛋蛋。

第二,因为很多运营自己开始sql,导致对分析能力的要求更高。一个矛盾点是:很多领导自己也没见过高级的数据分析长啥样,于是会瞎提要求,把很多业务问题归为数据问题,去问数据分析师怎么卖货。这要是正儿八经的数据分析师可能真的就冤死了。

第三,因为互联网行业寒冬,导致释放出来大量劳动力,于是想转行的,算法(只会调参)失业的,做运营的,根红苗正做分析的,都在找数据分析工作,竞争更激烈,自然找工作更难。

综上,难是肉眼可见的难,大家多多努力,少点冲动是正道。

▌问题四:数据分析想突围,可以准备什么?

严格来说,这篇可以单独写。这里先列个提纲:

  1. 连excel,sql,python(速成ESP套餐)都不会的,赶紧学技术,加强能力
  2. 吃了ESP套餐的,学点数仓,ETL,数据治理,提升基础能力
  3. 和业务走的近的,多补充业务知识,特别是新领域的数据运用
  4. 公司数据基础好,本人知识扎实的,挑战一下算法

总之,横行扩宽业务知识面,纵向在数仓方向强化,能力强的看点算法,技多不压身,能力强自然出路多。

▌问题五:数据分析想转行,可以哪里走

严格来说,这篇又可以单独写。这里先列个提纲:

  1. 业务能力强的,可以往用户增长、用户运营等策略性强的部门转,这些部门天生就需要很强的分析能力。
  2. 技术强的,可以往数据产品方向转,移动BI、大屏、运营助手等产品是很好的出成绩的地方

有两条路吹的很火,可实际上不是特别好的出路:

  1. 数据中台。经过一年爆吹,大家发现:这玩意没鸟用呀。少拿阿里的数据产品举例子,人家天生数据多,可以卖给一堆企业,就我们企业那烂兮兮的数据,建中台有毛用,不是在烂泥巴里起高楼吗,不塌才怪。
  2. 数据分析转算法。经过泥沙俱下的18,19年,大家也发现只会调参的“算法工程师”有毛线用。真正算法项目,工程的难度是远远高于算法难度的,这使只会数据的人没啥优势。更何况,现在仍然有大量狂热应届生涌进这个领域,和他们比起来半吊子出身的数据分析是没啥竞争力的。所以谨慎选择转行

以上,大致回答了大家最关心的五个问题。除了问题一,问题二,其他分享都少一点,因为篇幅真的已经很长很长了。有兴趣的话,本篇集齐60个在看,我们继续深入探讨数据分析师的发展。

其实同学们最初的问题是:数据分析师发展前景如何?陈老师不喜欢探讨这么虚的话题,正如上边五个问题一样,大家会发现:如果你持续进步,你始终能在时代中找到自己的位子,如果你原地踏步,那啥玩意都能把你淘汰。前景不是看出来的,而是自己努力出来的能搞掂的具体问题越多,自然越有前途。所以新的一年,我们继续具体问题具体讨论,大家一起进步哦。

本文分享自微信公众号 - 接地气学堂(gh_ff21afe83da7),作者:接地气的陈老师

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-12-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 商业分析与数据分析、算法模型的关系与区别

    我们常说,办事情要“名正言顺”,而数据领域的名字则是格外的多,商业分析、数据分析、数据挖掘、算法模型……经常把大家绕晕,今天系统科普一下。

    接地气的陈老师
  • 数据分析师的发(xing)展(fu)方(sheng)向(huo)

    上一篇《数据分析师的真实绩效是什么》发出以后,又被大家加入了《陈老师日常劝退套餐》。很多粉丝强烈呼吁,写一篇数据分析师的幸福生活,不然感觉真的要被劝退了。今天就...

    接地气的陈老师
  • 当数据分析之路遭遇困惑,你还需要提升这8个能力

    “这个数据分析,怎么就越干越糊涂了呢?转行以前,看着学习的书单很清晰,Excel,Sql,Python一点点学过来。可转行后反而迷茫了,越干越感觉自己在打杂”一...

    接地气的陈老师
  • 大数据分析与应用技术创新平台

    原文链接:https://mp.weixin.qq.com/s/kCDYOInF8KjHstIMAWSljA

    月牙寂道长
  • Follow这些步骤,临床数据也能妙笔生花!

    对于临床医生而言,我们能接触到的更多的其实是临床数据。目前关于数据分析有一个专门的术语叫做“数据科学”。今天就给大家介绍一个数据分析流程的网站,利用这个网站来简...

    百味科研芝士
  • 聚信立数据科学家甘建铃:孙子兵法在数据分析中的应用

    近年来,全球大数据产业磅礴发展,经过多年的探索,我国大数据产业发展取得不小的成果,同时,大数据产业进一步发展也面临着多重困难与挑战。当大数据成为思维习惯时 产业...

    数据猿
  • FUSE(FileSystem in User Space) 对算法的价值

    MLSQL 有一段时间致力于融合大数据平台和算法平台,实现 【同一个平台,同一个语言。】。事实上我们通过各种方式做到了,通过整合Spark ML,Spark M...

    用户2936994
  • 教程 | 百行代码构建神经网络黑白图片自动上色系统

    机器之心
  • 单元测试工具(连载2)

    写好产品代码和测试代码后,就可以运行测试程序了。只要在Eclipse的CalculatorTest类上单击鼠标右键,在弹出的菜单上选择“Run As a JUn...

    小老鼠
  • 爬虫笔记2-解析

    BeautifulSoup 用于解析已经抓取的文件内容。是解析、遍历、维护“标签树”的功能库。

    七适散人

扫码关注云+社区

领取腾讯云代金券