前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >原来腾讯优秀数据分析师是这样的(二)

原来腾讯优秀数据分析师是这样的(二)

作者头像
腾讯大讲堂
发布2021-06-21 15:10:27
1.2K0
发布2021-06-21 15:10:27
举报

作者:陈会华 腾讯CSIG数据产品经理

导语| 从优秀数据分析师的访谈中,找到进入数据分析领域的捷径。

寄语

数据分析师Data analytist(或者数据科学家Data scientist),是公司不可或缺的组成人员,一家缺失数据分析师的公司,至少说明这家公司缺少数据驱动的意识,在未来竞争中,一定处于被动。

一直以来,我致力于推进数据化运营,而数据化运营需要解决几个核心问题:

1. 如何培养员工基于数据决策的意识和能力?

2. 如何构建一个高效的数据驱动的公司组织(如数据中心、产品团队的分析组等)和文化?

3. 如何让数据应用产生价值,从而推动数据战略的彻底落实?

▲数据化运营金字塔模型

这些问题,似乎都很大,很难解决,但回到原点,如何让我们具备良好的数据分析能力,从而借用这些能力来进行决策,让我们切实收益?从优秀的数据分析师访谈中,我们可以找到切入学习数据分析的一些方法和捷径,避免走弯路。所以,数据的力量,策划了几期针对优秀数据分析师的访谈。我整理了进入数据分析领域的重要问题,让他们写下自己的见解,希望能够给到想进入数据分析领域的朋友一些参考。

查看第一期内容:原来腾讯优秀数据分析师是这样的

第二期专访

唐松——腾讯天美数据分析师

第二期邀请的嘉宾是唐松,我个人最看好的一名数据分析师

唐松来腾讯之前,从事过数据解决方案的咨询工作,然后去美国进修了数据科学的研究生课程,进入腾讯后,快速成长,在直播行业和游戏运营有丰富经验。他开发的潜力主播挖掘模型,为运营创造了巨大价值,他同时也是python爬虫畅销书的作者(著有《Python网络爬虫从入门到实践 第2版》)。我从他身上看到敬业、拼搏、热爱、好学的优点,以及对理想的执着。

某种意义上,邀请他做这次访谈,是我这个前浪向这位后浪的致敬,我在他这个年纪,达不到这种高度。我内心深处,期待更多后浪数据分析师涌现,超越我们这些前浪,放大数据的力量。

▲唐松的自我介绍PPT

01

为何选择做数据分析师?

1、你为何选择数据分析师这个职业?

唐松:发现和探索未知是底层的原因,通过分析数据,可以得到很多原来未知的结论。还记得大学本科时代,当时帮香港的一家餐饮集团做数据分析项目,发现吃猪扒饭的食客很喜欢点可乐,这个小发现帮助了业务上的改进,当时的快乐和满足感一直无法忘记。

于是,本科找工作也是做了数据咨询,之后去了美国读数据科学的研究生,再然后来到腾讯做数据挖掘的模型,也是围绕着从数据中发现和探索,不断地输出自己的价值,为业务增长做出贡献来做。

2、你觉得美国的数据科学教育和中国的有什么不同?

唐松:我没有在国内学过数据科学,仅谈谈我在美国学习的感受。

在美国学数据,有一种被服务的感觉。教授会把机器学习的知识掰开揉碎了讲,学起来不费功夫。就算机器学习上课听不懂,课后也有21个左右的TA可以提问,平均下来每天3个,覆盖了早中晚,简直就是全方位的服务;还有一个类似论坛的线上平台,同学们可以随时提问,教授和TA一般会在1小时内回答。

此外,教授的上课会更讲究“道”。每一个算法,上课都会讲原理,总结出使用场景和优缺点;下课要用python从0实现一遍算法,然后在一个场景应用。这样撸一遍之后,基础会非常扎实。这也是我为什么当时面试腾讯,能拿到“技术大咖”的原因,问一个机器学习算法都能把公式背下来。

第三,学习的过程是双向的。上课的过程不只是老师在上面讲课,同学也可以随时提问。几乎每个老师都会把课程的参与列入最终成绩,会时不时提很多问题,激发同学的思考。回答没有对错,只有回答的勇气,以及是否对该问题有充分的思考。

3、你python学得很好,你认为学好python,最关键是什么?

唐松:Python的学习在我的书里也有分享,其实很简单:手输代码,反复练习。我们学Python的目的是为了解决问题,那么可以针对自己感兴趣的点,用Python去实现去钻研。很多同学和我说,我们从不生产代码,我们只是代码的搬运工。这点在学习的初期非常错误,如果你只是复制粘贴的话,给你一张白纸,你会什么代码都写不出。

4、什么原因促使你写了python爬虫的书?

唐松:缘分。因为给港中文的学生上课,讲Python爬虫,所以我在知乎更新了Python爬虫文章;因为我在知乎更新了Python爬虫教程,所以有编辑找上了我;因为我当时正好有空,所以我有时间把整个知识进行系统的输出,所以这是意想不到的缘分。

▲唐松的书

02

数据分析师应该指导团队打仗

5、你觉得什么人适合从事数据分析工作?

唐松:热爱数据分析的人。虽然听上去这句话是废话,但其实却是最真实的。没有适合不适合,只有热爱不热爱。如果你怀着热爱,你就会发动自己一切有限的技能去分析数据,并且坚持下去。对数据分析的爱终将发光,让你的数据分析技能就不断生长,最后人们会说,哇,你真的是一个数据分析天才。

6、你觉得优秀的数据分析师应该具备什么素质和技能?

唐松:要求的能力需要很全面,我这里应用我之前的老师,LinkedIn前数据总监的模型,Ask Measure Learn简单列一下。

(1)Ask,就是提出问题。真正的厉害的数据分析师,应该是团队的指挥官,用数据和思考指导团队打仗的:面对着复杂的业务场景,能进行深度思考,问出其中关键性的问题。相比之下,一般的数据分析师,能够将业务提的需求,转化成数据问题,用数据的角度来尝试解答,而不是一上来就瞎跑数。

(2)Measure,就是处理数据的过程。为了解决问题,一个优秀的数据分析师,必须有18般武艺,包括了写Python和SQL等代码的能力,包括了建模能力,统计概率知识,可视化等等。除了以上的硬实力,还有一点非常重要:逻辑推理能力,不能凭自己的感觉和猜想一步就跳到结论,整个过程必须要论据充分,论证严谨,需要具有经得起挑战的逻辑推导到结论。

(3)Learn,就是分析的结论如何?下一步该怎么做?一般来说,我们分析三类问题:

    1. 是什么?对产品的现状或者活动的好坏下定义

    2. 为什么?归因分析,找出好或者不好的原因

    3. 怎么做?下一步该怎么改进

这里我有8字箴言:“战战兢兢,如履薄冰”,因为对于数据分析报告中的每个字,对于团队而言就是一锤定音,每个字都要斟酌。一个优秀的数据分析师,需要抱着中立的态度,能够用简洁准确的话语,用准确形象的数据可视化来传递信息。

7、在数据分析工作中,你最不愿意干的活是哪些?

唐松:最不愿意做的是纯跑数,比如说帮我看一下xxx数据,却不告诉我为啥要看。这样感觉自己只是个没感情的机器,新时代的搬砖小工,不停转磨的那头驴。

8、在数据分析工作中,哪些让你觉得最有成就感?

唐松:最初我的感觉是自己数据分析的结果,最终能推动业务落地,带来价值,成就感就非常高了。在我慢慢转型业务的过程中,我慢慢觉得,我和业务是一体的,产品的收入上涨,活跃留存变好,我也非常有成就感。我觉得这个更像是一种增长的思维。

9、你觉得数据科学未来的趋势会是怎样?

唐松:data science这个词太大了,包含的内容很多,自认为还没到能够谈对未来趋势的水平。只是谈谈我自己对数据分析的看法。

(1)生产力整合和提升是未来的趋势。数据中台概念的提出,就是在于过去粗放式发展抢夺蓝海市场已经遇到瓶颈,必须深耕细作,才能将亩产不断提高。

(2)数据会被更多地放到业务的全局去看。就像目前大火的增长黑客一样,其实是从整个产品的大局出发,透过数据分析等多种方法找到增长点,既不忽视数据分析的作用,也不轻视商业思维产品思维的价值。

10、你觉得增长黑客的方法与传统的增长方法,有什么不同?

唐松:通过我自己在数据中台和运营团队的经验,我觉得主要的差异点有三个:

(1)增长黑客的方法强调AB Test

增长黑客的方法,非常强调决策的判断要通过科学而严谨的方法来进行测试,正向收益的行为和决策才会真正放到线上来实现;一般运营团队的方法是通过数据分析+强大的产品思维来判断,或者先上线,看数据再调整,再看数据再调整,但一般缺乏严谨的因果论证,另外也不够敏捷。

(2)增长黑客的方法强调性价比

增长黑客的方法强调行为的性价比,会将目标进行拆解,通过增长等式来量化收益,发现其中性价比最高的机会,团队之间也会围绕这目标一起努力。传统的增长方法,虽然都是会看KPI(也就是北极星指标)做事,但是一般缺少了对每个行为的绝对量化,一般是自我感觉或者老板来决定了做事的优先级,例如花费大量人力的事情去做新增,但是可能产品已经在成熟期,新增对DAU影响很小;或者花费大量时间拉付费渗透,其实对收入影响不大。

(3)增长黑客的方法强调团队的协作性

增长黑客强调了团队之前的协作性,统一向一个目标前进。传统的方法,各个团队的KPI可能是不一样的,例如数据分析可能会用数据分析报告的数量作为KPI,开发用bug率和完成量等作为KPI,市场用拉新作为KPI,活跃运营负责活跃,商业化运营负责收入。但是,增长团队是把大家的利益捆绑在一起,围绕北极星指标一起努力,作为一个团队努力。

▲增长黑客的含义

03

数据分析师的“蘑菇理论”

11、你觉得,最理想的数据分析团队,应该是怎样的?

唐松:数据团队往往被认为是业务的支撑角色,给业务写SQL提供报表服务的。但是理想的数据分析团队,绝不是完全的支撑部门,应该有自己的理想,去引领和驱动业务的前进。只有这样,每一个成员才有一定的使命感和成就感,才是有战斗力,有创造力的团队

想要让数据分析团队变得有价值,就必须站在半个产品/运营负责人的角度,用产品的语言和思维进行沟通,不仅仅去理解业务,而是和业务站在一起。天美工作室有个“蘑菇理论”去理解用户,同样的也可以用在数据分析师上。把这些思考,站在数据、技术、产品和用户的角度去理解,推动解决

注:蘑菇理论由天美总裁提出,核心思想是想办法潜入目标用户群,感同身受并理解用户。

12、你如何平衡你的工作和生活?

唐松:这是我目前非常大的挑战,平时工作时间比较长,而且可能随时被call,这对于平衡生活是很大的挑战。对于我而言,我会要求自己保持运动,另外在周末的时候,按照自己舒服的节奏来过,比如周日和朋友去吃个brunch,然后宅家看一天书,或者和朋友出去玩,把周末这一天过得舒服。除此之外,把自己的目标从单纯工作拓展到更多目标,例如目标是每年出去2次大旅游,比如今年打算去看极光和非洲(目前很难实现)等等。

13、善良和聪明,你觉得哪个更重要,为什么?

唐松:对于数据分析师来说,这里先引用一下Alice对于善良和聪明的理解:善良是让严谨的数据说话,不带任何个人偏向去解读数据;聪明是老板想要什么样的数据,或者你想让数据呈现什么样的结论。

在我看来,善良更重要。但做数据分析师,需要善良但不失聪明。

数据分析工作,无时无刻在强调善良的重要性,数据需要尽可能反映实际的表现情况,否则就被挑战。首先在准确性上,数据容不得半点错误,任何一个微小的错误,都会要被纠正;其次在态度上,数据同学需要尽量中立地反映实际的情况,整个过程必须论据充分,论证严谨,得出的结论必须是一锤定音,无懈可击的

但是为啥要加上不失聪明呢?因为没有绝对的对错,事物都是有两面性的,特别是从数据分析到落地策略的时候,如果不发挥自己的创造性和思考能力,是很难产生有价值的推动落地的。

14、你最近从支持部门的数据分析团队去到产品运营团队做数据分析,你觉得两者最大的不同是什么?

唐松:研究火箭和战场肉搏的区别。

我之前做过一个比喻,在支持部门做数据分析,就像是在研究所研究火箭和导弹,每天想着开发出新的模型和工具帮助各个业务精准击中敌人;在产品运营团队做数据分析,就像是上战场肉搏,每天都面临真实的商业环境,在战火中淬炼;在洞察--> 落地 -->评估,这个循环的流程中,不断强化自己的分析能力和业务推动力,身处在顶尖的游戏工作室,要求高,时间紧,一段时间下来,回头看看自己的业务能力已经提升了很多,但是对于高精尖的技术能力有些落下了。

15、你认为AI会取代数据分析师吗,为什么?它能够取代哪部分?

唐松:不会,目前看来对于人工智能来说,有多少人工就有多智能,能够解决的问题多在有监督学习的场景,例如人脸识别,语音识别等场景。数据分析师不光是和数据打交道,和人打交道才是重点。

04

给数据新人的推荐

16、对于想进入数据分析领域的新人,你有什么建议?推荐哪些书?

唐松:建议是真正到一款产品,从0开始,深入参与数据分析和策略落地过程,不断重复Ask Measure Learn这个过程。如果没有这个机会的话,可以开始看书上课打好基础:

推荐的课程:

(1)思维上:《增长黑客》(Sean Ellis那本)和《硅谷增长黑客实战笔记》

(2)统计上:概率要懂,机器学习的基础算法要懂,推荐Andrew Ng的机器学习课,概率推荐Udacity的 Introduction to Inferential Statistics;以上都是基础课,想要更深入的话,网上有大量的美国名校免费课,比如首推我上过的康奈尔的大神Kilian教的机器学习CS480,还有Stanford的CS229(机器学习),哈佛的Stat 110(学概率论)

(3)AB测试:仅推荐Udacity的 A/B Testing课程,其他的中文书不推荐

(4)编程上:SQL和Python要会,这里不推荐书,SQL推荐去W3school学一遍,既简单又免费;Python的基础推荐去看廖雪峰老师的Python文章,免费又讲的好,然后去kaggle刷一个简单的比赛,看看大神的代码,想学爬虫的可以看我的书《Python网络爬虫》。

相关课程链接

1. 康奈尔的机器学习

https://www.youtube.com/watch?v=MrLPzBxG95I

2. Andrew Ng的机器学习课

https://www.coursera.org/learn/machine-learning

3. Udacity - Introduction to Inferential Statistics

https://www.udacity.com/course/intro-to-inferential-statistics--ud201

4. Stanford的CS229

http://cs229.stanford.edu/

5. 哈佛的Stat 110

https://projects.iq.harvard.edu/stat110/youtube

6. Udacity - A/B Testing

https://www.udacity.com/course/ab-testing--ud257

7. SQL - W3school

https://www.w3school.com.cn/sql/index.asp

8. 廖雪峰Python

https://www.liaoxuefeng.com/wiki/1016959663602400

近期热文推荐

腾讯低代码OTeam建设概述

企业微信万亿级日志检索系统

关于《秦时明月世界》运维的那些事儿

—自研上云与core优化

     你“在看”我吗?

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-06-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯大讲堂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 腾讯低代码OTeam建设概述
  • 关于《秦时明月世界》运维的那些事儿
  • —自研上云与core优化
相关产品与服务
人脸识别
腾讯云神图·人脸识别(Face Recognition)基于腾讯优图强大的面部分析技术,提供包括人脸检测与分析、比对、搜索、验证、五官定位、活体检测等多种功能,为开发者和企业提供高性能高可用的人脸识别服务。 可应用于在线娱乐、在线身份认证等多种应用场景,充分满足各行业客户的人脸属性识别及用户身份确认等需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档