对于打算入门数据分析的菜鸟来说,你想提醒他们什么?

在知乎上看到这样一个问题:

“面对大数据时代趋势和与之相对的高薪,越来越多没有怎么学过计算机和统计学的外门人士也想跃跃欲试踏进数据科学的领域,请问大家伙儿有没有点建议想提醒新人呢。比如一路走来最困难的瓶颈期是在什么阶段?为了这一专业都牺牲了什么?与此同时又给你们带来了什么?在枯燥的学习过程中,学习的原动力和兴趣来源是靠什么?”

针对以上问题,在这里做一个回答,希望能对打算入门数据分析的朋友有帮助,以下为正文:

首先,你必须清楚在数据科学领域有两个截然不同的职业方向:数据分析师和数据工程师。他们的工作方式是截然不同的。

数据分析师偏业务,专注于研究数据和结果之间的关系,数据和结果之间的关系通常是不确定的,没有严谨的数学逻辑,他们在很大程度上只满足某种统计分布规律。

而数据工程师,专注大数据软件系统的搭建、数据库和数据管道的构建,目的是让数据可以存储和可以流动起来。所有的软件工程都是规范而严谨的,与不确定性几乎没有关系。

简单说工程师的思维逻辑是“若A,则B”,而数据科学家的思维逻辑是“若A,则可能B”。如果你对事物缺乏敏感;喜欢严谨的数学逻辑,不喜欢我猜我猜我猜猜猜,那么前者的工作可能更适合你。

其次,在学习数据分析之前应该明白几点:

  • 数据初期的准备通常占整个数据挖掘项目工作量的70%左右。
  • 数据分析师本身融合了业务知识、统计学和计算机等学科,并不是新的技术。
  • 数据分析更适合业务人员学习(相比技术人员学习业务来的更高效)
  • 数据分析项目通常需要重复一些毫无技术含量的工作。

数据分析师的最主要能力是数据思维或者说数据意识,也就是说你必须具有数据和结果之间关系的直觉意识、探索能力和分析能力。为此你必须把更多时间花在数据生成过程的思维模式训练上,并研究如何把这些思维模式转换成统计学的术语,并最终通过软件工程的代码实现它。

数据分析师的坑

所谓成也不确定性,败也不确定性,数据分析师的坑在于你永远可能接近不了真相和标准答案,你只能寻找一个更接近于真相的最优结果,为此你必须保持清晰的头脑,1%的匹配误差在推荐系统中几乎可以忽略不计,但同样1%的误差在金融风控等领域就是完全无法接受的,为此你必须谨慎和保持清醒的认识。你必须在一开始就找到评估你模型的方法,并不断的通过数据去校正你的分析模型。这个分析过程有时是枯燥的,特别是当你重复某些毫无技术含量的工作。

数据分析的工作就像制造一辆“安全”的无人驾驶汽车,你必须理解“安全”的范围,如果安全的范围是可以描述和界定的,你必须考虑各种路况和未知的因素去满足这一“安全”的标准,这个过程存在太多的未知因素和变量。如果这个“安全”范围本身就是一个变量,那么情况将变得更为复杂。

数据分析师的bonus

对数据分析师而言,最好的bonus是他多了一个观察世界的眼睛,在很多人在三维世界里挣扎的时候,他有可能具有N维空间的观察能力,所谓“不识庐山真面目,只缘身在此山中”,跳出来看问题可能会让你拥有常人无法拥有的某种“预测”的能力,这种能力有可能会让你身价倍增。

以上为全部内容,若对您有帮助,请分享给更多的人,谢谢!

END.

PPV课原创

相关推荐:

  • 数据分析师成长计划
  • 怎样判断一个人是否适合做数据分析?
  • AI时代就业指南 | 如何入门数据分析&数据挖掘?
  • AI时代就业指南:普通程序员转行大数据十问十答
  • 作为一名大一新生专业是大数据专业, 应该从哪里开始入门学习?

原文发布于微信公众号 - PPV课数据科学社区(ppvke123)

原文发表时间:2018-04-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏腾讯研究院的专栏

大数据带来的四种思维

近年来大数据技术的快速发展深刻改变了我们的生活、工作和思维方式。大数据研究专家舍恩伯格指出,大数据时代,人们对待数据的思维方式会发生如下三个变化:第一,人们处...

2159
来自专栏大数据文摘

张溪梦:庙算者多胜-大数据发展战略

2927
来自专栏人工智能LeadAI

数据部门如何All In AI

通常,大数据部门会花费很大的力气构建数据平台,而这个数据平台除了能让研发,算法,分析师等角色爽一些,从宏观角度很大的节省部门人力成本,提高效率以外,似乎对公司/...

1253
来自专栏量子位

详解:知乎如何使用机器学习,未来还有哪些想象空间

舒石 假装发自 斯坦福 量子位 报道 | 公众号 QbitAI 机器学习,正在以及将要如何改变知乎? 回答这个问题的最佳人选,莫过于知乎合伙人、大数据团队负责人...

34711
来自专栏架构技术

[转] 研发组织该如何设计绩效体系?

德鲁克在《21世纪的管理挑战》一书中指出:“管理的第一个任务是规定组织的成效和绩效,而任何有这方面经验的人都可以证明,这实质上是一项最艰巨、最有争议的任务,但同...

1662
来自专栏PPV课数据科学社区

网络大数据的统计和分析利用

大数据给互联网带来的是空前的信息大爆炸,它不仅改变了互联网的数据应用模式,还将深深影响着人们的生产生活。深处在大数据时代中,人们认识到大数据已经将数据分析的认识...

2955
来自专栏机器之心

业界 | 这家积累9年的老牌技术供应商,打算如何做嵌入式AI?

机器之心原创 作者:虞喵喵 「今年是嵌入式 AI 的起步阶段,真正的市场会从 2019 年开始慢慢扩大。」 在中科创达产品总监兼创思远达 CEO 杨宇看来,随着...

3626
来自专栏大数据文摘

Airbnb数据科学团队进化论:如何由内而外实现数据驱动

2223
来自专栏数据科学与人工智能

【数据科学】如何区分大数据下的三大利器:数据科学家,数据工程师与数据分析师。

与其他一些相关工程职位一样,数据科学家的影响力与互联网同进同退。数据工程师和数据分析师与数据科学家携手共同完成这幅“大数据时代”巨作。他们共同努力拟定数据平台要...

2709
来自专栏人工智能头条

资讯 | 微众银行、TalkingData眼中的人工智能

2062

扫码关注云+社区

领取腾讯云代金券