大数据入门那些事

大数据之“大”

数据,大家会陌生吗?不会。我们每天的日常生活都会接触到数据。淘宝购物时货比三家的价格,年终考核之后发给我们的奖金,发表在论坛上的文章的评论数量,这些都是数据。

从人们会计数开始,数据就有了,数据分析也是。那么大数据呢?

说到大数据,你就绕不开互联网。在互联网出现之前,虽然政府部门和一些公共事业单位通过日积月累获得了较大量的数据,但并没有形成足够的影响力。直到互联网产品的出现,由于它收集用户数据的便利性,通常在一天之内就能够累计其他行业可能一年才能获取的数据量。

数据量的升级造成算法和硬件都必须要升级,操作起来的技术难度也就会提高很多。这个时候,就需要专业的技术和平台来完成存储,处理和分析大数据的工作。比如说,大家都听过的Hadoop平台,MapReduce算法。都是大数据时代的产物。因此,

大数据的核心,就在于大。

有一定规模的互联网公司都会成立专门的大数据部门来管理自己产品所收集到的大数据。数据量越大,处理难度就越高,相应的,可能挖掘到的内涵也会更多。于是,大数据就成了一个产业,一个火热的产业。

大数据入门的科普读物,应该看哪一本呢?很多人推荐了吴军的《智能时代》。

大数据圈子里的人

在大数据行业这个圈子里,公司提供的职位大致分为三类:数据分析师,数据产品经理,数据工程师。他们紧密合作,共同驱动公司的数据决策文化。

那么,着三种职位都是做什么的?又该怎么入行呢?

数据分析师

数据分析师,是使用大数据的人。核心是掌握各种数据分析工具和数据分析技能,目标是为公司管理层和产品团队提供分析报告,帮助他们做决策。

实际工作中,数据会被处理成各种不同的类型提供给数据分析师使用,有比较原始的,有比较简单好用的。因此,数据分析师需要掌握R, SQL,Excel, Python基础编程等多种技能,以及熟练掌握常用的数据分析方法。

如果你立志于成为一个数据分析师甚至数据科学家,那么建议你进行系统的学习。

1. 英文好的可以去系统学习:

Data Science - Johns Hopkins University | Coursera

2. 如果你有一定的经验和编程基础,也可以考虑秦路的自学指南:如何七周成为数据分析师

常见的推荐书籍有《R语言实战》,《深入浅出统计学》,《Python for Data Analysis》等。

数据产品经理

数据产品经理是设计数据产品的人。核心技能是数据需求分析和数据产品的设计,和其他的互联网产品经理并没有本质的不同。实际工作中,数据产品经理需要收集不同用户的数据需求并且设计出好用的数据产品提供给大家,帮助他们“用数据做决定”。

常见的推荐入门书籍有《人人都是产品经理》,《The DatawareHouse Toolkit》,《Lean Analytics》等等。

数据工程师

数据工程师,简单分两种,一类是数据挖掘工程师,另外一类是大数据平台工程师。工程师的基本技能当然是写代码,写高质量的代码。

数据挖掘工程师主要工作是开发大数据流水线以及和数据分析师一起完成数据挖掘项目,而数据平台工程师主要工作是维护大数据平台。

因此,理工科背景出身,掌握C, C#, Python等编程/脚本语言,熟悉各种基础算法即可以胜任。

如何用数据做决策

对于那些并不想转行进入大数据圈子的人,我们要学的究竟是什么?

在我们的日常工作中,特别是业绩不佳,找不到突破口的时候,都曾想过能否用数据来帮助自己。因为我们都曾或多或少听过一些牛逼的数据案例,比如纸尿布与啤酒之类。

举一个简单的例子,你经营的餐馆现在状况不佳。你可以自己拍脑袋想一堆的新点子来尝试改善现状。你也可以,收集整理数据,通过分析找出根本原因,并提出对应解决方案,从而扭转局面。后者听起来似乎更加靠谱一些。

那么,你该收集什么数据,做什么分析,这就是你需要学习的:“如何用数据做决策”。从这个角度讲:

人人都应该是数据分析师

学习系统的数据决策和数据分析思维,我们可以从这篇文章开始:从0到1搭建数据分析知识体系。

关于数据分析的书籍太多了,众口难调,随便一搜就有一大堆推荐。而其中所讲的知识和理论其实都是类似的。最终要让他们发挥作用,还是要和实践结合起来。

因此,在自己的生意和工作中多实践数据分析,多思考,遇到问题多在社群中提问和大家探讨,是最好的学习办法。

带着问题去学习,是最好的方式。

在这个过程中,随着你对数据的深入了解,掌握更多的数据分析语言和工具。从Excel到SQL,甚至到R和Python。你所能使用的数据量也会越来越大。但你大可不必一开始就扎入这些工具的学习中,那样会收效甚微。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180622A0EZXW00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券