首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

非计算机/统计背景出身的人,如何学会数据分析?

大数据观察

了解大数据,关注大数据观察吧!

每个想了解最新大数据资讯的人,都关注了我

文 / 数据君

如果你是一个非计算机/统计背景出身的人,如何利用业余时间学习数据分析的技能?

数据分析在未来将会作为一门通识技能,进入越来越多的不同工作岗位中。

毕竟“技多不压身”,掌握数据分析,一方面可以提升自己相应的业务能力,另一方面也可以让自己建立一种data-driven的视角,去思考各种问题。

关键词:非科班+业余时间+数据分析

结合自身的经历,我想从基本技能+动手实践两个角度谈谈。

基本技能

不论是学什么,还是需要先有一个大的框架。对于学习数据分析而言,需要的技能模块有统计基础+数据库知识+编程能力

统计基础

理工科的学生在本科阶段学习过概率论与数理统计,单从做数据分析的角度,其实已经够用了。那么在业余时间里,我们需要有一本书可以随时查漏补缺,《深入浅出统计学》你值得拥有。

数据库知识

关系型数据库很重要,因为在学习数据分析的初期甚至很长一段时间,你接触到的数据都存储在关系型数据库中,需要学习SQL语言去进行数据的查询。

SQL的上手很快,强力推荐《SQL必知必会》,整本书通俗易懂,是学习SQL语言的不二之选。

我当年入坑也就是这本书开始的。个人觉得,学习数据库的本质就是在学习一种与数据打交道的逻辑思维与能力

而且在编程中的很多思想都是和SQL之间相通的,比如:SQL中对data进行group by的操作,这个在Excel里类似于透视表,在Python/R中也有相应的group function去处理数据。

甚至在以后的进阶过程,你会接触到分布式数据库和所对应的no-SQL语句,本质上都是和关系型数据库及SQL相通的。

编程能力

Excel --- 别拿Excel不当干粮,之前看到过一个段子:投行的童鞋们用Excel根本不需要鼠标,暂且放在这里调侃一番。

不过,Excel里面的透视表(Pivot Table)确实是做数据分析的必备技能。

透视表可以帮你迅速汇总数据,看到各类型数据的直观特征就像是让你站在了一个更高的视角上去看你的数据。

作为进阶,Excel自带的函数,各种插件,以及VBA也是很好的工具,将Excel用到极致也不是不可以。

Python --- 当数据量大到用Excel打开都要好久的时候,或者我们想进一步提升能力的时候,需要学习一些hardcore技能,即用编程语言做数据分析。这里主要有R和Python两大流派。

个人推荐Python,一方面Python代码简单易懂,容易上手;另一方面学习资料超级多

在这里推荐一本书,《利用Python进行数据分析》,这本书涵盖了利用Python做数据清洗,数据可视化及分析的技能点,可以作为一本工具书随时查阅。

难道学习数据分析就一定要掌握这些基本技能吗?答案是,并不一定在开始的时候就全部掌握,学习数据分析最重要的方式就是动手实践,get your hands dirty at first。结合楼主的提问,重点讲讲动手实践的部分

动手实践:

这一部分其实就是在回答题主的几个问题:

从哪里弄到有分析价值的数据? --- 平台

在开源社区有没有开源项目适合用来学习数据分析?

可以自己动手做个什么项目来实践

好的平台社区:既然是利用业余时间学习数据分析,那么一个好的平台社区将会起到事半功倍的效果。

美国有Kaggle,中国有Kesci; 美国的kaggle是全世界做数据科学/数据分析的爱好者/从业者的聚集地,上面你可以看到各种大神的数据分析/挖掘项目,拿来自己练练手。中国现在也有了数据分析学习社区---科赛网Kesci;在这里可以找到很多开源数据集启动你的数据分析之旅。

What's more, Kesci有一个目前国内独有的在线数据分析平台,K-lab。当你在社区内看到不错的项目之后,可以fork过来在K-lab上面做自己的分析项目并在社区内做展示。我们也在推动从0到1学习数据分析的活动,陪伴中国的第一代数据分析师成长。

随时查漏补缺:在这一路实践的过程中,你可能会遇到各种问题,知乎就是一个强大的搜索引擎,有很多大牛写的数据分析文章;当然,如果你英文能力强的话,欢迎copy and paste fromStackOverflow,你可以直接搜索你在写代码做数据分析遇到的各种问题,总有一款答案适合你。

再进一步升级:这一路实践就像是游戏里打怪升级的过程,比如你发现自己对统计的知识点不是很清楚,你开始回过头去看统计学书籍;你发现数据存储在分布式系统里面,你开始学习no-SQL的知识;你发现自己对某一行业比较感兴趣,你开始通过数据分析去了解一个行业;你发现自己已经不满足于利用现成数据作分析,你开始学习使用爬虫去抓取数据作分析。逐个击破知识盲区,滚雪球式累积,这也是学习数据分析的精髓。

小结

学习数据分析本来就是搭好框架体系不断累积知识不断hack技能不断提升分析水平的过程。哪怕是业余时间学习,假以时日,亦可成大器。也许正因为不是科班出身,所以在奔向远方的道路上才会永不知足,永不疲倦,“stay hungry, stay foolish”。

主题 |数据分析

插图 | 网络来源

作 者 介 绍

数据君:)

了解大数据,关注大数据观察

部分图文来自网络,侵权则删

我想给你一个理由 继续面对这操蛋的生活

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180905B1D4JN00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券