首页
学习
活动
专区
工具
TVP
发布

怎样成为Data Science高手?

点击Internet咖啡屋关注我

温馨提示

如果你喜欢本文,请分享到朋友圈,想要获得更多信息,请关注我。

学习数据分析时间不算很久,但是在这里还是想给那些喜欢在数据分析这条数据路上一直走下去的人提供一些个人的建议。

至于为什么要学习数据分析,这不是我写这篇文章的目的,大家可以上Google搜一下最近几年数据分析的发展趋势。不过可以肯定的是,数据分析不断深入学习之后,可以说和数据挖掘,人工智能,机器学习都是挂钩的。

我这里主要讲述的是怎么去学习数据分析。

数据分析是什么

好吧,其实要成为一个合格的数据分析师,需要掌握的只是还是比较多的,这里我就不想赘述了.这里引用维基百科的一些话,简单做一下概述。

Data scienceis an interdisciplinary field that uses scientific methods, processes, algorithms and systems to extract knowledge and insights from datain various forms, both structured and unstructured,[1][2]similar to data mining.

Data scienceis a "concept to unify statistics, data analysis, machine learning and their related methods" in order to "understand and analyze actual phenomena" with data.[3]It employs techniques and theories drawn from many fields within the context of mathematics, statistics, information science, and computer science.

译文:数据科学是一个“统一统计,数据分析,机器学习及其相关方法的概念”,以便用数据“理解和分析现实”。[3]它运用数学,统计学,信息科学和计算机科学背景下的许多领域的技术和理论。数据科学是一个跨学科领域,它使用科学的方法,过程,算法和系统从各种形式的数据中提取知识和见解,包括结构化和非结构化[1][2],类似于数据挖掘。

从维基百科的对数据分析的一些概述可以看出,数据分析涉及的领域是很广的,是一个交叉领域的学科,涉及多学科的知识,除了需要数学方面的知识,还需要掌握编程技术方面的知识,而且数据分析很注重业务能力,毕竟学习的目的是为了解决实际生活中的问题,而未来选择这个工作是为了解决各类社会问题,相信任何一个公司都是很看重解决问题能力的人才的,需要的绝不会是只会理论知识的人。所以我们除了单纯的学习理论知识肯定还需要实战的。

那我们该怎么去学习呢?

这里我提供一些学习上的建议。

使用Python这门非常有魅力的语言。

“人生苦短,我用Python”

随时科技的进步,需要处理的必然是庞大的数据,所以传统的数据分析行业必然要面临这巨大的改变。而且Python基本可以做任何类型的数据分析工作。

Excel可以做的,Python可以做;R语言可以做的,Python可以作,MATLAB可以做的,Python也可以做。Python的强大在于涉及的领域很广,基本什么都可以做,所以学好Python,对于未来的就业是很有帮助的。

数据分析的准备工作

学习Python数据分析之前,你可以先把Python爬虫学好,毕竟做数据分析,那肯定需要获取数据的来源,所以有必要学习一下爬虫,而且爬虫学习好之后,以后也可以找爬虫工程师相关的工作,相对来说,Python爬虫并不会太难。下面我来简述一下学习爬虫的一些技巧。

开发工具

“工欲善其事必先利其器”,所以首先必须要了解Python的开发工具。

数据分析我推荐的工具是Anaconda

然后前面学习爬虫就用Pycharm就可以了

所以大家配置Anaconda + Pycharm的环境是很好的选择

Pycharm是一个非常专业Python开发工具,是收费的,这里提供一个Pycharm专业版的永久注册方法

另外Visual Studio2017也已经支持Python的开发了,里面集成了Python和Anaconda以及其他一系列的数据分析和Python开发工具和环境,大家也可以选择这个,我也是很强烈推荐的,VS现在设计的很人性化,可以选择性安装组件,安装下来也不会很大。下面给大家可以看一下VS2017的一些介绍还有安装过程,附专业版和企业版的注册密钥。(这是一个价值不菲的微软开发的开发工具,很强大很实用)

一定的Python基础

学习Python爬虫和数据分析都需要掌握一定的Python基础。

这里推荐几个学习教程。

懒得截图了

获取方式:公众号回复

『Python基础教程视频』

爬虫的思想

网络爬虫其实没想象的那么难,掌握基本的Python基础之后,就可以学习了,爬虫最重要的是爬虫思维,你要了解爬虫的工作原理,开始的时候,学习底层的urllib库或者requests库就可以了,了解爬虫是怎么实现的,然后怎么防止屏蔽和突破反爬,以及怎么储存数据和大规模高速爬取。深入理解这个爬虫的思维之后,以后写爬虫都是按部就班的了,直接使用Scrapy框架。以后可能会有新的反爬出现,那以后主要的问题就是不断解决这个反爬问题就可以了。这里只是简单讲述一下这个爬虫思维,这个很重要,理解了以后学习起来非常容易,下面推荐大家阅读我之前写的一篇学习爬虫的文章,很详细,也提供了学习的方法和一些教程,大家可以参考一下。

现在我们已经有获取数据源的方法了,下面开始学习Python数据分析。

数据分析从入门到放弃?

很高兴,你坚持看到这里,或者说你可以坚持把前面的都学了。相信这个时候你随便都可以找到一些工作了,但是从事数据分析的学习还没开始。继续苦逼的学习。

统计学基础

统计学基础是必须的,因为后续的学习会涉及到很多数理统计的知识。

这里推荐一些统计学的基础知识。

部分教程截图如下

获取方式:公众号回复

『统计学教程』

Excel的学习

Excel这是基本的技能,大家必须要掌握的,其实可能90%的数据分析都可以用Excel做,Excel的功能当然很强大,只是你还没学到Excel高级罢了。不管怎么样,Excel是一个数据分析人员基本的技能,必须要掌握。

还有数据分析人员经常需要展示分析结果,所以office是必须要会的,这里我建议大家使用office2010,因为稳定。下面给出office2010的下载激活以及office的一些教程。

好吧,其实重点还是Excel,这里给出王佩丰老师的Excel教程,有2个,贵精不贵多,都是精品。大概有10G左右

获取方式:公众号回复

『Excel教程』

数据库的学习

数据库也不会很难,就是四个字

『增、删、查、改』

熟悉常用的SQL语法是必须的

主流的数据库有MySQL,Orcle,SQL Sercer

这里推荐学习MySQL,其实这三个数据库有什么区别大概可以自行Google一下,然后这是三个数据库的SQL语法基本是一样的,精通一个之后学习其他的也会容易很多。

最重要的是掌握SQL语法和常用的语句。

MySQL的安装以后再写文章详细写吧,不过相信大家都可以安装成功的,这里我推荐先安装免安装版,再安装一个图形化界面即可。

这里推荐一些教程,选择一两个学习即可。部分截图如下,太多就不全部截图了,大概几十个G吧

获取方式:公众号回复

『数据库教程1』

『数据库教程2』

Python数据分析

这里我推荐一些教程先,教程很多很多。。。暂时先发几个吧

后续还会继续发出来的

获取方式:公众号回复

『Python数据分析教程』

我建议边看视频边敲代码,并且多看几次。

学习网站

下面这三个网站都是值得推荐,也是可以实战的地方。

不管是学生还是职场人士,参加kaggle比赛并获得较高的名次,对寻求offer都是有很大的帮助。

https://tianchi.aliyun.com/

https://www.datacamp.com/

https://www.kesci.com/

https://www.kaggle.com/

这个网站可能国内上不了?可能很难打开吧,不开VPN我好像进不了这个网站,开了VPN就正常进入了。

授人以鱼不如授人以渔

我不是很喜欢详细的写具体的某个知识点,因为我觉得大家认真去学习的话,这些问题完全可以解决,就算不行,大家可以Google或者在一些交流群理讨论就可以了。我喜欢给大家提供一些指导性的建议。学习过程是很漫长的,希望大家都可以坚持下来。或许以后会详细写一些具体的某个知识点的学习吧,但是现在还是写一个学习过程吧。

可能以后会建个群吧,方便给大家发一些资料教程,还有也方便大家讨论学习,暂时比较忙,也没时间弄这些。

本公众号每天都会更新,每周至少会写一到两篇教程文章。其他时间都会给大家推送好用的软件,当然如果是需要注册购买的软件,我肯定会给大家附上注册教程的,这个是必须的

如果大家有什么其他的建议或者需要,都可以公众号留言,我会看到消息会给大家回复的,需要什么资料软件的,也可以帮大家找找。

希望大家都能在这里收货到自己需要的资源,在这里有所成长,也希望本公众号真的能帮大家解决一些问题。

能关注公众号的都是我的朋友,希望大家一直关注下去,我会给大家写更多优质的文章,分享更多优质的内容的。

那些拿完资源就取消关注的,我是很心寒的,不过一直关注的我都是很高兴的,我肯定会每天都更新,给大家推送更多有用的知识和资源的。

看完文章麻烦大家点个赞,算是对小编辛苦写文章的支持了。要是慷慨给我打赏几个零花钱我也是很高兴哒也欢迎大家分享给更多需要的朋友

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180609G03W9000?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券