(小白自学日志,敬请大神批评指正)
随着职业分工的精细化,产生了海量数据,其价值受到越来越多公司的重视。比如我们可以从历史数据中预测趋势,从数据统计分布中评估企业短板,更可以预测客户的潜在需求,利用专门的分析工具,可以直观的得出数据同比、环比的增长效果。因此,数据分析意义很大,随着信息技术的发展,学习这样的一门技术,对于个人求职、发展必将好处多多。
由于工作需要,加上那么一点兴趣,小编开始自学数据分析,现把学习上的一些心得分享给大家,学习路线如下:
图1 学习路线图
下面,对于要学习的东西简单做一下介绍:
Python:你可以想象计算机是一个无条件服从你指令的机器,前提是它得听得懂你给它说的啥。计算机世界中,编程语言很多,Python就是一种,类似于人类语言中的汉语或英语,利用它你可以进行web开发、与数据库进行交互、数据分析。Python的特点是有很多第三方库,就是别人编好的程序打成一个包,你可以直接导入使用,比如你若想画各种图表,只需要导入matplotlib库,就可以制造饼形图、折线图、条形图和热力图。
Anaconda: anaconda是一个开源的发行版本,包含了numpy、scipy、sympy、matplotlib、pandas等数据分析常用的第三方库,而且里面有一个简单的集成开发环境Spyder,工作界面类似于MATLAB的工作空间,其界面如下所示:
图2 Spyder工作界面
MySQL数据库:MySQL是web世界中使用最广泛的数据库之一,本质上类似于Excel表,设定完表头之后你可以一行一行的插入数据,不同的表之间还可以相互关联。其体积小、速度快、总体拥有成本低,并且开放源码,免费。
图3 MySQL数据结构展示
Tableau:tableau是一款数据分析软件,其优点是将数据运算与美观的图表完美地嫁接在一起,被称为数据分析界的女神。应用上比较容易上手,把Excel或者数据库的数据导入tableau内,把数据拖到画布上就可自动生成图表,工作界面如下:
图4 tableau工作界面展示
anaconda官网:https://www.anaconda.com/download/
接下来,让我们一起学习吧!
领取专属 10元无门槛券
私享最新 技术干货