千呼万唤,数据分析系列教程终于要来了,错过了爬虫的朋友,但这次就不要错过数据分析,今年只有三个月时间了,我希望今年过完每个人都能用数据分析搞事情!
下面的文章是我数据分析教程第一弹的介绍,
数据采集,清洗,建模,分析,决策等一系列过程! 另外大数据分析才更具有价值,一般大数据分析工程师的工资都是惊人的.
如今我们正处于一个DT时代(data time) , 对海量数据分析处理有利于我们做出正确决策.
金融业,经济学,统计学,广告学,网络分析,营销方案,神经科学
确定项目>>制定方案>>数据采集>>数据清洗>>建模>>分析>>可视化
科学计算包:numpy
数据分析库:pandas 提供了能够快速便捷地处理结构化数据的大量数据结构和函数,这是Python能成为强大而高效的数据分析环境的重要法宝.
绘图:matplotlib 这是最流行的用于绘制数据图表的Python库,能与Python很好的结合,因而提供了一种非常好用的交互式数据绘图环境,绘制的图表也是交互式的.
这里主要介绍两个IDE环境Pycharm和Jupyter,其实这两个IDE有各种的好处,看大家喜欢用那个环境了,我们系统教程会穿插两个IDE一起来学习
学习环境我们继续使用Pycharm来学习Python数据分析,在这里我们首先去安装三个库Numpy,Pandas,MapPlotlib三个库,怎么安装,自行百度! 为什么会选用Pycharm来做数据分析呢,主要是前面我们都是用这个工具,对这个工具比较熟悉,另外这个工具也比较人性化,完全能满足我们学习的需求.
关于Pycharm使用不再进行过多的描述,我们重点是使用Jupyter来学习数据分析.
这是一款基于浏览器的IDE,也能很方便的满足我们使用需求
安装:pip install jupyter notebook
在终端或控制台中输入:
启动:jupyter notebook
然后会提示打开一个浏览器,
tips: 1. 选中那一个,就可以直接去运行当前片区代码 2. 如果你要调用那个函数,可以按tab键补全你要使用的函数
下面看截图,来简单介绍一下使用jupyter.