一个月的实习结束了,剩下的时间做一点自己感兴趣的事情,学一学如何用Python做数据分析,主要是中国大学MOOC上面嵩天老师的教程作为入门,以及自己的PDF数据Python for Data Analysis。现在暂时把R和MATLAB卸载了,因为感觉自己要用到的东西使用Python就可以完成了。等到用的时候再下载,免得现在占用内存。之前用R主要是作图,MATLAB主要是数值计算,现在在学习的的Python的pandas库和matplotlib库已经可以胜任了。减轻了负担,也减少了学习压力。
工具:
1、Anacoda:
condainstall numpy scipy pandas
解释:conda一次可以安装多个软件包。上面这个指令就可以一次安装好numpy,scipy, pandas,不过只要下载了anaconda就足够了!这些常用的包一应俱全!因为某些原因,在国内下载这些package会遇到各种各样的问题。而anaconda已经将这些常用的package打包完毕,使用的时候导入即可。比如我要使用numpy这个package,就可以使用以下命令:
import numpy as np
conda
是一个包和版本控制工具
spyder
是一个编写和调试python代码的工具,暂时使用它是因为它比较小巧,具体的比PyCharm强大的功能暂未发现。
Ipython
类似于之前的python交互式,不过更加丰富,加入了许多魔法函数(这里我用到的功能暂时不是很多)
%run运行某个demo文件
2、Spyder(Anacoda自带)
三个库:
1、Numpy库(科学计算基础库)
numpy的哲学,将向量当做数据
一维向量可以去掉循环,使得向量的运算更像数据!!!这里是很重要的一个因素!
这个库,主要了解了如何创建ndarray数组,以及数组的变形,维度的升降。
以及一维数据,二维数据,多维数据和高维数据。以及一些基本的函数比如:np.sqrt()、np.square()等。以及数据的保存与导入。
2、Matplotlib库(绘图库),主要是了解了如何作图,以及精细化处理图表,但是感觉并没有比stata和matlab作图好多少,不过可能更加方便一些,以后一般的绘图就使用它了。学完这个之后就可以看seaborn库了,更多丰富的作图功能!
3、Pandas库(数据清洗,处理),很强大,也用它解决了不少的问题,目前也还正在学习之中,不得不说pandas库在数据清洗、数据预处理方面有十分强大的功能!
——————————————————————
大家有什么问题可以留言问我~我争取让这篇文章越来越丰富~
领取专属 10元无门槛券
私享最新 技术干货