Python数据分析学习(一)(更新版

一个月的实习结束了,剩下的时间做一点自己感兴趣的事情,学一学如何用Python做数据分析,主要是中国大学MOOC上面嵩天老师的教程作为入门,以及自己的PDF数据Python for Data Analysis。现在暂时把R和MATLAB卸载了,因为感觉自己要用到的东西使用Python就可以完成了。等到用的时候再下载,免得现在占用内存。之前用R主要是作图,MATLAB主要是数值计算,现在在学习的的Python的pandas库和matplotlib库已经可以胜任了。减轻了负担,也减少了学习压力。

工具:

1、Anacoda:

condainstall numpy scipy pandas

解释:conda一次可以安装多个软件包。上面这个指令就可以一次安装好numpy,scipy, pandas,不过只要下载了anaconda就足够了!这些常用的包一应俱全!因为某些原因,在国内下载这些package会遇到各种各样的问题。而anaconda已经将这些常用的package打包完毕,使用的时候导入即可。比如我要使用numpy这个package,就可以使用以下命令:

import numpy as np

conda

是一个包和版本控制工具

spyder

是一个编写和调试python代码的工具,暂时使用它是因为它比较小巧,具体的比PyCharm强大的功能暂未发现。

Ipython

类似于之前的python交互式,不过更加丰富,加入了许多魔法函数(这里我用到的功能暂时不是很多)

%run运行某个demo文件

2、Spyder(Anacoda自带)

三个库:

1、Numpy库(科学计算基础库)

numpy的哲学,将向量当做数据

一维向量可以去掉循环,使得向量的运算更像数据!!!这里是很重要的一个因素!

这个库,主要了解了如何创建ndarray数组,以及数组的变形,维度的升降。

以及一维数据,二维数据,多维数据和高维数据。以及一些基本的函数比如:np.sqrt()、np.square()等。以及数据的保存与导入。

2、Matplotlib库(绘图库),主要是了解了如何作图,以及精细化处理图表,但是感觉并没有比stata和matlab作图好多少,不过可能更加方便一些,以后一般的绘图就使用它了。学完这个之后就可以看seaborn库了,更多丰富的作图功能!

3、Pandas库(数据清洗,处理),很强大,也用它解决了不少的问题,目前也还正在学习之中,不得不说pandas库在数据清洗、数据预处理方面有十分强大的功能!

——————————————————————

大家有什么问题可以留言问我~我争取让这篇文章越来越丰富~

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181208G0E2ZC00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券