教程地址:http://www.showmeai.tech/tutorials/33
本文地址:http://www.showmeai.tech/article-detail/145
声明:版权所有,转载请联系平台与作者并注明出处
Pandas最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发团队继续开发和维护,属于PyData项目的一部分。Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)。
Pandas是Python中最常用到的数据操作和分析工具包,它构建在Numpy之上,具备简洁的使用接口和高效的处理效率。数据科学、机器学习AI应用过程,涉及数据清洗和分析的操作也频繁使用到Pandas。
Pandas有着与Numpy类似的代码风格,但Pandas主要基于其Dataframe对象处理表格型或异质型数据,而之前介绍到的Numpy更适合处理同质的数值类型数据。
当我们提到python数据分析的时候,大部分情况下都会使用Pandas进行操作。本篇为pandas系列的导语,对pandas进行简单介绍,整个系列覆盖以下内容:
可以在命令行基于以下命令安装pandas(如果使用anaconda集成环境,内置环境自带pandas,无需安装):
pip install pandas
conda install pandas
python3 -m pip install --upgrade pandas
对于Linux,比如Ubuntu,可以使用下面的方法安装,但可能出现各种依赖缺失或者安装错误:
sudo apt-get install python-numpy python-scipy python-matplotlib ipython python-pandas python-sympy python-nose
安装完Pandas后,我们就可以在python环境中导入它了:
import pandas as pd
有时候,我们会单独导入pandas包含的两个重要数据结构:
from pandas import Series, DataFrame
可以如下查看当前Pandas的版本信息:
pd.__version__
本教程系列的代码可以在ShowMeAI对应的github中下载,可本地python环境运行,能科学上网的宝宝也可以直接借助google colab一键运行与交互操作学习哦!