Pandas基础(1)
在阅读本文之前,请确保已经阅读了以下文章:
经过前面几期关于Numpy的介绍之后,我们现在可以入坑pandas了,走吧,一起去瞧瞧这pandas到底是谁家的熊猫
我们约定,文中所有pandas均以pd形式来代替,即:
同时,因为pandas的操作是基于numpy的,所以我们仍然需要引入numpy:
准备好了以上这些,我们开始进入正题
1
创建一维Series
2
创建多维DataFrame
在创建DataFrame之前,我们首先来创建其行标签(这里,我们创建日期标签):
现在来创建DataFrame:
这里的index是行索引。
如果我们不去定义其行索引(index)和列标签(columns),会出现什么呢,试一下:
结果表明:若不去定义其行索引(index)和列标签(columns),则按Python默认的索引方式进行执行且将索引值作为行or列标签。
创建DataFrame还可以使用字典,演示如下:
>>>df2=pd.DataFrame({'A':1.0,
3
'B':pd.Timestamp('20180314'),
4
'C':pd.Series(1,index=list(range(4)),dtype='float32'),
5
'D':np.array([3]*4,dtype='float32')})
6
7
ABCD
8
1.02018-3-141.03.0
9
11.02018-3-141.03.0
10
21.02018-3-141.03.0
11
31.02018-3-141.03.0
12
```
3
查看DataFrame的数据特征
4
排序
我们可以使用sort_index函数,按照行or列标签进行排序,其中,axis=0代表按行标签排序,axis=1表示按照列进行排序,默认为正序排列,通过修改ascending的布尔值来实现逆序排序,演示如下:
此外,如果要按照值得大小进行排序,则使用sort_value函数来操作,参数为by=‘’,代表按照哪一列值进行排序.
我们在df2后面新增一列:
然后按照E列进行升序排序:
以上为个人学习笔记,边学边码,仅供参考。
连载中
关注我们
领取专属 10元无门槛券
私享最新 技术干货