精彩文章
文末免费领取500G干货教程
今日分享:Series数据结构
上篇文章Pandas基础入门已对Pandas及其主要数据结构概念有所提及
创建Series:
创建方法还是挺多的,但道理都是一样,下面列取几种方式:
In [43]: obj1 = pd.Series([4,7,-5,3])
In [44]: obj1
Out[44]:
0 4
1 7
2 -5
3 3
dtype: int64
直接通过列表存储数据创建
In [47]: obj2 = pd.Series({'name':'tom','age':'13','gender':'male'
...: })
In [48]: obj2
Out[48]:
age 13
gender male
name tom
dtype: object
通过字典创建,需要注意 字典的键将会成为其索引
In [49]: data = (1,2,3,4)
In [50]: obj3 = pd.Series(data)
In [51]: obj3
Out[51]:
0 1
1 2
2 3
3 4
dtype: int64
先通过创建一个变量,例如代码中是创建了一个元组,上述的列表及字典也适用该方法,元组也可采用上面提到的直接创建方法。
Series重要属性:
Series对象本身及其索引都有一个name属性,可对其进行自定义
In [67]: obj1.name = 'new_Series'
In [68]: obj1.index.name = 'new_index'
In [69]: obj1
Out[69]:
new_index
e 64
f 7
g -5
h 3
Name: new_Series, dtype: int64
这一点内容和Pandas的其他内容的关系是非常紧密的,所以在这提及一下。
In [52]: obj1.index
Out[52]: RangeIndex(start=0, stop=4, step=1)
查看索引,其将会显示该Series的全部索引
In [53]: obj1.values
Out[53]: array([ 4, 7, -5, 3], dtype=int64)
查看值,显示该Series的全部值
改变索引:
In [55]: obj1 = pd.Series([4,7,-5,3],index = ['e','f','g','h'])
In [56]: obj1
Out[58]:
e 4
f 7
g -5
h 3
dtype: int64
在创建Series时,如果不指定索引,其将默认0,1,2。。。等作为其索引,若制定,将显示指定的索引。
In [57]: obj1.index = ['a','b','c','d']
In [58]: obj1
Out[56]:
a 4
b 7
c -5
d 3
dtype: int64
上示也可使用赋值方法改变索引
查看部分值
查看值的方式和Python中的列表及Numpy中查看值的方式相同
In [60]: obj1['e']
Out[60]: 4
In [61]: obj1[0]
Out[61]: 4
上述两种都是通过索引查看单个值,既可以通过设定的索引查看,也可以通过默认的0123索引查看,效果是一样的。
查看多个值时,可以通过列表方式查看多个间断或连续值,也可使用冒号方法查看多个连续值,如下:
In [63]: obj1[['e','f']]
Out[63]:
e 4
f 7
dtype: int64
In [64]: obj1['e':'g']
Out[64]:
e 4
f 7
g -5
dtype: int64
重新赋值:
In [65]: obj1['e'] = 64
In [66]: obj1
Out[66]:
e 64
f 7
g -5
h 3
dtype: int64
以后对于改变值的内容还会讲到,因为这部分内容涉及到在进行数据分析时如何对空值进行处理。
利用pd.isnull(obj1)和pd.notnull(obj1)或obj1.isnull()和obj1.notnull()可以判断Series中的空值及真值,通常用来判断是否存在缺失值,其返回的结果是布尔值
上述未展开介绍的内容以后会详细介绍
干货免费分享
关注公众号即可一键领取
省去找资料的麻烦
为您的学习保驾护航
您的点赞与转发是我们前进的最大动力!!!
扫码赞赏
扫二维码进交流学习群
最新同步更新资料请到该QQ群获取
领取专属 10元无门槛券
私享最新 技术干货