〇,pandas简介
pandas是python数据分析领域最为经典的库之一,基于numpy构建。
pandas中常用的数据结构有: 1,Series:一维数组,有index。Series中只允许存储同种类型数据。 2,DataFrame:二维的表格型数据结构。可以将DataFrame理解为Series的容器。 3,Panel :三维的数组。可以理解为DataFrame的容器。
你发现 pandas库的名字和这三种数据结构名字的关系了吗?本节和接下来的几节我们介绍DataFrame。DataFrame是python在数据分析领域使用最广泛的数据结构。具有以下优点:
DataFrame的概要如下:
本节我们介绍DataFrame的类Series操作。
一、创建DataFrame
1,类型转换法
2,文件导入法
3,逐列生成法
二,DataFrame的索引
DataFrame的索引和Series非常相似,支持下标索引,标签索引和布尔索引(标签指index或columns)。通常可以通过以下一些方式实现:方括号[],句点符号,loc,iloc,ix。最常使用的是方括号,loc,和iloc。
1,仅选择行
2,仅选择列
3,同时选择行和列
4,布尔索引