〇,pandas简介
pandas是python数据分析领域最为经典的库之一,基于numpy构建。
pandas中常用的数据结构有:
1,Series:一维数组,有index。Series中只允许存储同种类型数据。
2,DataFrame:二维的表格型数据结构。可以将DataFrame理解为Series的容器。
3,Panel :三维的数组。可以理解为DataFrame的容器。
你发现 pandas库的名字和这三种数据结构名字的关系了吗?本节和接下来的几节我们介绍DataFrame。DataFrame是python在数据分析领域使用最广泛的数据结构。具有以下优点:
数据直观 ———— 就像一个excel表格
功能强大 ———— 极其丰富的方法
DataFrame的概要如下:
DataFrame是一个Series容器,创建和索引方式和Series很像。
DataFrame可以看成是一个有index和columns名称的array,支持向量化。
你可以像操作excel表一样操作DataFrame:插入行和列,排序,筛选……
你可以像操作SQL数据表一样操作DataFrame:查询,分组,连接……
本节我们介绍DataFrame的类array操作。
一,向量化运算
二,数据类型转换
1,创建时指定类型
2,强制类型转换
3,转换成适当数值类型
三,常用统计分析函数
Python与算法之美
(Python_Ai_Road)
领取专属 10元无门槛券
私享最新 技术干货