前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据分析-pandas库快速了解

数据分析-pandas库快速了解

作者头像
叶子陪你玩
发布2020-05-28 17:30:36
1.2K0
发布2020-05-28 17:30:36
举报
文章被收录于专栏:叶子陪你玩编程

1.pandas是什么库

Pandas是Python第三方库,提供高性能易用数据类型和分析工具,pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

与numpy对比区别:

2.pandas库怎么用

安装

代码语言:javascript
复制
pip install pandas

导入

代码语言:javascript
复制
import pandas as pd

3.pandas两个数据类型

两个数据类型:Series, DataFrame

Series类型

Series类型由一组数据及与之相关的数据索引组成

第一列的0,1,2,3是自动索引,第二列是实际数据值,最后的dtype表示数据类型

Series类型数据的常见创建方式

python列表
标量值
python字典
ndarray

Series类型数据的基本操作

获得索引和数据
更改索引
索引
切片

DataFrame类型

DataFrame类型由共用相同索引的一组列组成,是一个表格型的数据类型,每列值类型可以不同,既有行索引、也有列索引,常用于表达二维数据。

DataFrame类型数据的常见创建方式

二维ndarray对象
一维ndarray、列表、字典、元组或Series构成的字典

DataFrame类型数据的基本操作

获得行列索引和数据
更改行列索引
选择数据

索引切片获取列数据和单个数据

索引切片获取行数据

iloc():按照索引的位置来选取,这里要注意这种方式是包含切片的末尾的数据的

loc():按照索引index的值选取,如果没有自定义值,行数据也可以通过切片获取。

4.查看数据

5.文件数据读取和保存

保存

读取

这里多了一列数据是因为上面写入时把索引写入了,可以再写入时去掉index,to_csv(file,index=False)

限于篇幅原因,还有更多内容(空值处理,分组,合并,排序,删除等),这个会在后面的具体场景中应用。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-05-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 叶子陪你玩编程 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.pandas是什么库
  • 2.pandas库怎么用
    • 安装
      • 导入
      • 3.pandas两个数据类型
        • Series类型
          • Series类型数据的常见创建方式
            • python列表
            • 标量值
            • python字典
            • ndarray
          • Series类型数据的基本操作
            • 获得索引和数据
            • 更改索引
            • 索引
            • 切片
          • DataFrame类型
            • DataFrame类型数据的常见创建方式
              • 二维ndarray对象
              • 一维ndarray、列表、字典、元组或Series构成的字典
            • DataFrame类型数据的基本操作
              • 获得行列索引和数据
              • 更改行列索引
              • 选择数据
          • 4.查看数据
          • 5.文件数据读取和保存
            • 保存
              • 读取
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档