首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Pandas数据分析之Series和DataFrame的基本操作

Pandas数据分析之Series和DataFrame的基本操作

作者头像
小草AI
发布2019-10-14 15:53:05
1.1K0
发布2019-10-14 15:53:05
举报
转自:志学python
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
一、reindex() 方法:重新索引

针对 Series 的重新索引操作 重新索引指的是根据index参数重新进行排序。如果传入的索引值在数据里不存在,则不会报错,而是添加缺失值的新行。不想用缺失值,可以用 fill_value 参数指定填充值。

fill_value 会让所有的缺失值都填充为同一个值,如果不想这样而是用相邻的元素(左或者右)的值填充,则可以用 method 参数,可选的参数值为 ffill 和 bfill,分别为用前值填充和用后值填充:

针对 DataFrame 的重新索引操作
二、drop() 方法:丢弃数据

针对 Series

针对 DataFrame

不仅可以删除行,还可以删除列:

三、索引、选取和过滤

针对 Series

需要注意一点的是,利用索引的切片运算与普通的 Python 切片运算不同,其末端是包含的,既包含最后一个的项。比较:

赋值操作:
针对 DataFrame
DataFrame 中的 ix 操作:
四、算术运算和数据对齐

针对 Series 将2个对象相加时,具有重叠索引的索引值会相加处理;不重叠的索引则取并集,值为 NA:

针对 DataFrame

对齐操作会同时发生在行和列上,把2个对象相加会得到一个新的对象,其索引为原来2个对象的索引的并集:

和Series 对象一样,不重叠的索引会取并集,值为 NA;如果不想这样,试试使用 add() 方法进行数据填充:

五、函数应用和映射

将一个 lambda 表达式应用到每列数据里:

除了lambda 表达式还可以定义一个函数:

六、排序

针对 Series

针对 DataFrame
七、排名
八、带有重复值的轴索引

索引不强制唯一,例如一个重复索引的 Series:

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-10-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习与python集中营 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 转自:志学python
  • 利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
  • 一、reindex() 方法:重新索引
  • 针对 DataFrame 的重新索引操作
  • 二、drop() 方法:丢弃数据
  • 针对 DataFrame
  • 三、索引、选取和过滤
  • 赋值操作:
  • 针对 DataFrame
  • DataFrame 中的 ix 操作:
  • 四、算术运算和数据对齐
  • 针对 DataFrame
  • 五、函数应用和映射
  • 六、排序
  • 针对 DataFrame
  • 七、排名
  • 八、带有重复值的轴索引
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档