首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >深入Python数据分析:数据由长格式变为宽格式

深入Python数据分析:数据由长格式变为宽格式

作者头像
double
发布2019-05-27 20:10:05
发布2019-05-27 20:10:05
1.6K0
举报
文章被收录于专栏:算法channel算法channel

pivot

pandas使用版本0.22

melt()的逆操作在Pandas中对应为 pivot(),它也是一个设计上的顶层函数,工程位置如下:

Pandas

|

pivot()

它能变形长格式表为宽格式。

pivot英文解释为:axis consisting of a short shaft that supports something that turns 包含短柄的轴,支持物体转动。怎么理解?

图1

图2

图1到图2,就是Pandas中的pivot操作。

函数原型

主要参数:

  1. index 指明哪个列变为新DataFrame的index,注意是哪个,而不是哪些;
  2. columns 指明哪个列变为columns;
  3. values 指明哪些列变为新DataFrame的数据域,如果不指明,则默认除了被指明index和columns的其他列。

上面图1到图2的变换如下,并未指明values参数,其他列全部按照层级罗列。明显地,列变宽了,变为宽格式了。

如果只想获取某一个系列,比如baz系列,执行如下操作:

图2变化为如下:

异常

pivot操作在实际应用中,可能会出现异常,原因是被选为index和columns的交叉点值应该不是唯一值。

如上,[one,A] 取值为1或2,不唯一。因此,调用如下操作,会报异常。

异常如下,

总结

以上就是pivot使用细节,注意到pivot函数是没有聚合功能的。pandas中pivot_table()提供了聚合函数,实现聚合功能。

虽然只是一个简单的函数,但是却能够快速地对数据进行强大的分析。要想用透,需要多思考,尽量应用到实际场景中。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-03-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 程序员郭震zhenguo 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档