前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据科学小技巧3:数据透视表

数据科学小技巧3:数据透视表

作者头像
陆勤_数据人网
发布2020-03-25 17:54:01
1.1K0
发布2020-03-25 17:54:01
举报

这是我的第78篇原创文章,关于Python语言和数据科学。

阅读完本文,你可以知道:

1 使用Python语言实现数据透视表功能

“正是问题激发我们去学习,去实践,去观察。”

数据透视表是Excel里面常用的分析方法和工具,通过行选择,指定需要分组指标;通过列选择,指定需要计算指标,最后在指定需要聚合计算类型,比方说是计数,还是求均值,还是累加和等等。

第三个数据科学小技巧:数据透视表。前面的数据科学小技巧,可以点击下面链接进入。

  • 数据科学小技巧系列

1数据科学小技巧1:pandas库apply函数

2数据科学小技巧2:数据画像分析

我们用Python语言和pandas库轻松实现数据透视表功能。

参考代码如下(notebook版本)。

第一步:导入Python库

第二步:导入数据集

第三步:数据检视

第四步:数据透视表

我们使用pandas库的pivot_table函数,重要参数设置:

  1. index参数:指定分组指标
  2. values参数:指定计算的指标
  3. aggfunc参数:指定聚合计算的方式,比方说求平均,累加和

数据透视表结果

思考题

1 请查阅pivot_table函数的文档,了解各个参数的使用方法。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-03-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据科学与人工智能 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档