专栏首页快学Python一个函数、一个案例,手把手带你学习Pandas统计汇总函数!

一个函数、一个案例,手把手带你学习Pandas统计汇总函数!

人生苦短,快学Python!

前几天看到一篇文章,给大家列出了Pandas的常用100函数,并将这100个函数分成了6类:统计汇总函数数据清洗函数数据筛选绘图与元素级运算函数时间序列函数和其他函数

但是只是单纯的罗列,并没有给出使用说明,相信很多朋友看了还是不会。

因此,今天这个文章,我将会带大家用 "案例教学" 的方式,学会这100个Pandas函数。

限于篇幅,为了方便大家学习,我这里先分类教学。今天为大家讲述统计汇总函数中的26个函数。

注明: 由于实际问题中,表格数据每一行代表一个样本,每一列代表一个字段,一般情况下对行操作的意义不大,主要是对每个不同列进行操作。因此,下面我们仅讲述对列的操作。

为了讲述这些函数,我们先构造一些数据源,方便我们用于操作。

import numpy as np
import pandas as pd

data = [[1, 2, np.nan], [2, np.nan, 3], [7, 8, 9], [3, 4, 5]]
date_range = pd.date_range(start="20180701", periods=4)
df1 = pd.DataFrame(data=data, index=date_range,
                   columns=['a', 'b', 'c'])
df1

df2 = pd.DataFrame({'Q':['LI','ZHANG','ZHANG','LI','WANG'], 
                   'A' : [1,1,1,2,2], 
                   'B' : [1,-1,0,1,2], 
                   'C' : [3,4,5,6,7]})
df2

df3 = pd.DataFrame({"id":[f"00{i}" for i in range(1,8)],
                   "score":[2,3,4,5,6,7,8]})
df3

df4 = pd.DataFrame({"姓名":["张三","李四","王五","赵六","沈七"],
                    "语文":[85,85,85,95,90],
                    "数学":[90,65,75,80,55],
                    "外语":[55,50,40,55,40]})
df4

1. max和min

min():计算最小值;max():计算最大值;

2. sum

sum():求和;

3. mean

mean():求均值;

4. count

count():计数(统计非缺失元素的个数);

5. size

size:计数(统计所有元素的个数);

6. median

median():计算中位数;

7. var

var():计算方差;

8. std

std():计算标准差;

9. quantile

quantile():计算任意分位数;

10. mode

mode():计算众数;

11. describe

describe():描述性统计(一次性返回多个统计结果);

12. groupby、aggregate

groupby():分组;aggregate():聚合运算(可以自定义统计函数);

上面已经很清楚为大家展示了,分组后的数据形式。其实一旦使用groupby后,系统会自动为你分组,然后我们就可以分别对分组后的数据,进行操作,比如下面这个案例。

13. argmin、argmax

argmin():寻找最小值所在位置;argmax():寻找最大值所在位置;

注意:这两个函数,用于函数删选,很有用。

14. any、all

any():返回是否所有元素都为真;all():返回是否至少一个元素为真;

上述代码的意思:判断班级各科成绩是否都在60分以上。

15. value_counts

value_counts():频次统计;

16. cumsum、cumprod

cumsum():运算累计和;cumprod():运算累计积;

17. pct_change

pct_change():运算比率(后一个元素与前一个元素的比率);

运算规律是:(后一个值 - 前一个值) / 前一个值;

本文分享自微信公众号 - 快学Python(kxpython),作者:黄伟呢

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-07-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 数据分析必备!Pandas实用手册(PART III)

    ? https://colab.research.google.com/drive/1WhKCNkx6VnX1TS8uarTICIK2ViPzNDjw

    NewBeeNLP
  • 这里有 300 篇 Python 与机器学习类原创笔记

    主要包括计算机科学中基本的算法与数据结构,结合算法思想和Leetcode实战,总结介绍。

    好好学java
  • 数据整理中经典的分类汇总问题的Python实现

    ? 数据分析职场新人,精通一门语言至关重要。写个web服务,可以用python、 写个服务器脚本,可以用python、 数据清洗和网络爬虫,可以用python...

    CDA数据分析师
  • 统计师的Python日记【第5天:Pandas,露两手】

    本文是【统计师的Python日记】第5天的日记 回顾一下: 第1天学习了Python的基本页面、操作,以及几种主要的容器类型; 第2天学习了python的函数、...

    数说君
  • 4段简短代码教你用Python读写Excel

    导读:数据分析将作为一门通用技能,进入越来越多的不同工作中。毕竟“技多不压身”,掌握数据分析,一方面可以提升自己相应的业务能力,另一方面也可以让自己建立一种从数...

    华章科技
  • 懂Excel轻松入门Python数据分析包pandas(二十一):透视表

    > 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析...

    咋咋
  • 图解pandas模块21个常用操作

    Pandas 是 Python 的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。Pandas 的目标是成为 Py...

    超哥的杂货铺
  • 懂Excel轻松入门Python数据分析包pandas(二十一):透视表

    > 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析...

    Excel催化剂
  • 最全面的Pandas的教程!没有之一!

    Pandas 是基于 NumPy 的一个开源 Python 库,它被广泛用于快速分析数据,以及数据清洗和准备等工作。它的名字来源是由“ Panel data”(...

    一墨编程学习
  • 【阅读清单】系列文章清单列表(三)

    分布式系统学习 https://cloud.tencent.com/developer/inventory/2708

    云加社区
  • 还在纸上谈兵?第一份工作前获得数据科学实战经验的3种方法

    许多公司通常需要硕士学位和至少2-3年的工作经验,这对进入数据科学领域尤其困难。话虽如此,作者仍然有很多宝贵的资源想和你们分享。

    大数据文摘
  • 5分钟了解Pandas的透视表

    Pandas 库是用于数据分析的流行 Python 包。Pandas 中处理数据集时,结构将是二维的,由行和列组成,也称为dataframe。然而,数据分析的一...

    deephub
  • 如何使用统计显着性检验来解释机器学习结果

    在比较两种不同的机器学习算法或比较相同的算法与不同的配置时,收集一组结果是一个好习惯。

    老人雨何
  • 【阅读清单】系列文章清单列表(一)

    Centreon+Nagios实战 https://cloud.tencent.com/developer/inventory/272

    云加社区
  • Python+Excel数据分析实战:军事体能考核成绩评定(一)项目概况

    Excel(Microsoft office)是现在最常用的办公软件,主要涉及电子表格制作、数据处理、报表输出展示以及更高端的还有金融建模等;我们知道,在需要批...

    张国平
  • 机器学习&人工智能博文链接汇总

    ? 争取每天更新 ? 126 ? ---- 蜗牛的历程: [入门问题] [机器学习] [聊天机器人] [好玩儿的人工智能应用实例] [Tensor...

    杨熹
  • 独家 | 手把手教你用Python的Prophet库进行时间序列预测

    本文为大家介绍了如何在Python中使用由Facebook开发的Prophet库进行自动化的时间序列预测,以及如何评估一个由Prophet库所搭建的时间序列预测...

    数据派THU
  • 小白学数据 | 28张小抄表大放送:Python,R,大数据,机器学习

    大数据文摘
  • Pandas速查手册中文版

    本文翻译自文章: Pandas Cheat Sheet - Python for Data Science,同时添加了部分注解。 对于数据科学家,无论是数据分析...

    Niucas_Mao

扫码关注云+社区

领取腾讯云代金券