专栏首页Python碎片公众号的专栏Pandas知识点-统计运算函数

Pandas知识点-统计运算函数

统计运算非常常用。本文介绍Pandas中的统计运算函数,这些统计运算函数基本都可以见名知义,使用起来非常简单。

本文使用的数据来源于网易财经,具体下载方法可以参考:Pandas知识点-DataFrame数据结构介绍

一、数据准备

数据文件是600519.csv,将此文件放到代码同级目录下,从文件中读取出数据。

为了使数据简洁一点,只保留数据中的部分列和前100行,并设置“日期”为索引。

读取的原始数据如上图,本文使用这些数据来介绍统计运算函数。

二、最大值和最小值

max(): 返回数据的最大值。使用DataFrame数据调用max()函数,返回结果为DataFrame中每一列的最大值,即使数据是字符串或object也可以返回最大值。

在Pandas中,数据的获取逻辑是“先列后行”,所以max()默认返回每一列的最大值,axis参数默认为0,如果将axis参数设置为1,则返回的结果是每一行的最大值,后面介绍的其他统计运算函数同理。根据DataFrame的数据特点,每一列的数据属性相同,进行统计运算是有意义的,而每一行数据的数据属性不一定相同,进行统计计算一般没有实际意义,极少使用,所以本文也不进行举例。

min(): 返回数据的最小值。使用DataFrame数据调用min()函数,返回结果为DataFrame中每一列的最小值,即使数据是字符串或object也可以返回最小值。

使用Series数据调用max()或min()时,返回Series中的最大值或最小值,后面介绍的其他统计运算函数同理。

idxmax(): 返回最大值的索引。在numpy中,使用argmax()和argmin()获取最大值的索引和最小值的索引,在Pandas中使用idxmax()和idxmin(),实际上idxmax()和idxmin()可以理解成对argmax()和argmin()的封装。

idxmin(): 返回最小值的索引。

使用idxmax()和idxmin()时,一般是用Series数据调用,用DataFrame数据调用可能会报TypeError。

三、均值和中位数

mean(): 返回数据的均值。使用DataFrame数据调用mean()函数,返回结果为DataFrame中每一列的平均值,mean()与max()和min()不同的是,不能计算字符串或object的平均值,所以会自动将不能计算的列省略。

median(): 返回数据的中位数。使用DataFrame数据调用median()函数,返回结果为DataFrame中每一列的中位数,median()也不能计算字符串或object的中位数,会自动将不能计算的列省略。

使用Series数据调用mean()或median()时,返回Series中的均值或中位数。

四、标准差和方差

std(): 返回数据的标准差。

var(): 返回数据的方差。方差是标准差的平方,可以进行相互验证。

五、求和、累计求和

sum(): 对数据求和。为了避免数值过大,只取5个数据进行演示,返回结果为所有数据的和。

cumsum(): 对数据累计求和。累计求和是指,对当前数据及其前面的所有数据求和。如索引1的累计求和结果为索引0、索引1的数值之和,索引2的累计求和结果为索引0、索引1、索引2的数值之和,以此类推。

cummax(): 对数据累计求最大值。

cummin(): 对数据累计求最小值。

这两个函数的累计原理都与cumsum()相同,此外还有累计求积函数cumprod()等,分别有不同的应用场景。

六、综合统计函数

describe(): 综合统计函数,可以同时返回数据中的数据量、均值、标准差、最小值、最大值,以及上四分位数、中位数、下四分位数。可以一次返回数据的多个统计属性,使用起来很方便。

此外,还有一些统计函数本文没有介绍,比如count()统计数据量、abs()求绝对值等。假如Pandas提供的函数不满足我们的统计需求,还可以借助apply()函数自定义统计运算,后面的文章再继续介绍。

本文分享自微信公众号 - Python 碎片(python-suipian),作者:binn.wong

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-04-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Pandas知识点-算术运算函数

    算术运算是最基本的运算,看起来很简单,但也有一些需要注意的地方,本文中会依次介绍。

    Python碎片公众号
  • Pandas知识点-逻辑运算

    逻辑运算在代码中基本是必不可少的,Pandas的逻辑运算与Python基础语法中的逻辑运算存在一些差异,所以本文介绍Pandas中的逻辑运算符和逻辑运算。

    Python碎片公众号
  • Pandas知识点-绘制统计图

    使用matplotlib可以绘制各种各样的统计图,Pandas对matplotlib中的绘图方法进行了更高层的封装,使用起来更简单方便。

    Python碎片公众号
  • 零基础Python学习路线及阶段学习目标

      1、Python编程基础,语法规则,函数与参数,数据类型,模块与包,文件IO,培养扎实的Python编程基本功,同时对Python核心对象和库的编程有熟练的...

    python学习教程
  • 2020年 Python学习路线及学习目标规划 拿走不谢!

    找不到完整的学习路线?小编分享2020年Python学习路线及学习目标规划拿走不谢,Python作为今年来特别受欢迎的编程语言,是AI时代头牌语言AI领域的敲门...

    python学习教程
  • BAT等大厂Android面试书单和知识点清单Java知识Android知识java设计模式知识算法和数据结构知识计算机系统知识数据库知识计算机网络知识Android开源项目知识

    Java知识 java是Android开发的基础,在BAT的初面中,会涉及到比较多的java基础知识,所以比较重要,下面我介绍的书籍内容是由浅到深。 1....

    何时夕
  • python 函数嵌套及多函数共同运行知识点讲解

    2.关于多个函数共同运行,最重要的区分点就是,变量的作用域,有局部变量和全局变量,局部作用于不能使用其他局部作用域内的变量

    砸漏
  • Python进阶之Pandas入门(一) 介绍和核心

    Pandas是数据分析中一个至关重要的库,它是大多数据项目的支柱。如果你想从事数据分析相关的职业,那么你要做的第一件事情就是学习Pandas。

    HuangWeiAI
  • Pandas

    Attitude is a little thing that makes a big difference.

    小闫同学啊

扫码关注云+社区

领取腾讯云代金券