首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas函数应用、层级索引、统计计算1.Pandas函数应用apply 和 applymap排序处理缺失数据2.层级索引(hierarchical indexing)MultiIndex索引

文章来源:Python数据分析 1.Pandas函数应用 apply 和 applymap 1....可直接使用NumPy函数 示例代码: # Numpy ufunc 函数 df = pd.DataFrame(np.random.randn(5,4) - 1) print(df) print(np.abs...通过applymap将函数应用到每个数据上 示例代码: # 使用applymap应用到每个数据 f2 = lambda x : '%.2f' % x print(df.applymap(f2)) 运行结果...值排序 sort_values(by='column name') 根据某个唯一列名进行排序,如果有其他相同列名则报错。...因为现在有两层索引,当通过外层索引获取数据时候,可以直接利用外层索引标签来获取。 当要通过内层索引获取数据时候,在list中传入两个元素,前者是表示要选取外层索引,后者表示要选取内层索引

2.3K20

Pandas Cookbook》第07章 分组聚合、过滤、转换1. 定义聚合2. 用多个列和函数进行分组和聚合3. 分组后去除多级索引4. 自定义聚合函数5. 用 *args 和 **kwargs

---- 第01章 Pandas基础 第02章 DataFrame运算 第03章 数据分析入门 第04章 选取数据子集 第05章 布尔索引 第06章 索引对齐 第07章 分组聚合、过滤、转换...) Out[3]: # 或者要选取列使用索引,聚合函数作为字符串传入agg In[4]: flights.groupby('AIRLINE')['ARR_DELAY'].agg('mean').head...更多 # Pandas默认会在分组运算后,将所有分组列放在索引中,as_index设为False可以避免这么做。...In[44]: grouped.ngroups Out[44]: 112 # 查看每个分组唯一识别标签,groups属性是一个字典,包含每个独立分组与行索引标签对应 In[45]: groups...['SATMTMID'] return int(weighted_math.sum() / df['UGDS'].sum()) # 分组,并调用apply方法,传入自定义函数

8.8K20
您找到你想要的搜索结果了吗?
是的
没有找到

Python面试十问2

五、pandas索引操作 pandas⽀持四种类型多轴索引,它们是: Dataframe.[ ] 此函数称为索引运算符 Dataframe.loc[ ] : 此函数⽤于标签 Dataframe.iloc...Pandas Series.reset_index()函数作⽤是:⽣成⼀个新DataFrame或带有重置索引Series。...Pandas提供了一系列内置函数,如sum()、mean()、max()、min()等,用于对数据进行聚合计算。此外,还可以使用apply()方法将自定义函数应用于DataFrame或Series。...九、分组(Grouping)聚合 “group by” 指的是涵盖下列⼀项或多项步骤处理流程: 分割:条件把数据分割成多组; 应⽤:为每组单独应⽤函数; 组合:将处理结果组合成⼀个数据结构。...先分组,再⽤ sum()函数计算每组汇总数据  多列分组后,⽣成多层索引,也可以应⽤ sum 函数 分组后可以使用如sum()、mean()、min()、max()等聚合函数来计算每个组统计值。

7310

python数据科学系列:pandas入门详细教程

,仅支持一维和二维数据,但数据内部可以是异构数据,仅要求同列数据类型一致即可 numpy数据结构仅支持数字索引,而pandas数据结构则同时支持数字索引和标签索引 从功能定位上看: numpy虽然也支持字符串等其他数据类型...中一列字符串进行通函数操作,而且自带正则表达式大部分接口 丰富时间序列向量化处理接口 常用数据分析与统计功能,包括基本统计量、分组统计分析等 集成matplotlib常用可视化接口,无论是series...apply,既适用于series对象也适用于dataframe对象,但对二者处理粒度是不一样:apply应用于series时是逐元素执行函数操作;apply应用于dataframe时是逐行或者逐列执行函数操作...2 分组聚合 pandas另一个强大数据分析功能是分组聚合以及数据透视表,前者堪比SQL中groupby,后者媲美Excel中数据透视表。...一般而言,分组目的是为了后续聚合统计,所有groupby函数一般不单独使用,而需要级联其他聚合函数共同完成特定需求,例如分组求和、分组求均值等。 ?

13.8K20

盘点66个Pandas函数,轻松搞定“数据清洗”!

大家好,我是小五 之前黄同学曾经总结过一些Pandas函数,主要是针对字符串进行一系列操作。在此基础上我又扩展了几倍,全文较长,建议先收藏。...df["gender"].unique() df["gender"].nunique() 输出: 在数值数据操作中,apply()函数功能是将一个自定义函数作用于DataFrame行或者列;applymap...()函数功能是将自定义函数作用于DataFrame所有元素。....set_index(['姓名','科目']).unstack('科目') 数据分组数据透视表更是一个常见需求,groupby()方法可以用于数据分组。...数据筛选 如果是筛选行列的话,通常有以下几种方法: 有时我们需要按条件选择部分列、部分行,一般常用方法有: 操作 语法 返回结果 选择列 df[col] Series 索引选择行 df.loc[label

3.7K11

python数据分析——数据分类汇总与统计

1.1分组 分组分为以下三种模式: 第一种: df.groupby(col),返回一个列进行分组groupby对象; 第二种: df.groupby([col1,col2]),返回一个多列进行分组...关键技术:对于由DataFrame产生GroupBy对象,如果用一个(单个字符串)或一组(字符串数组)列名对其进行索引,就能实现选取部分列进行聚合目的。...使用函数分组 比起使用字典或Series,使用Python函数是一种更原生方法定义分组映射。 【例6】以上一小节DataFrame为例,使用len函数计算一个字符串长度,并用其进行分组。...) 对于DataFrame,你可以定义一组应用于全部列一组函数,或不列应用不同函数。...具体办法是向agg传入一个从列名映射到函数字典: 只有将多个函数应用到至少一列时,DataFrame才会拥有层次化列 2.3.返回不含行索引聚合数据 到目前为止,所有例中聚合数据都有由唯一分组键组成索引

15210

Pandas速查卡-Python数据科学

它不仅提供了很多方法和函数,使得处理数据更容易;而且它已经优化了运行速度,与使用Python内置函数进行数值数据处理相比,这是一个显著优势。...格式字符串, URL或文件. pd.read_html(url) 解析html URL,字符串或文件,并将表提取到数据框列表 pd.read_clipboard() 获取剪贴板内容并将其传递给read_table...) 所有列唯一值和计数 选择 df[col] 返回一维数组col列 df[[col1, col2]] 作为新数据框返回列 s.iloc[0] 位置选择 s.loc['index_one'] 索引选择...df.groupby([col1,col2]) 从多列返回一组对象值 df.groupby(col1)[col2] 返回col2中平均值,col1中分组(平均值可以用统计部分中几乎任何函数替换...) df.pivot_table(index=col1,values=[col2,col3],aggfunc=max) 创建一个数据透视表,col1分组并计算col2和col3平均值 df.groupby

9.2K80

9个value_counts()小技巧,提高Pandas 数据分析效率

数据科学家通常将大部分时间花在探索和预处理数据上。当谈到数据分析和理解数据结构时,Pandas value_counts() 是最受欢迎函数之一。该函数返回一个包含唯一值计数系列。...1、默认参数 2、升序对结果进行排序 3、字母顺序排列结果 4、结果中包含空值 5、 以百分比计数显示结果 6、将连续数据分入离散区间 7、分组并调用 value_counts() 8、将结果系列转换为...DataFrame 9、应用于DataFrame 1、默认参数 Pandas value_counts() 函数返回一个包含唯一值计数系列。...一个常见用例是某个列分组,然后获取另一列唯一值计数。例如,让我们“Embarked”列分组并获取不同“Sex”值计数。...) 应用于 Pandas Series,在 Pandas DataFrame 中有一个等效方法。

2.4K20

9个value_counts()小技巧,提高Pandas 数据分析效率

数据科学家通常将大部分时间花在探索和预处理数据上。当谈到数据分析和理解数据结构时,Pandas value_counts() 是最受欢迎函数之一。该函数返回一个包含唯一值计数系列。...默认参数 升序对结果进行排序 字母顺序排列结果 结果中包含空值 以百分比计数显示结果 将连续数据分入离散区间 分组并调用 value_counts() 将结果系列转换为 DataFrame 应用于DataFrame...1、默认参数 Pandas value_counts() 函数返回一个包含唯一值计数系列。...一个常见用例是某个列分组,然后获取另一列唯一值计数。例如,让我们“Embarked”列分组并获取不同“Sex”值计数。...() 应用于 Pandas Series,在 Pandas DataFrame 中有一个等效方法。

6.5K61

9个value_counts()小技巧,提高Pandas 数据分析效率

当谈到数据分析和理解数据结构时,Pandas value_counts() 是最受欢迎函数之一。该函数返回一个包含唯一值计数系列。...默认参数 升序对结果进行排序 字母顺序排列结果 结果中包含空值 以百分比计数显示结果 将连续数据分入离散区间 分组并调用 value_counts() 将结果系列转换为 DataFrame 应用于DataFrame...1、默认参数 Pandas value_counts() 函数返回一个包含唯一值计数系列。...一个常见用例是某个列分组,然后获取另一列唯一值计数。例如,让我们“Embarked”列分组并获取不同“Sex”值计数。  ...() 应用于 Pandas Series,在 Pandas DataFrame 中有一个等效方法。

2.6K20

python数据分析笔记——数据加载与整理

2、当文件没有标题行时 可以让pandas为其自动分配默认列名。 也可以自己定义列名。 3、将某一列作为索引,比如使用message列做索引。通过index_col参数指定’message’。...5、文本中缺失值处理,缺失数据要么是没有(空字符串),要么是用某个标记值表示,默认情况下,pandas会用一组经常出现标记值进行识别,如NA、NULL等。查找出结果以NAN显示。...通过调用merge函数即可进行合并。 当没有指明用哪一列进行连接时,程序将自重叠列列名进行连接,上述语句就是重叠列“key”列进行连接。也可以通过on来指定连接列进行连接。...(2)对于pandas对象(如Series和DataFrame),可以pandasconcat函数进行合并。...·4、合并重叠数据 对于索引全部或部分重叠两个数据集,我们可以使用numpywhere函数来进行合并,where函数相当于if—else函数

6K80

Pandas数据分组函数应用(df.apply()、df.agg()和df.transform()、df.applymap())

文章目录 apply()函数 介绍 样例 性能比较 apply() 数据聚合agg() 数据转换transform() applymap() 将自定义或其他库函数应用于Pandas对象,有以下...这个函数需要自己实现,函数传入参数根据axis来定,比如axis = 1,就会把一行数据作为Series数据 结构传入给自己实现函数中,我们在函数中实现对Series不同属性之间计算,返回一个结果...transform() 特点:使用一个函数后,返回相同大小Pandas对象 与数据聚合agg()区别: 数据聚合agg()返回是对组内全量数据缩减过程; 数据转换transform()返回是一个新全量数据...,将返回于原始DataFrame大小不同DataFrame,返回结果中: 在列索引上第一级别是原始列名 在第二级别上是转换函数名 >>> df.transform([lambda x:x-x.mean...对象进行了map()操作 通过以上分析我们可以看到,apply、agg、transform三种方法都可以对分组数据进行函数操作,但也各有特色,总结如下: apply中自定义函数对每个分组数据单独进行处理

2.2K10

Pandas 秘籍:6~11

七、分组以进行汇总,过滤和转换 在本章中,我们将介绍以下主题: 定义聚合 使用函数对多个列执行分组和聚合 分组后删除多重索引定义聚合函数 使用*args和**kwargs自定义聚合函数 检查groupby...本章介绍了功能强大groupby方法,该方法可让您以可想象任何方式对数据进行分组,并在返回单个数据集之前将任何类型函数独立地应用于每个组。...通过不对数据进行排序,您还将获得较小性能提升。 自定义聚合函数 Pandas 提供了许多最常见聚合函数,供您与分组对象一起使用。...例如,州缩写AS(美属萨摩亚)返回了缺失值,因为它在数据集中只有一个机构。 更多 可以将我们定义函数应用于多个聚合列。 我们只需将更多列名称添加到索引运算符。.../img/00123.jpeg)] 您还可以将自定义聚合函数与预构建函数一起使用。

33.8K10

5分钟掌握Pandas GroupBy

我们希望比较不同营销渠道,广告系列,品牌和时间段之间转化率,以识别指标的差异。 Pandas是非常流行python数据分析库,它有一个GroupBy函数,提供了一种高效方法来执行此类数据分析。...这将生成所有变量摘要,这些变量您选择分组。这是快速且有用方法。 在下面的代码中,我将所有内容工作类型分组并计算了所有数值变量平均值。输出显示在代码下方。...我们也可以多个变量分组。这里我工作和住房类型计算了平均信贷金额。...自定义聚合 也可以将自定义功能应用于groupby对聚合进行自定义扩展。 例如,如果我们要计算每种工作类型不良贷款百分比,我们可以使用下面的代码。...总结 pandas GroupBy函数是一个工具,作为数据科学家,我几乎每天都会使用它来进行探索性数据分析。本文是该功能基本用法简短教程,但是可以使用许多更强大方法来分析数据

2.2K20

Pandas这3个函数,没想到竟成了我数据处理主力

例如三个最爱函数、计数、数据透视表、索引变换、聚合统计以及时间序列等等,每一个都称得上是认知升华、实践结晶。...而在Pandas框架中,这两种含义都有所体现:对一个Series对象每个元素实现字典映射或者函数变换,其中后者与apply应用于Series用法完全一致,而前者则仅仅是简单将函数参数替换为字典变量即可...applymap是将接收函数应用于DataFrame每个元素,以实现相应变换。...04 小结 apply、map和applymap常用于实现Pandas数据变换,通过接收一个函数实现特定变换规则; apply功能最为强大,可应用于Series、DataFrame以及DataFrame...而且不仅可作用于普通Series类型,也可用于索引变换,而索引变换是apply所不能应用; applymap仅可用于DataFrame,接收一个函数实现对所有数据实现元素级变换

2.4K10

Pandas 学习手册中文第二版:11~15

列标签结果集由指定DataFrame对象中索引标签并集定义。 这是应用于所有源对象对齐方式(可以有两个以上)。...具体而言,在本章中,我们将介绍: 数据分析拆分,应用和合并模式概述 单个列分组 访问 Pandas 分组结果 使用多列中值进行分组 使用索引级别分组 将聚合函数应用于分组数据 数据转换概述...对于DataFrame,此函数应用于组中每一列数据。...它由未分组列组成,Pandas 已成功将给定函数应用于该列(可以删除某些列) 为了演示实际转换,让我们从以下数据帧开始: [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pRLyURCX...-2e/img/00599.jpeg)] pandas 尝试将函数应用于所有列,但是由于Label和Other列具有字符串值,因此转换函数将失败(它将引发异常)。

3.3K20
领券