Group by and filter based on a condition in pandas (基于pandas中的条件进行分组和筛选)

在pandas中，可以使用groupby函数和条件筛选来实现基于条件的分组和筛选操作。

首先，groupby函数可以根据指定的列或条件将数据集分成多个组。例如，假设我们有一个包含姓名、性别和年龄的数据集，我们想要按照性别进行分组，可以使用以下代码：

grouped = df.groupby('性别')

这将返回一个GroupBy对象，可以对其进行进一步的操作。

接下来，我们可以使用filter函数根据条件筛选数据。例如，我们想要筛选出年龄大于等于18岁的数据，可以使用以下代码：

filtered = grouped.filter(lambda x: x['年龄'] >= 18)

这将返回一个新的DataFrame，其中包含满足条件的数据。

综合起来，我们可以将分组和筛选操作结合起来，实现基于条件的分组和筛选。以下是一个完整的示例代码：

import pandas as pd

# 创建示例数据集
data = {'姓名': ['张三', '李四', '王五', '赵六'],
        '性别': ['男', '女', '男', '女'],
        '年龄': [20, 18, 22, 19]}
df = pd.DataFrame(data)

# 按照性别进行分组
grouped = df.groupby('性别')

# 筛选出年龄大于等于18岁的数据
filtered = grouped.filter(lambda x: x['年龄'] >= 18)

print(filtered)

输出结果为：

  姓名 性别  年龄
0  张三  男  20
1  李四  女  18
3  赵六  女  19

在腾讯云的产品中，可以使用腾讯云的云数据库TencentDB来存储和管理数据，使用腾讯云的云服务器CVM来进行服务器运维，使用腾讯云的人工智能服务AI Lab来进行人工智能相关的开发，使用腾讯云的物联网平台IoT Hub来进行物联网相关的开发等。具体产品介绍和链接地址可以参考腾讯云官方网站。

相关·内容

Python 自动整理 Excel 表格

一场pandas与SQL的巅峰大战（二）

上一篇文章一场pandas与SQL的巅峰大战中，我们对比了pandas与SQL常见的一些操作，我们的例子虽然是以MySQL为基础的，但换作其他的数据库软件，也一样适用。工作中除了MySQL，也经常会使用Hive SQL，相比之下，后者有更为强大和丰富的函数。本文将延续上一篇文章的风格和思路，继续对比Pandas与SQL，一方面是对上文的补充，另一方面也继续深入学习一下两种工具。方便起见，本文采用hive环境运行SQL，使用jupyter lab运行pandas。关于hive的安装和配置，我在之前的文章MacOS 下hive的安装与配置提到过，不过仅限于mac版本，供参考，如果你觉得比较困难，可以考虑使用postgreSQL，它比MySQL支持更多的函数(不过代码可能需要进行一定的改动)。而jupyter lab和jupyter notebook功能相同，界面相似，完全可以用notebook代替，我在Jupyter notebook使用技巧大全一文的最后有提到过二者的差别，感兴趣可以点击蓝字阅读。希望本文可以帮助各位读者在工作中进行pandas和Hive SQL的快速转换。本文涉及的部分hive 函数我在之前也有总结过，可以参考常用Hive函数的学习和总结。

SQL 查询语句先执行 SELECT？兄弟你认真的么？

好像这个问题应该很好回答，毕竟自己已经写了无数个 SQL 查询了，有一些还很复杂的。还装不了这个逼了？！

数据分析之Pandas分组操作总结

Pandas做分析数据，可以分为索引、分组、变形及合并四种操作。之前介绍过索引操作，现在接着对Pandas中的分组操作进行介绍：主要包含SAC含义、groupby函数、聚合、过滤和变换、apply函数。文章的最后，根据今天的知识介绍，给出了6个问题与2个练习，供大家学习实践。

加速数据分析，这12种高效Numpy和Pandas函数为你保驾护航

在本文中，数据和分析工程师 Kunal Dhariwal 为我们介绍了 12 种 Numpy 和 Pandas 函数，这些高效的函数会令数据分析更为容易、便捷。最后，读者也可以在 GitHub 项目中找到本文所用代码的 Jupyter Notebook。

加速数据分析，这12种高效Numpy和Pandas函数为你保驾护

select 进阶查询

① 分组查询中，select 后面只能出现，在 group by 后出现过的列或者聚合函数。 ② where 是在分组前对记录进行筛选，而 having 是在分组结束后的结果里筛选，最后返回最终查询结果。 ③ having 后所接的字段必须经过过滤(即：该字段必须使用)，一般与 group by 连用 ④ 分组查询中，若一个字段在一个组内有多个结果，则后一个结果覆盖前一个结果

PySpark︱DataFrame操作指南：增/删/改/查/合并/统计与数据处理

笔者最近需要使用pyspark进行数据整理，于是乎给自己整理一份使用指南。pyspark.dataframe跟pandas的差别还是挺大的。

我的Python分析成长之路9

统计分析是数据分析的重要组成部分，它几乎贯穿整个数据分析的流程。运用统计方法，将定量与定性结合，进行的研究活动叫做统计分析。而pandas是统计分析的重要库。

读Python数据分析基础之Excel读写与处理

对于业务型数据分析来说，Excel可以说是打交道最多的软件了，可以说没有之一。之前有比较系统地读过《Python数据分析基础》（Foundations for Analysis with Python），写了一些笔记，这里只选取关于Excel的部分。

11，二维dataframe —— 类SQL操作

pandas中常用的数据结构有： 1，Series：一维数组，有index。Series中只允许存储同种类型数据。 2，DataFrame：二维的表格型数据结构。可以将DataFrame理解为Series的容器。 3，Panel ：三维的数组。可以理解为DataFrame的容器。

R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)

大型数据集通常是高度结构化的，结构使得我们可以按不同的方式分组，有时候我们需要关注单个组的数据片断，有时需要聚合不同组内的信息，并相互比较。

sql语句的执行顺序以及流程（详细掌握）

1、from 子句组装来自不同数据源的数据； 2、where 子句基于指定的条件对记录行进行筛选； 3、group by 子句将数据划分为多个分组； 4、使用聚集函数进行计算； 5、使用 having 子句筛选分组； 6、计算所有的表达式； 7、select 的字段； 8、使用 order by 对结果集进行排序。

玩转Mysql系列 - 第8篇：分组查询详解（group by & having）

where是在分组（聚合）前对记录进行筛选，而having是在分组结束后的结果里筛选，最后返回整个sql的查询结果。

我用Python展示Excel中常用的20个操

Excel与Python都是数据分析中常用的工具，本文将使用动态图(Excel)+代码(Python)的方式来演示这两种工具是如何实现数据的读取、生成、计算、修改、统计、抽样、查找、可视化、存储等数据处理中的常用操作！

Django实战-信息资讯-新增管理员权限

Django网络应用开发的5项基础核心技术包括模型（Model）的设计，URL 的设计与配置，View（视图）的编写，Template（模板）的设计和Form(表单)的使用。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Group by and filter based on a condition in pandas (基于pandas中的条件进行分组和筛选)

相关·内容

对比MySQL学习Pandas的groupby分组聚合

对比MySQL学习Pandas的groupby分组聚合

Python 自动整理 Excel 表格

Python 自动整理 Excel 表格

Python 自动整理 Excel 表格

一场pandas与SQL的巅峰大战（二）

SQL 查询语句先执行 SELECT？兄弟你认真的么？

数据分析之Pandas分组操作总结

加速数据分析，这12种高效Numpy和Pandas函数为你保驾护航

加速数据分析，这12种高效Numpy和Pandas函数为你保驾护

select 进阶查询

PySpark︱DataFrame操作指南：增/删/改/查/合并/统计与数据处理

我的Python分析成长之路9

读Python数据分析基础之Excel读写与处理

11，二维dataframe —— 类SQL操作

R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)

sql语句的执行顺序以及流程（详细掌握）

玩转Mysql系列 - 第8篇：分组查询详解（group by & having）

我用Python展示Excel中常用的20个操

Django实战-信息资讯-新增管理员权限

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐