在python中按Groupy创建列并进行过滤

在Python中，可以使用pandas库来按Group创建列并进行过滤。

首先，需要导入pandas库：

import pandas as pd

假设我们有一个包含学生姓名、科目和成绩的数据集，我们想要按科目对数据进行分组，并过滤出每个科目中成绩大于等于80的学生。

首先，我们可以创建一个DataFrame来表示这个数据集：

data = {'姓名': ['张三', '李四', '王五', '赵六', '钱七'],
        '科目': ['数学', '英语', '数学', '英语', '数学'],
        '成绩': [90, 85, 70, 95, 80]}

df = pd.DataFrame(data)

接下来，使用groupby()方法按科目对数据进行分组，并使用filter()方法来过滤出符合条件的学生：

filtered_df = df.groupby('科目').filter(lambda x: x['成绩'].mean() >= 80)

在这个例子中，lambda函数用于筛选出每个科目中成绩平均值大于等于80的学生。filter()方法返回一个新的DataFrame，其中包含符合条件的学生。

最后，我们可以打印过滤后的结果：

print(filtered_df)

输出结果为：

  姓名  科目  成绩
0  张三  数学  90
2  王五  数学  70
4  钱七  数学  80

在这个例子中，我们按照科目进行了分组，并过滤出了数学科目中成绩大于等于80的学生。

对于这个问题，腾讯云提供的相关产品是云数据库 TencentDB，它是腾讯云提供的一种高性能、可扩展、高可用的数据库解决方案。您可以使用TencentDB来存储和管理大量的数据，并且它提供了丰富的功能和工具来支持数据的分析和查询。您可以通过以下链接了解更多关于腾讯云数据库的信息：腾讯云数据库产品介绍。

在python中按Groupy创建列并进行过滤

、、、

我想添加一个列，在其中我将获得供应商的延迟付款的总和。 ? 是否可以编写一行代码来获得此输出？ df‘’Paid by Vendor'=

浏览 32提问于2021-10-12得票数 1

回答已采纳

2回答

使用r“table”包的嵌套表、列内子组总计、频率和百分比

、

使用R，我希望创建一个包含嵌套列(可能还有嵌套行)的表。单元格值应包括频率和子组内的总计和百分比(即单元/子组行总数*100)。 GroupX GroupY num这类似于这个；但是，提供的答案计算不正确的百分

浏览 7提问于2014-01-04得票数 2

回答已采纳

4回答

使用DataFrame中的两列进行迭代时遇到麻烦

、

当我在dataset中添加loan列的和时，得到的数字与两个性别之和的总和不同。这是我的密码。

浏览 4提问于2017-04-10得票数 0

1回答

来自数据帧透视表和索引的迭代列最大统计信息

、、、、

','cat','score'])dfexample = dfexample.astype({"score": float}) 我可以旋转数据以将cat转换为唯一列：100 100 80 70 60 50 yellow 99 98 97 96 95 94 是否可以迭代地计算每个cat列的最大值(循环遍历cat列a -> f)，以便通过fruit_colo

浏览 7提问于2021-03-16得票数 0

1回答

有没有可能只保留对公共Google Sheet客户端的更改？

、

我在Google Sheets中创建了一个列表，允许用户通过输入搜索词或按列选择项目以及按某些标准排序，轻松地应用自定义过滤器。由于该文档应该由多个没有Google帐户的人使用，所以我希望任何人都能够浏览列表并应用标准，就像使用过滤器视图一样简单。但是，如果我按现在的方式发布电子表格，过滤器设置自然会应用于文档的每个查看器。是否有可能让查看者使用这些过滤器，而不对其他过滤<

浏览 2提问于2019-07-07得票数 0

1回答

高分表:剔除非个人的强项。

我有两列的数据，按第二列排序。详情如下：D, 2A, 6...D, 2我正在跟踪分数，并希望创建一个“前十”名单的所有数据。我可以对数据进行排序，但我不知道(如果可能的话)如何过滤除每个参与者的个人最佳结果之外的所有内容。

浏览 0提问于2013-05-27得票数 0

回答已采纳

1回答

删除Power BI中的行

我是Power BI的新手，在我的数据集中，我想删除一些行。我要删除的行已经有了ID。但是，这些索引与行号(Row_nr)不对应。基本上我的数据是这样的：我想删除ID = 7、14、16和19的行(例如，我使用的数据集要大得多)，如何在Power BI中执行此操作？

浏览 7提问于2018-11-27得票数 1

1回答

有条件地从PIG加载HBase记录

、、、、

是否有一种方法可以根据HBase中特定列的值将记录从HBase加载到猪关系中？谢谢

浏览 0提问于2013-05-15得票数 0

1回答

数据透视表:汇总在一个字段中有值但在另一个字段中没有值的字段列表

、、

我有一组数据，并制作了一个包含三列的透视表，如下所示：然后，我复制了从零销售额的顶部到末尾的国家/地区列表，并将其移动到新的工作表中。在透视表或图表中(可能在值域设置中)有没有什么东西可以回答并以一种整洁的方式表示出来？请记住，这个国家应该有配件的销售，但没有电脑(所以，土耳其不应该出现在名单中，因为它没有电脑和

浏览 2提问于2014-02-02得票数 0

1回答

在python中按组并创建新列

、、、

我有一个大的数据集，我想要创建一个新的列，它显示了基于邮政编码列中的许多邮政编码的州基。

浏览 3提问于2022-08-11得票数 0

回答已采纳

1回答

Python Pandas -为各自过滤的单元格添加注释

、、

我在excel中有如下数据。我是python pandas的新手，我知道一点像如何导入excel和过滤列中的>，但我想知道如何在contains列上做[City] ( "contains = TN")。如果是"TN“，则创建一个新列，并在相应单元格中创建一个[Note] (如下面的注释列)。并根据年龄进行过滤，如果是[Age]

浏览 55提问于2019-02-19得票数 0

回答已采纳

3回答

AppEngine:查询数据存储中名称中包含连字符的列

、、

我正在开发Google App Engine中的servlet。此servlet从GAE的数据存储中检索数据；查询时一切正常，如"SELECT * FROM...“。但是当我想要按某一列进行过滤时，它不起作用，因为该列的名称有一个假设。

浏览 2提问于2009-12-24得票数 4

2回答

按“最近3天”筛选数据视图Web部件

、、

我们有一个自定义列表，它有一个名为"Connection Date“的列，并且需要在整个门户的不同位置显示最新的列表项(相对于这个"Connection Date”列)。数据视图Web部件似乎是最好的解决方案，但是我很难找到正确的方法和语法来按日期进行筛选。我可以创建一个参数并根据另一列的值进行过滤。我可以根据特定的日期进行过滤。我似乎不知道如何说“显示所有‘连接日期’

浏览 0提问于2009-04-01得票数 3

回答已采纳

1回答

如何按透视表中的列对值进行排序

、、、、

您能帮我按Python中的枢轴表中的列对值进行排序吗？然后我创建了一个枢轴表，结果如下：请帮助我按日期列对枢轴表进行<

浏览 4提问于2022-01-12得票数 2

回答已采纳

1回答

如何根据一张表的列碎片中的值对Excel表进行过滤？

、、、

首先，我不认为VLOOKUP适合我，因为我在每个表中有几十列。98 85 34 4 654 8 645 3SF 1 3 4使用VLOOKUP意味着我必须为想要填充的每一列编写一个公式

浏览 0提问于2014-08-07得票数 6

回答已采纳

2回答

SPSS与分区

、

在Statistics语法文件中，我希望创建一个变量，该变量根据所需的分区列(例如，相当于中的SQL“秩以上(按column_a顺序按列进行分区)”计算排名)。请参阅示例：应用get_rank后的最终输出：

浏览 0提问于2018-07-24得票数 2

回答已采纳

1回答

SSRS报告中的排序优先于组排序

、、

我是SSRS (2005)的新手，正在创建我的第一个报告。我需要创建一个基于组的运行值，但它是排序的或其他字段。||E3 | 3.1 | 7 | 21 |我计算的工资是按员工分组的小时数的运行值问题是我想让报告在“日期”列中排序。如果我在employee组中使用Day作为排序标准，则报告将按employee进行分

浏览 0提问于2012-06-08得票数 3

回答已采纳

1回答

按日期范围筛选具有多个日期列的表

、

我试图在powerbi中创建一个表，其中每个列都独立地绘制数据，但无法找到这样做的方法。结果按日期期间(开始日期、结束日期)进行筛选。尝试过滤一列，不幸的是也过滤另一列(这会破坏结果.)我如何在PowerBI中实现这一点？

浏览 7提问于2022-11-18得票数 0

1回答

Excel -筛选多列

我正试图为我的邮件列表创建一个联系人列表，并希望能够根据个人的兴趣来筛选该列表，在本例中，这是食物和文化。但是，我想在结果中包含多个过滤列，例如，一封电子邮件可能与对食物或文化感兴趣的人相关。因此，我想在两列中按“是”进行筛选，结果是第2行和第3行仍在显示。这个是可能的吗？

浏览 0提问于2018-05-01得票数 0

1回答

我应该子类rdf:语句进行具体化吗？

、、

我想做一个具体化的‘关于一个声明的声明’，说我有userX memberOf groupY，并想就此发表声明(比如说，他们在5月11日加入)。statementX a rdf:statementstatementX predicate memberOf我的问题是，对rdf:statement

浏览 9提问于2022-05-11得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在python中按Groupy创建列并进行过滤

相关·内容

在python中按Groupy创建列并进行过滤

使用r“table”包的嵌套表、列内子组总计、频率和百分比

使用DataFrame中的两列进行迭代时遇到麻烦

来自数据帧透视表和索引的迭代列最大统计信息

有没有可能只保留对公共Google Sheet客户端的更改？

高分表:剔除非个人的强项。

删除Power BI中的行

有条件地从PIG加载HBase记录

数据透视表:汇总在一个字段中有值但在另一个字段中没有值的字段列表

在python中按组并创建新列

Python Pandas -为各自过滤的单元格添加注释

AppEngine:查询数据存储中名称中包含连字符的列

按“最近3天”筛选数据视图Web部件

如何按透视表中的列对值进行排序

如何根据一张表的列碎片中的值对Excel表进行过滤？

SPSS与分区

SSRS报告中的排序优先于组排序

按日期范围筛选具有多个日期列的表

Excel -筛选多列

我应该子类rdf:语句进行具体化吗？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐