Pandas:按A列分组数据，按B列的现有值筛选A

Pandas是Python中一个功能强大的数据处理库，它提供了灵活且高效的数据结构和数据分析工具。

在Pandas中，我们可以使用groupby方法按指定列进行分组，然后使用filter方法根据其他列的现有值进行筛选。

具体操作可以分为以下几个步骤：

导入Pandas库：

import pandas as pd

创建一个DataFrame对象，用于存储数据：

data = {'A': [1, 1, 2, 2, 3, 3, 4, 4],
        'B': ['a', 'b', 'a', 'b', 'a', 'b', 'a', 'b'],
        'C': [10, 20, 30, 40, 50, 60, 70, 80]}
df = pd.DataFrame(data)

按列"A"分组数据：

grouped = df.groupby('A')

使用filter方法根据列"B"的现有值进行筛选，例如筛选出"B"列值为"a"的分组数据：

filtered_group = grouped.filter(lambda x: 'a' in x['B'].values)

打印筛选后的分组数据：

print(filtered_group)

这样，我们就按列"A"分组了数据，并且根据列"B"的现有值筛选出了包含值"a"的分组数据。

Pandas的优势在于它提供了丰富的数据处理和分析功能，能够方便地进行数据清洗、转换、分组、聚合等操作，同时支持各种数据类型和格式。它的应用场景非常广泛，包括数据分析、数据挖掘、机器学习等领域。

在腾讯云的产品中，可以使用CVM（云服务器）、COS（对象存储）、CDN（内容分发网络）等产品来支持Pandas在云计算环境中的运行和存储。

腾讯云CVM产品介绍：https://cloud.tencent.com/product/cvm

腾讯云COS产品介绍：https://cloud.tencent.com/product/cos

腾讯云CDN产品介绍：https://cloud.tencent.com/product/cdn

注意：上述答案并未提及其他流行的云计算品牌商，符合要求。

页面内容是否对你有帮助？

有帮助

没帮助

Pandas:按A列分组数据，按B列的现有值筛选A

、、

我是pandas的新手，我想创建一个包含分组和过滤数据的新数据集。现在，我的数据集包含两列，如下所示(第一列包含A、B或C，第二列包含值)： A 1 C 4 -->现在我想按第一列(A，B</e

浏览 40提问于2018-07-17得票数 1

回答已采纳

2回答

按单个列对多列进行分组-- Pandas* Dataframe*

、、

我试图将B、和C列的平均值按列A分组。我不知道如何使用groupby函数来完成这个任务：pd.DataFrame({'B' : df.groupby(['A'])['B'].mean()}).reset_index() 因为我只能知道如何找到平均值，并将单个列按另一列分组<

浏览 2提问于2017-08-11得票数 0

6回答

如何在非唯一列中按日期对pandas* DataFrame条目进行分组*

、

Pandas DataFrame包含名为"date"的列，该列包含非唯一的datetime值。我可以使用以下命令对此帧中的线条进行分组：但是，这将按datetime值拆分数据。我想按“日期”列中存储的年份对这些数据进行分组</

浏览 1提问于2012-07-09得票数 94

回答已采纳

1回答

如何用andrew_curves制作熊猫资料？

、、、、

这是csv的内容：1, 1, A series of escapades demonstrating the adage

浏览 2提问于2015-01-29得票数 3

回答已采纳

3回答

Pandas Dataframe按多列分组，然后求和

、、、

假设每个Python代码都有以下内容：import numpy as npdf['arrays'].sum() 我甚至可以按第

浏览 8提问于2015-09-03得票数 2

3回答

熊猫-从群中的最初n组中创建一个新的DataFrame。

、、

具有以下DF：0 1 112 2 224 3 33result = [g[1] for g in list(grouped)[:3]] A B 0

浏览 1提问于2021-03-07得票数 2

回答已采纳

2回答

有没有更好的方法按类别分组，然后根据Pandas中的不同列值选择值？

、、、、

我有一个问题，我希望按日期列分组，按时间列排序，并在值列中获取结果值。我想按日期分组，并提取这些分组的最小值和最大值，所以我这样做了： dayMin = df.groupby('date').value.min() 这给了我一个相当容易操作的Series对象。当我想要按“日期”分组，按“时间

浏览 22提问于2021-09-04得票数 0

1回答

pandas数据帧中的函数，用于复制R中的dplyr group_by(多变量)函数

、、、

考虑一下这种情况： df = df%>% group_by(a,b) %>% 表示数据帧首先按列a分组，然后按b分组。在我的例子中，我尝试先按group_name列、然后按user_name、再按type_of_work对数据进行分组。有三列以上(这就是我感到困惑的原因)，但我需要根据这三个标题以相同的

浏览 0提问于2017-06-19得票数 1

1回答

按行值过滤熊猫数据

、

我知道如何按列值过滤数据：import numpy as npnp.random.seed(101)print(df) # showwhere 'W' is p

浏览 0提问于2018-06-14得票数 2

回答已采纳

1回答

分组依据内部分组依据

、、

实际上，我有一个现有的SQL请求，它返回一些数据，将它们按子id分组。我想要纠正它并按原样显示数据，除了满足条件的某些信息外，我想按父ID显示它们。请注意，一个父id可能包含多个子id。你能帮我吗?value YN AB 1 | 12 |2 |Y |A 2 | 13 |8 |Y |B3 | 14 |9 |Y |A

浏览 2提问于2018-04-03得票数 0

1回答

是否按包含字符串和聚合函数的列值进行分组和筛选？

、、

如何才能按几个列进行分组，只针对列值中任意位置包含字符串的值？NY B Dog in heaven 5.50 NJC Basketbal

浏览 1提问于2020-02-20得票数 0

2回答

群熊猫数据与计算多列均值

、、、

我试图将熊猫的数据按列分组，然后计算出多个列的平均值。在下面的示例中，我想按“类别”列进行分组，然后计算“得分”和“优先级”列的平均值。所有三列都应位于生成的dataframe中。我能够对第一列进行分组并计算平均值，但我不知道如何添加第二列。在我的尝试之下。任何指导都非常感

浏览 3提问于2022-05-24得票数 1

回答已采纳

1回答

pandas groupby count字符串出现在列上

、、、、

我想计算一个分组的pandas dataframe列中字符串的出现次数。假设我有以下数据帧：A X 6-4 RETA Y 6-3RETB Z 6-1 RET 首先，我想按catA和catB分组。对于这

浏览 1提问于2015-07-27得票数 13

回答已采纳

1回答

在表达式的一部分中逐行分组，仅在表达式的另一部分中逐列分组

、、

我试图找到一种使用Group By功能来创建一个表的方法，在这个表中，分数的分子按列和行进行分组，分母仅按列分组。=Round(Sum(Fields!ID.Value),1, MidpointRounding.AwayFromZero) 当按行(groupName)和列(月/年)分组时，分子(Sum(Fields!Days_In_Step.Val

浏览 1提问于2016-03-16得票数 0

回答已采纳

1回答

将差异列从另一列添加到dataframe的组

、

给出以下示例代码：import numpy as npdf = pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar','foo', 'bar', 'foo', 'foo'], 'B' : np.rando

浏览 4提问于2018-01-08得票数 2

回答已采纳

5回答

熊猫的分类和冗余的nan

、、、、

我在使用处理分类数据时遇到了问题。从理论上讲，它应该是超级高效的:您是通过整数而不是字符串进行分组和索引。但它坚持认为，当按多个类别分组时，必须考虑到每一个类别的组合。我有时使用类别，即使有一个低密度的公共字符串，仅仅因为这些字符串是长的，它节省内存/提高性能。有时，在每一列中有数千个类别。当按3列分组时，pandas强迫我们保存1000^3组的结果。从

浏览 3提问于2018-01-27得票数 43

回答已采纳

1回答

大熊猫特定值的最大值和最小日差的计算

、

我有最大和最小日期的数据和值(“价格”)--这些值可以按第三列分组(比方说“类别”)。如何使用Pandas计算最大和最小日期之间的价格差异？我需要群比吗?还是可以用索引来实现？谢谢!

浏览 5提问于2022-02-17得票数 1

回答已采纳

1回答

SumIf或COunt如果

、、

这是我的数据：Mandeep 1/2/2020Mandeep 1/2/2020Mandeep

浏览 0提问于2020-03-17得票数 2

3回答

如何在Pandas中做两个不同的列？

、

我有一个如下的数据框架： 0 1 2 3 4 5 1 2 5 6 1.0 A B 3 2 10 11 1.0 B B 我想要计算列0中的每个值相对于两个列-4和5出现唯一值的次数。0

浏览 2提问于2016-10-30得票数 1

1回答

在给定行上遇到特定值时的Dataframe groupby

、、、

数据帧的形式为a b 1a b 1a b 0a e 3f g 7我想首先对列A和列B上的数据帧进行分组，然后，将每个分组按某个值进一步划分为具有连续行的</e

浏览 3提问于2017-02-04得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Pandas:按A列分组数据，按B列的现有值筛选A

相关·内容

Pandas:按A列分组数据，按B列的现有值筛选A

按单个列对多列进行分组-- Pandas* Dataframe*

如何在非唯一列中按日期对pandas* DataFrame条目进行分组*

如何用andrew_curves制作熊猫资料？

Pandas Dataframe按多列分组，然后求和

熊猫-从群中的最初n组中创建一个新的DataFrame。

有没有更好的方法按类别分组，然后根据Pandas中的不同列值选择值？

pandas数据帧中的函数，用于复制R中的dplyr group_by(多变量)函数

按行值过滤熊猫数据

分组依据内部分组依据

是否按包含字符串和聚合函数的列值进行分组和筛选？

群熊猫数据与计算多列均值

pandas groupby count字符串出现在列上

在表达式的一部分中逐行分组，仅在表达式的另一部分中逐列分组

将差异列从另一列添加到dataframe的组

熊猫的分类和冗余的nan

大熊猫特定值的最大值和最小日差的计算

SumIf或COunt如果

如何在Pandas中做两个不同的列？

在给定行上遇到特定值时的Dataframe groupby

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐