仅获取Pandas groupby中的组的匹配行_pandas dataframe删除groupby中超过n行的组_Pandas中嵌套行的Groupby - 腾讯云开发者社区

、、

,'l','m','m','l','l'], df = pd.DataFrame(d) 当我对三个字段进行分组时，我得到了结果： gb = df.groupby如何才能仅提取组中某一行与分组列上另一组中至少另一行匹配的组和<em

浏览 5提问于2019-02-28得票数 1

回答已采纳

1回答

如何从熊猫的所有行中删除组平均值/min/max

、、

考虑到这些数据(但显然有更多的行)： 1 2.5 2 4.5MWE：df = pd.DataFrame({"group": [1, 1, 2, 2], "value": [2.5, 3.5, 4.5, 5.5]}) 我们怎么能轻松地去除组平均/min/max当从行中移除gr

浏览 3提问于2020-04-15得票数 0

1回答

如何在一个熊猫数据框架中保持每一组的顶部[2-31]行？

、

说，我可以使用df.groupby('id')['value'].nlargest(30)为每个组获取top30行。但是，如何为每个组从top2获得行到top31？有没有类似于pandas.Series.nlargest这样的函数？

浏览 1提问于2017-11-21得票数 2

回答已采纳

1回答

我将Pandas groupby应用于数据帧，以获取几个字段的所有可用组合，如下所示： list_of_fields = [field1, field2, field3, field4] grouped= df.groupby(list_of_fields) 这与预期的一样，当我在grouped.groups中打印分组时，我得到了正确的元组组合。现在，我需要使用grouped中的组来创建多个数据帧，

浏览 3提问于2021-01-24得票数 0

回答已采纳

3回答

熊猫数据-选择相似的行

、、

是否有办法选择“相似”的行(而不是重复的！)在熊猫的资料里？我想知道在不同的地区是否有类似的名称的学校。我所能想到的就是选择一个随机的学校名称，并手动检查dataframe中是否存在类似的名称，方法如下： df[df['school_name'].str.contains('e

浏览 3提问于2020-08-12得票数 0

1回答

如果我有多个group by字段，如何从Dask DataFrameGroupBy中获取所有组？

、、

如何从分组数据框中获取Dask中的所有唯一组？假设我们有以下代码：我必须遍历所有组并处理组内的数据。我的想法是获得所有唯一的值组合，然后遍历集合并调用。对于他们中<

浏览 3提问于2018-02-20得票数 4

1回答

创建包含平均值信息的新DataFrame

、

我有一个包含" action“、"Filt”和"Val“列的dataframe，这些列度量了过滤操作的结果错误。我要计算每个"Action“和"Filt”的平均误差。目前，我通过迭代"Action“和"Filt”的每一个组合来实现这一点。但是，恐怕切片所花费的时间比我想要的要多。import pandas as pd ("run", "ra

浏览 0提问于2017-06-19得票数 2

回答已采纳

1回答

Dask/Pandas是否支持基于依赖于其他行的复杂条件删除组中的行？

、、、

我正在使用Dask处理一堆csv格式的基于文本的记录，我正在学习使用它来解决内存问题太大的问题，并且我正在尝试过滤最符合复杂条件的组中的记录。在重要的情况下，复杂的标准围绕着剔除网页上基于整个组的链接url、链接文本和css选择器的有前途的链接。考虑给定的A，和入围列表中的B，以及C的新记录，

浏览 6提问于2019-07-25得票数 0

2回答

使用具有特定值的GroupBy过滤熊猫DataFrame

、、

我想将pandas DataFrame过滤到特定行的组中包含特定列值的最小计数的行。例如，仅返回df的行/组，其中'c2'，'c3‘组至少有2行'c1’值为1： df = pd.DataFrame({'c1':[0,1,0,1,1,0], 'c2':[0,0

浏览 0提问于2019-07-02得票数 4

1回答

Pandas Dataframe (内部)在同一Dataframe上加入

、、、、

现在我想要:使用相同的数据帧显示内部连接，例如，author，beginpage和endpage是相同的。(dfhead, how = 'inner',on = [c[0],c[1],c[2]]) 哪里然后会给出答案，这样就只存在一个与同一行完全相同的内部连接，但我不希望它们包含在内。在上面的示例中，df_merge不应该接受任何值，因为没有3个相似的列。],'volume':[300,300]}) 请注意，这两行有(至少)3个相似的列，因此合并

浏览 12提问于2020-12-07得票数 0

2回答

获取每个组的特定索引数。

在这个示例中，dataframe：import numpy as np df = pd.DataFrame(np.random.randn(9, 4), index=i, 什么是最快的方法，以获得每只动物的第二排作为数据？

浏览 0提问于2019-02-08得票数 2

回答已采纳

2回答

如何在数据框中查找其值为True的行？

、

我有一个数据框，在这个数据框中a有两列(有时我有一列或更多列)。我尝试编写一个程序来查找它们的值为True的行，并且我还想创建以下字典:我的第一个子列表以数字2开头，因为我的第一个值为True，当我再次找到一个值为True时，我会开始一个新的子列表。在这个字典中，我有键=0，也就是表(我有一个pdf表，我用camelot读取它)和值。 ? pandas_dict = {0:[[2,3,4,5],[6,7,8,9,10,11,12

浏览 117提问于2021-06-29得票数 0

回答已采纳

2回答

根据列上的子字符串条件查找组中的下一行- Pandas

、

我试图根据子字符串条件在组中获取下一行。 ['url'].apply(lambda x: x.str.contains("confirmation"))\如果当前组中<e

浏览 0提问于2020-09-10得票数 1

回答已采纳

1回答

Pandas df grouby在不同的列上有一定的匹配

、、、

我想通过2个条件聚合一个pandas df列。 1)首先，我想按col1分组 2)仅当col2有最少一行匹配0和最少一行匹配1时，我才需要col3的平均值。我尝试了一些这样的组合，但这当然不起作用： df.groupby(['col1'])['col2'].isin([0 & 1]).col3.mean() 例如，如果这是我的df： df = pd.D

浏览 10提问于2019-02-09得票数 2

回答已采纳

1回答

排除潘达斯标准差组中的异常值？

、、

我有一个Pandas的数据，我试图从一个组的基础上删除离群。组中的每一行都被视为孤立值，如果列超出了其中group_mean是组中列的平均值，group_std_dev是组列的标准差。这个错误对我来说似乎没有多大意义，因为比较

浏览 4提问于2020-01-22得票数 1

回答已采纳

1回答

在有重叠的熊猫中创建一个定制群

、、

我正在聚合包含数据的数据，使用pd.Grouper对数据进行均匀采样，对数据进行分组，然后应用函数。在内部，一旦按时间定义了一个组(假设组为1秒)，则连续组将在随后的秒开始，没有重叠。'1s', dropna=True) ]) 如果数据上的数据具有恒定的采样(0.1Hz)，则结果将是一个<pandas.core.groupby.generic.SeriesGroupBy>类型的对象，其

浏览 7提问于2022-09-23得票数 0

2回答

使用Pandas计算每组的最大值

、

64.0 14833 2 68.0 1806我想要找出每个组中有多少个最高分

浏览 0提问于2021-03-31得票数 1

4回答

不清楚为什么使用单个组的groupby会产生行DataFrame

、

下面是对一个groupby的两个pandas.DataFrame操作 ans1 = d.groupby(grp1).apply(lambdax: x.a * x.b.ilo

浏览 5提问于2021-09-08得票数 9

回答已采纳

1回答

Pandas索引提供KeyError：(片(无，无，无)

、、

我正在用Python3中的Pandas索引和切片数据来计算空间统计数据。当我在纬度和经度范围上运行for循环时，使用.loc,为输入文件中没有可用值的特定纬度和经度集提供一个错误KeyError: (slice(None, None, None), )。以下是我的密码。2017 1 0.0 34.0 0.0363332020 1 0.0 34.0 0.109500 但是，对于输入文件中没有

浏览 6提问于2022-07-09得票数 0

2回答

除在python中使用均值、中值外，计算丢失的值

、、

我听说这意味着，中位数不是计算缺失值的最佳方法，为什么会这样呢？在我的场景中，我有这样的数据A|2,A|4,B|NaN,C|9,如果使用平均计算，数据将是A|2,A|4,B|7.3,C|9,这对品牌B来说是有意义的，但如果品牌A是7.3，那就没有意义了，因为品牌A的价值大约在2和8左右，还有其他方法来填补基于品牌的</em

浏览 0提问于2018-09-02得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云