Pandas groupby take计数大于1

文章/答案/技术大牛

发布

1回答

、

对于下面的数据帧： df = pd.DataFrame({'c0': ['a','b','a'],'c1': ['a','bb','a'],'c2':[10,20,30]})1 b bb 20 2 a a 30 如何在count > 1的情况下获得输出？我试过了： df.<e

浏览 19提问于2019-03-26得票数 10

回答已采纳

1回答

熊猫的数据，它只由一个计数器大于X的行组成

、

F F F F F G G H'.split(), }3C 4E 2G 2现在，如果我只想在计数超过2return self.take(i

浏览 4提问于2015-09-09得票数 1

回答已采纳

1回答

基于滤波的大熊猫数据分组与最大值计算

、

所以，我有一个这样的数据：我想要基于Field1的群，如果计数大于2，那么找到max Field2并创建一个新字段并将其设置为True。import pandas as pd df["Field3"] = df.groupby(["Field1"])["Field2"].

浏览 0提问于2021-09-26得票数 1

回答已采纳

1回答

它们都调用GroupBy的方法，比如count()或aggregate()，我知道这两个方法都返回一个DataFrame。我要问的是如何将GroupBy (类pandas.core.groupby.DataFrameGroupBy)对象本身转换为DataFrame。我将在下面进行说明。(row)上面的DataFrame应该如下所示(数字明显不同)。name ping score take 0 sasha

浏览 0提问于2016-10-25得票数 10

回答已采纳

1回答

为什么pandas groupby filter比merge慢？

、、

我注意到，对于大型数据集，Pandas groupby().filter()速度很慢。比同等的merge慢得多。np.random.randint(10,size=size), 'A' : np.random.randn(size), 'B' :np.random.randn(size)}) gb = df.groupby('M').filter(lambda x : x['A'].count()%2==0)

浏览 2提问于2016-06-01得票数 0

2回答

Split-Apply-Combine聚合Pandas数据帧中的行

、、

我正在尝试对以下pandas数据帧运行split-apply-combine。我希望为每个唯一的客户代码显示col1值小于或等于0的行的计数，以及col1值大于0的行的计数。因此，此表：0 113231413 -10 2795.19 7 4143

浏览 18提问于2020-02-24得票数 0

1回答

从pandas dataframe中选择特定行

、、

我在pandas数据帧中执行了group by，以查看每个位置和每个日期有多少行。agg_count = df.groupby(['date', 'location']).count() 现在，我希望看到这个新数据帧中满足特定条件的行。比如说，计数大于50。

浏览 1提问于2013-03-26得票数 1

回答已采纳

1回答

熊猫与COUNTIFS相似的功能

、

我试图在Python / Pandas中复制COUNTIFS功能，但我很难找到正确的解决方案。因此，如果Type为'BD'，则计数仅大于零，引用与当前行的引用匹配，而Doc条件大于当前行的Doc条件。我希望这有意义？我尝试过使用GroupBy找到解决方案，但是我并没有接近我想要的解决方案，我认为我把这个问题搞得太复杂了。

浏览 6提问于2022-11-29得票数 0

回答已采纳

3回答

如何确保由Pandas为count创建的列有一个名称？

、

假设我使用了Pandas groupby和agg方法来按某一列进行计数：那么，假设我想根据结果计数进行排序：这给了我一个错误： KeyError：“计数</

浏览 0提问于2018-04-20得票数 0

1回答

查找并计算重复项

、

当列'A‘或'B’大于0或等于0时，我需要在列'C‘中计数重复？A B C 0 1 500 1 1 500 1 0 300 0 0 300df[(df['A'] > 0) & (df[&

浏览 0提问于2018-12-08得票数 0

1回答

我如何递归地分割一个总体？

、、

我正在尝试将X(连续)和Y(二进制)的总体平均拆分(通过计数)，直到找到“断点”。例如，下面的代码应该生成5,000个观察值，每个观察值的0和1的比例各不相同。然后我想用更大比例的1来分割一半，依此类推，直到没有办法再分割为止。import numpy as npimport random random.seed(191range( 5000 ), k =

浏览 0提问于2018-10-08得票数 0

1回答

如何在pandas中使用条件执行groupby和转换计数

、

我有以下数据帧： # Import pandas library import numpy as np data = [['tom', 10,2'], ['matt', 15,5,'b',100,'x'], ['matt', 14,1,'b',100,'x']] # Create the pandas DataFra

浏览 20提问于2020-07-11得票数 0

回答已采纳

1回答

如何计算大于或等于0.5连续5行或大于5行python的值

、、、

对于连续5次或更长的时间，我试图在列x中计算大于或等于0.5的值。我还需要对我的数据使用groupby函数。我用这个函数工作得很好，但是这个函数不能计数连续出现的值，它只是计数所有大于等于0.5的值。data['points_greater_0.5'] = data[abs(data['x'])>=0.5].groupby(['y','z','n'])['x'].

浏览 4提问于2021-04-19得票数 0

回答已采纳

1回答

统计SPARKSQL中的重复行数

、、、

也就是说，我们不知道well.In python pandas的列数或它们的名称，我们有像df.duplicated.sum()这样的东西来计算重复记录的数量。我们这里有这样的东西吗？+---+---+---++---+---+---++---+---+---++---+---+---+ | 2

浏览 3提问于2018-02-01得票数 11

回答已采纳

2回答

无重复排名

、

CountB RankBeta 20 52 2Gamma 45 43 1

浏览 12提问于2020-06-19得票数 1

回答已采纳

1回答

我在对数据集进行采样时遇到了这个问题。

、、

recent call last): Strat_d3=d3.groupby\core\groupby\groupby.py", line 894, in apply File "C:\Users\Msi\anaconda3\lib\site-package

浏览 6提问于2022-03-30得票数 1

回答已采纳

2回答

不带聚合或计数的Pyspark groupBy* DataFrame*

、、

它可以在没有聚合或计数的情况下遍历Pyspark groupBy数据帧吗？例如Pandas中的代码： for i, d in df2:Is there a difference in howto iterate groupby in Pyspark or have to use aggregation and count?

浏览 54提问于2020-01-07得票数 3

回答已采纳

1回答

使用pandas避免重复计数列

、、、

pandas.Dataframe.groupby(['date','some_category']).agg([np.sum, np.size])为每个sum列生成一个重复的计数。在传递聚合函数列表时，是否可以只输出一个计数列？a = df_all.groupby(['date','some_category']).sum() b = df_all.groupby(['date',

浏览 0提问于2020-02-27得票数 0

1回答

在熊猫中，如何从特定年份的每周数据中获得年值？

、

import pandas as pdfrom pandas_datareader import data, wb start = dt.datetime(2015, 1, 1)stocks = ["WIKI/AAPL", "WIKI/TSLAaggregate the data of

浏览 4提问于2019-11-19得票数 0

4回答

Python-通过属性将类的实例分组在一起

、、、、

y_coord return self.text mylist=[location(1,0

浏览 25提问于2018-08-07得票数 2

回答已采纳

点击加载更多