使用.groupby和.transform聚合

文章/答案/技术大牛

发布

2回答

python、pandas

df2 = df.groupby(df.index.str[:4]).transform("sum") 我得到了正确的数字： Out[150]: 2010

浏览 23提问于2020-12-08得票数 2

回答已采纳

1回答

计算并广播pandas中的计数(使用groupby转换)

python、pandas、aggregation、split-apply-combine

我如何计算和广播一个熊猫的计数？要计算计数，请执行以下操作： df.groupby('field').size() 要向原始数据帧广播聚合，请执行以下操作： df.groupby('field')['field_to_aggregate'].transform(aggregation) 如果我指定要聚合到的字段和聚合(如sum、mean等)，则后者可以工作。(注意:我可以只在原始表上对grou

浏览 34提问于2020-11-25得票数 1

1回答

转换后查看数据

python、altair

在Altair应用转换和聚合之后，可以看到数据吗？overlap = 1 Month='month(date)' mean_temp='mean(temp_ma

浏览 10提问于2020-11-12得票数 2

1回答

熊猫群均值从极大值减去

python、pandas

totalgene = genedata.groupby(genedata['GENE']).mean()[['PM','LOGPM']] genedata['MEANNORM'] = genedata

浏览 1提问于2017-06-03得票数 0

回答已采纳

2回答

熊猫GroupBy与特殊金额

python、pandas、pandas-groupby

假设我有这样的数据，我想根据特性和类型对它们进行分组。50Wyoming 1 180Wyoming 3 56(Alabama,3) 40(Wyoming,2) 150但是，我只想用相同的类型求和，而不是同时使用类型和

浏览 1提问于2018-02-28得票数 1

回答已采纳

1回答

在熊猫数据栏中添加一个分组的聚合非唯一列

python、pandas、dataframe、aggregate、pandas-groupby

我想在我的熊猫数据中添加一个聚合的，分组的，非唯一的列，而不是聚合整个数据。我试图在一行中这样做，并避免创建一个新的聚合对象并将其合并，等等。df['n_unique_id'] = df.groupby(['track', 'type'])['id'].nunique()df['n_unique_id'] =df.groupby

浏览 2提问于2017-05-01得票数 7

2回答

如何在Pandas组中进行分组和合计

python、pandas

nick 16 1 3 9 tom 22 1 4 已经尝试过： df['totalentries'] = df.groupby

浏览 7提问于2020-06-22得票数 0

回答已采纳

1回答

如何计算标签/工具提示的聚合？

python、vega-lite、altair

如果我有聚合的时间序列数据。是否可以执行其他聚合并将其显示在工具提示中？下面是我的问题的一个更明确的例子。对于下面的代码示例，我们显示了三种不同类型的水果按月聚合的权重总和。是否也可以将每月的总重量(和/或每月水果重量的归一化百分比)显示为标签或工具提示？我尝试过使用transform_aggregate，但似乎无法让它正常工作(它最终破坏了group by的功能)。

浏览 21提问于2019-01-25得票数 3

回答已采纳

1回答

我有一些pandas代码，我试图在一个大数据集上运行，尽管使用了apply，但它看起来本质上是迭代和运行缓慢的……欢迎您的建议！我在试着把我的数据分组。然后，我希望导出仅包含ID的数据框，并使用该标志显示该事件是否在该ID中发生。这是我使用的代码： no_duplicates = df.drop_duplicates(subset=["ID]) single_df = dfEvent_type"].sum() > 0 no_duplica

浏览 24提问于2020-09-23得票数 1

回答已采纳

1回答

对相应的匹配分组Pandas数据进行操作

python、pandas

我有一份资料：我想对每个对应的分组数据执行一个操作。例如，如果我想删除所有具有Number 0的Number，应该如下所示：因为所有Numbers of User B都是0。Users

浏览 1提问于2018-04-25得票数 1

回答已采纳

2回答

PANDAS:根据其他列值查找列的标准差

python、pandas、numpy

正如你在下面看到的，我在我的数据框中有不同的‘ticker’，我想计算'lret‘列的标准偏差，但每个单独的ticker。目前，它将整个列作为一行进行计算。如何计算数据帧中每个报价器的标准差？任何帮助都将不胜感激。另外，请参见下面的函数，了解代码当前所做的工作。数据帧输出 price date ticker lret std1 104.878151 2016-07-05 A 0.008408 0.019456 2

浏览 7提问于2020-09-11得票数 0

2回答

Dataframe编辑

python、pandas

| 14.0 此数据框架是通过键入必须有办法做到这一点，但我已经遇到了多个墙和错误

浏览 1提问于2019-12-10得票数 0

回答已采纳

1回答

pandas中每台机器的活动计数

python、pandas

15 0.5 17 8 B clip 180 6.0 2 我想要计算平均生产率和每台机器的活动数量我试过这个： my_df['activities']=my_df.groupby(['day','machine'])['machine'].count() 它返回这个错误：TypeError: incompatible

浏览 29提问于2021-08-13得票数 0

回答已采纳

1回答

如何在Pandas中有效地使用groupby添加新列？

python、pandas

我正在使用来获取一些NBA比赛的记分板数据。Exception as e: else:另一种方法是 r

浏览 1提问于2016-02-17得票数 0

1回答

试图理解为什么比较不起作用，而过滤器却起作用(熊猫)

python、pandas

dfclean = dfclean[dfclean['Count'] > 1]我用它过滤掉< 1的"ST“实例，我只想在有在经历了一段时间的堆栈溢出之后，我使用了这个方法，并找到了正确的代码来理解。dfbottom = dfbotto

浏览 0提问于2018-07-22得票数 1

回答已采纳

1回答

快速有效的熊猫群和/平均不聚集

python、pandas、dataframe、pandas-groupby

在pandas中执行分组和聚合是简单而快速的。但是，执行pandas已经在C中构建的、没有聚合的简单groupby应用函数(至少以我的方式)要慢得多，因为有了lambda函数。and apply and aggregate0 17.1772802 17.668056Name: a, dtype: float64 # group

浏览 5提问于2020-06-03得票数 2

回答已采纳

2回答

我如何根据时间对熊猫数据帧进行分组，每组的行数最少？

python、pandas

我使用了下面的代码；这是可行的，但目前我正在尝试添加一个要求，即Grouper在该时间范围内至少需要20行，才能聚合平均值，但我找不到解决方案。

浏览 0提问于2021-04-25得票数 1

2回答

在聚合操作后解除对熊猫数据的分组

python、pandas、dataframe、pandas-groupby、aggregation

我在我的数据中使用了"groupby“方法来查找每个位置的总人数。 dataframe.groupby(by=['location'], as_index=False)['people'].agg('sum')

浏览 2提问于2022-04-19得票数 0

回答已采纳

1回答

删除与Pandas没有至少m个观察值的股票

python、pandas

我像这样运行这个命令； df.groupby("Ticker").size() > 89 我得到了这个结果； ? 我写了这样的代码，但给出了错误。df.loc[df.groupby("Ticker").size() > 89] 我想删除不超过89个观察值的股票。

浏览 18提问于2020-12-23得票数 0

回答已采纳

1回答

根据Python中其他列值的相似度对一列求和

python、pandas、dataframe、group-by

df ["sum"]=df.groupby(['id']).agg({'duration': sum}).reset_index() df df x. y. m.

浏览 23提问于2021-03-31得票数 1

回答已采纳

点击加载更多