pandas groupby()，使用自定义聚合函数连接列，然后使用pandas连接行_Pandas groupby使用基于两列的聚合_使用多列的Pandas groupby函数 - 腾讯云开发者社区

、、

am xyz 2 I do job 使用pandas应用groupby()后，预期结果为： Column1 Column22 I am Xyz Ido job 3 On weekend holidays I do nothing 所需的聚合首先适用于列<

浏览 71提问于2020-06-16得票数 3

回答已采纳

1回答

Pandas Dataframe (内部)在同一Dataframe上加入

、、、、

现在我想要:使用相同的数据帧显示内部连接，例如，author，beginpage和endpage是相同的。(dfhead, how = 'inner',on = [c[0],c[1],c[2]]) 哪里然后会给出答案，这样就只存在一个与同一行完全相同的内部连接，但我不希望它们包含在内。在上面的示例中，df_merge不应该接受任何值，因为没有3个相似的列。],'volume':[300,300]}) 请注意，这两行有(至少)3个

浏览 12提问于2020-12-07得票数 0

1回答

python group by，传入列以聚合函数参数

、、、、

当我将几个列传递给聚合函数时，我希望了解如何在pandas中进行聚合。我习惯了在R中使用dplyr，这是非常简单的。grouped_data.

浏览 81提问于2018-06-17得票数 2

回答已采纳

1回答

Pandas GroupBy聚合不保留数据类型

我通过使用sum、max和min等函数将Pandas GroupBy和Groupby.agg用于我的数值列，但我注意到以前强加给我的列的数据类型(如np.int8、np.int16、np.int32)在GroupBy聚合后不会保留，实际上每一列都被覆盖为int64。Pandas版本1.1.5 我目前的解决方案是在完成groupby聚合后重新转换，这是一个已知的问题

浏览 19提问于2021-03-16得票数 1

回答已采纳

2回答

聚合是作为ETL的一部分还是在数据库中？

、、

当涉及到是否应该将数据聚合到ETL worker的内存中(例如，使用pandas groupby或pd.pivot_table )，而不是在数据库级别执行groupby查询时，是否有一般的首选或最佳实践在可视化层，我连接到过去30天的详细交互级别数据，然后连接到过去几年的聚合数据(每日级别)。我认为，如果我计划实现聚合表，最好是在ETL阶段完成，因为这可以远程完成，而不会浪费数据库服务器的资源。

浏览 0提问于2017-05-26得票数 0

1回答

在有重叠的熊猫中创建一个定制群

、、

我正在聚合包含数据的数据，使用pd.Grouper对数据进行均匀采样，对数据进行分组，然后应用函数。在内部，一旦按时间定义了一个组(假设组为1秒)，则连续组将在随后的秒开始，没有重叠。|grouped = df.groupby([pd.Grouper(level=df.time, freq=但是，我不能指定需要10行</

浏览 7提问于2022-09-23得票数 0

4回答

我如何使用pandas* agg对布尔值进行求和，并始终得到结果？*

、、

我有一个包含bool类型列的数据框。我想使用pandas的groupby和agg函数来获取每个id的True值的数量。我已经做过很多次了，但是结果列的类型似乎取决于数据框。(data=d) 我从这段代码中得到的输出是：0 1 Truedf = pd.DataFrame(d

浏览 0提问于2020-04-03得票数 1

1回答

使用转换的熊猫分组列表聚合失败，关键错误

、、、

如何将list函数应用于不使用apply而是使用transform聚合的分组pandas dataframeimport pandas as pd df = pd.DataFrame({'key':[

浏览 4提问于2020-11-24得票数 3

回答已采纳

2回答

在Python Pandas中，如何使用like R dplyr mutate_each

、、、

在Python Pandas中，我想通过对多个列执行多个聚合函数来添加列，比如R mutate_each。例如，Python Pandas能否实现与以下R脚本相同的处理？iris %>% mutate_each(funs(min, max, mean), starts_with("Sepal")) 然而，我能够实现与使用Pandas的变异体相同的处理。如下面的代码所

浏览 3提问于2017-10-18得票数 5

1回答

将PySpark groupby* collect_set迁移到Dask*

、、

我正在将一个pySpark实现迁移到Pandas。为了转换大型数据集，我使用了dask包。pySpark实现： df.groupBy('Key').agg(collect_set('ColumnA').alias('Items'), collect_set('ColumnB').alias('DocumentId')) 到Pandas df.groupby("Key")[['C

浏览 31提问于2021-08-16得票数 0

1回答

Pandas中的链式加权平均计算

、

我是Pandas的新手，我想将以下简单的R代码转换为Pandas，以便计算列的平均值和加权平均值(实际上，有更多的列需要聚合)。解决方案必须是可链接的，因为在此计算之前和之后都有多个步骤。我看过使用apply函数()的解决方案，但似乎要么必须在apply函数内执行完整的聚合步骤(对所有列，可能是不相关的列)，我认为这很丑陋，要么分别计算平均值和加权平均值，然后进行表连接</

浏览 25提问于2019-10-21得票数 1

0回答

如何连接Pandas* dataframe列*

、

如何在Pandas数据帧中连接不同数据类型的列，以便如果列number与列operator连接在一起，并且我执行了一个groupby('user').sum()，我就可以拥有适当的聚合：4 -432 - C6 567 + D #df.groupby</e

浏览 1提问于2016-07-01得票数 2

回答已采纳

0回答

在pandas* DataFrame的多个列中应用自定义函数*

、

2,1,4], [1,2,3], [4,3,3], [3,2,5], [2,2,4]]我想对每一行应用一个自定义函数然后我想按键聚合(例如，average)。最终结果如下所示：0 1 47.002 3 373.33我知道我可以通

浏览 4提问于2018-07-14得票数 0

4回答

panda aggregate by functions

、、

-最终输出将是： id movie value5 cane22 45 wind1 1 if x['movie'].str.startswith('cane'):y = x.groupby(['value']).sum() e

浏览 18提问于2018-08-24得票数 2

回答已采纳

1回答

熊猫:将数组求和为具有多个组比列的聚合

、、

我正在使用Python3.5.1和Pandas 0.18.0。>>> df.groupby(['A','B']).sum()

浏览 3提问于2016-10-03得票数 3

回答已采纳

0回答

Dataframe中的Pandas中的聚合列

、、、

我使用groupby()和reset_index()函数使用来自Pandas Dataframe的数据创建具有聚合值的列： df1=data.groupby(["subscriptio

浏览 5提问于2017-06-13得票数 0

回答已采纳

1回答

如何在dask中执行group-by聚集后保留分区

、、、、

在我的应用程序中，我使用groupby对dask数据帧执行聚合，并按某个id排序。import numpy as npdf.index.name = 'my_id' d

浏览 0提问于2018-02-17得票数 4

2回答

熊猫:使用相同的列ID折叠行，并将多个列串联为1。

、

如果不对数据进行迭代，是否可以使用熊猫方法“折叠”？837 apples 15 134 pears 3index ID description1 134 134: apples

浏览 3提问于2021-12-28得票数 0

回答已采纳

2回答

Python Pandas* agg错误*

、、

我试图在Pandas中使用agg函数生成描述性统计数据。我在使用lambda函数的一行时遇到了麻烦。当我将它们作为单独的代码行运行时，它们可以工作，但当我将它们作为一行运行时，就会出现错误。第一行代码： avg_Nox=('NOX', 'mean')) 第二行具有lambda函数</e

浏览 0提问于2019-12-19得票数 1

1回答

展平并重命名多索引agg列

我有一些Pandas / 代码，它们使用两个聚合方法聚合特定的列，然后将多索引列重命名为扁平列。df = ( .groupby(["some_dimension"]) .reset_indexsome_metric", "

浏览 21提问于2020-05-12得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云