在Pandas dataframe中按groupby聚合后将列组合为字符串

、

使用Python3和Anaconda，我在ipython上导入了pandas和os。我有一个非常大的csv文件。在对文件使用read_csv之后，我尝试对两列使用.groupby()，但它将数据类型从DataFrame更改为DataFrameGroupBy，并且我不能再对其运行数据框方法。import os band_gaps = totals.gro

浏览 19提问于2019-06-21得票数 0

回答已采纳

2回答

、、

我有一个这样的DataFrame，它是在一些统计模型实验之后出现的。0.7883192300796509, }, df = pd.DataFrame(data) df.

浏览 82提问于2021-08-31得票数 1

回答已采纳

1回答

Pandas:使用聚合vs来定义新列

、

size=n)data2 = np.random.randint(1, 10, size=n) return 0 return (x['val1'].sum())*1.0/x['val2'].sum()*1.0df.<

浏览 1提问于2013-11-29得票数 5

回答已采纳

1回答

每个属性的分割

、、

然后根据列team中的唯一值将大CSV拆分为更小的CSV文件。首先，我为每个team创建了新的数据格式。生成的新txt文件，每个team列中的唯一值都有一个。码df = pd.read_csv('combined.csv')df.to_csv('RED.csv')

浏览 0提问于2021-02-02得票数 1

回答已采纳

1回答

按行名分组Pandas DataFrame

、、、、

我有一个简单的Pandas DataFrame，它有行名和2列，类似于下面的内容。from pandas import DataFrame, Seriesdf = DataFrame({'col1我希望将我的DataFrame按行名分组，这样我就可以按<e

浏览 2提问于2014-04-03得票数 0

回答已采纳

1回答

熊猫:将数组求和为具有多个组比列的聚合

、、

我正在使用Python3.5.1和Pandas 0.18.0。pandas.core.base.DataError: No numeric types to aggregate 如果我只按<

浏览 3提问于2016-10-03得票数 3

回答已采纳

1回答

`pandas.DataFrame.groupby`的非聚合更新

、、、

考虑一个按列分组的数据帧。example = pandas.DataFrame({ 'B': numpy.nan }) 现在，我希望通过对每个组进行一些计算来更新一个列结果是一个序列，而不是像平均值或中位数那样的单个聚合数。DataFrame中的连续分区时，这是一种遗憾。是否可以将行

浏览 16提问于2020-08-31得票数 1

1回答

如何在复制或群居熊猫DataFrame时保持主要秩序？

、、、、

我使用pandas.DataFrame作为业务应用程序中的数据结构(风险模型)，需要快速聚合多维数据。熊猫的聚合在很大程度上取决于在底层的numpy数组上使用的主要订购方案。其影响是：案例2: 5分46秒在包含45023行和100000列的DataFrame及其副本上。对索引执行聚合。该索引是一个具有15个级别的pd.MultiIndex。聚合保持三个层次，并导致大约239

浏览 4提问于2019-05-23得票数 1

回答已采纳

1回答

如何使用pandas* groupby & aggregate生成新列？*

、

我有一个DataFrame，我可以在上面运行：但是，colA和colB需要存在从聚合创建新列的最“拼接”方法是什么？基本上，我有一组列，并且我的聚合不是1:1映射。因此，考虑一个示例，在该示例中，我希望<

浏览 11提问于2016-08-12得票数 1

回答已采纳

1回答

如何将扩展窗口应用于groupby结果的名称？

、

我想使用pandas将数据帧按一列分组，然后对这些组运行扩展窗口计算。想象一下下面的数据帧： G ValA 1B 3C 5 C 7 我正在寻找的是一种按列G对数据进行分组的方法(结果是组['A', 'B', 'C'])，然后将函数首先应用到组A中的项，然后应用到组A和B中<

浏览 14提问于2021-11-15得票数 0

回答已采纳

1回答

如何编写字符串的自定义聚合函数？

、、、、

我有一个由数百万条记录组成的数据帧，我正在尝试使整个数据帧由一列“napciente”分组，这就完成了。但是有63列我需要根据特定的匹配聚合为字符串，例如，如果Series包含"SI“和任何其他字符串，我希望将该"SI”作为聚合结果返回。data.groupby</e

浏览 0提问于2017-04-15得票数 1

5回答

熊猫群-不同价值的集合

、、、

我有这个数据0 A X2 A Y4 B Y 5

浏览 4提问于2017-11-29得票数 4

回答已采纳

2回答

我想使用python、pandas来提取满足特定条件的数据帧。

、

我使用python和pandas调用带有元组Time、Name、Good、Bad的Excel数据。我想将数据帧重新处理为满足特定条件的另一个数据帧。

浏览 23提问于2020-04-29得票数 1

回答已采纳

2回答

在Dataframe中查找重复项，并返回与重复索引值相比的第一个索引值。

、、

我有一个具有重复字符串值但不同的索引，也就是ID值的dataframe。我试图找到字符串与扭曲重复的索引/ID值，以便将第一个索引/ID值与重复的行索引/ID进行比较。下面是输入数据的示例：data = [[1, 'online delivery, and now offer dedicated learning platforms[105687, 'you have managed to get ahead&#x

浏览 10提问于2022-09-16得票数 1

回答已采纳

4回答

用numpy.median与其他函数按对象聚合大熊猫的结果不一致

、、、

C1 11 2 13 13 4 15 25 6 27 70 8 2In [40]: test_g = test.groupby('C') In [41]: test_g.aggregate(np.

浏览 7提问于2012-09-29得票数 6

回答已采纳

3回答

星星之火将多个列作为字符串聚合为一列

、、、

我希望将星火DataFrame转换为另一个DataFrame，其具体方式如下：+---------+------------++----------------------------------------------------------+ 聚合列可以是列表或映射，也可以是字符串。对于DataFrame

浏览 1提问于2018-05-17得票数 0

回答已采纳

1回答

如何在熊猫系列中按多个栏目分组

pandas.Series groupby方法使按另一个系列进行分组成为可能，例如：df = pd.DataFrame(data)grade.groupby(df[

浏览 4提问于2019-12-02得票数 0

3回答

群迭代排序

、、

import pandas as pd df= pd.DataFrame([{'col1':'a', 'is_open':0}, {'col1':'b', 'is_open':1}])df = df.sort_values('is_open',ascending=False).reset_index(drop=True)for i, d in df.groupby<

浏览 19提问于2022-06-23得票数 0

回答已采纳

2回答

对熊猫群的结果进行索引是做什么的？

、

假设我有这个数据， ['1', '2', '3'],columns=['x', 'y', 'z']) A a b cC 4 5 6 我看到密码了，df.groupby

浏览 0提问于2019-12-15得票数 0

回答已采纳

2回答

pandas使用groupby axis=1聚合列提供了KeyError

、、、、

例如：junk_df = DataFrame(data = {"c1": [1,1,2,2,3,3],print(junk_df.groupby("c1", axis=0).mean()) c2 c31 1 23 5 4 但是，将groupby<

浏览 47提问于2021-11-24得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

更改DataType的GroupBy方法