在进行pandas groupby时，有没有办法使用索引号来选择列？

在进行pandas groupby时，可以使用索引号来选择列。可以通过在groupby之后使用agg函数来实现。agg函数可以接受一个字典作为参数，字典的键是要聚合的列名或索引号，值是要应用的聚合函数。以下是一个示例代码：

import pandas as pd

# 创建一个示例DataFrame
data = {'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
        'B': ['one', 'one', 'two', 'two', 'two', 'one', 'two', 'one'],
        'C': [1, 2, 3, 4, 5, 6, 7, 8],
        'D': [10, 20, 30, 40, 50, 60, 70, 80]}
df = pd.DataFrame(data)

# 使用索引号选择列进行groupby
result = df.groupby('A').agg({0: 'sum', 1: 'mean'})

print(result)

输出结果如下：

     0     1
A           
bar  80  40.0
foo  24  12.0

在上述示例中，我们使用groupby函数将DataFrame按照'A'列进行分组，然后使用agg函数来对分组后的数据进行聚合操作。字典的键0和1分别代表索引号，值'sum'和'mean'分别代表对应的聚合函数。最后打印出聚合结果。

需要注意的是，索引号是从0开始的整数，表示列在DataFrame中的位置。如果要选择多个列，可以使用列表来表示多个索引号。另外，还可以使用列名来选择列进行groupby，只需将列名作为字典的键即可。

关于pandas的groupby操作，可以参考腾讯云的文档：pandas groupby操作

在进行pandas groupby时，有没有办法使用索引号来选择列？

python、pandas、group-by

我正在使用groupby对组进行求和。我正在编写的代码如下所示： data1=data.groupby('a')['b_1','b_2'].mean().reset_index() 但是，我有超过30列需要计算，从'b_1‘到'b_30'，我不想列出所有列的名称，所以我尝试使用数据集的索引号。如下所示： data1=data.groupby(&#

浏览 12提问于2021-04-15得票数 0

2回答

使用pandas to_csv仅引用所需的列

python、pandas、csv、export-to-csv、quoting

我需要使用pandas to_csv函数生成一个csv。我试过quote=csv.QUOTE_NONNUMERIC了。但是对于其中一个date time列，我不需要双引号。有没有办法选择我们想要双引号的列？

浏览 36提问于2017-12-05得票数 4

1回答

pandas groupby中的索引创建

python、pandas

当我在pandas数据帧上使用groupby时，用于分组的列会自动创建一个索引。如果我想稍后使用该列，我可以这样做：有没有办法，我可以使用groupby而不创建索引？指定as_index=False不起作用。

浏览 1提问于2014-09-21得票数 0

1回答

访问groupby列值

pandas、group-by、resampling

如果我在pandas中使用了groupby函数(在LOC上)，并进行了重采样，例如，我可以获得某个地点的日平均压力和流量值。有没有办法访问groupby列中的值，LOC，按索引或其他方法，以便我可以将其用作绘图的标题。换句话说，我可以访问“venue1”吗？我不得不使用groupby来获取重采样数据帧中的venue列，因为重采样似乎不会带来任何非

浏览 10提问于2020-06-27得票数 0

2回答

如何在python pandas中使用groupby连接字符串？

python、pandas、grouping

我目前在顶部有数据帧。有没有办法使用groupby函数来获取另一个数据帧来对数据进行分组，并将单词连接成下面使用python pandas的格式？[

浏览 0提问于2016-06-30得票数 8

回答已采纳

1回答

Pandas.DataFrame.GroupBy.agg，聚合函数中需要的独立列。如何让它进入agg？

python、pandas、dataframe

我有一个带有两级MultiIndex的Pandas DataFrame对象。此外，它显然包含许多额外的列(例如'A'，'B'，'C'，'D'，'E')。为此，我只选择了列的子集，使用GroupBy按levels=[0,1]对这样划分的数据帧进行分组，并使用字典执行agg，为提到的子集中的每个选定列配置聚合函数。所以它基本上是两列

浏览 4提问于2020-04-29得票数 0

0回答

Dataframe中的Pandas中的聚合列

python、pandas、dataframe、pandas-groupby

我使用groupby()和reset_index()函数使用来自Pandas Dataframe的数据创建具有聚合值的列： df1=data.groupby(["subscription_id"])["

浏览 5提问于2017-06-13得票数 0

回答已采纳

1回答

列上的Pandas Multiindex Groupby

python、pandas、group-by、multi-index

有没有办法在多索引中的列上使用groupby。我知道您可以在行上，在这方面有很好的。然而，我似乎不能在列上分组。我唯一的解决方案就是调换数据帧。#generate data (copied from pandas example) arrays=[['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux',sec

浏览 7提问于2016-11-22得票数 10

回答已采纳

2回答

Pandas Groupby取值范围

python、group-by、pandas

pandas中有没有一种简单的方法来调用一系列递增的值来调用groupby？例如，在给定以下示例的情况下，能否以0.155增量对列B进行入库和分组，使得例如，列B中的前几个组被划分为介于'0 - 0.155，0.155 -0.31...`之间的范围import pandas as pd df=pd.DataFrame({'A':np.random.random(20

浏览 1提问于2014-01-30得票数 108

回答已采纳

1回答

聚合空DataFrame时保留列

python、pandas、group-by

我在python 2.7.9的pandas 0.18.0中工作。获取一个示例DataFrame并按几列分组，然后对不同的列求和以得到结果，如下所示： a b c1 4 5 6 这一切看起来都很棒，但是当在空DataFrame上执行相同的操作时，结果中的列</e

浏览 10提问于2016-07-29得票数 4

1回答

Pandas / Groupby /应用优化

python、pandas、pandas-groupby、pandas-apply

在pandas结构中使用重复的cols名称，基本上我正在尝试做与这篇文章相同的事情：在2600列中，只需要将大约30个cols合并成4个cols，比如从第13到第42列。 有没有办法优化链接帖子中提到的代码？也许可以找到一种方法来告诉Pa

浏览 18提问于2020-07-30得票数 0

1回答

我有一个很大的.csv文件，需要根据订购数量对具有相同名称的产品进行分组，这是我通过groupby()完成的。但是，我需要使用文件中的所有7列，但是在连接这些行之后，只剩下qty_ordered和name_hash，其余的列都消失了。有没有办法在连接基于name_hash和qty_ordered的行的同时，将我的所有7列都保留在我的数据帧中？这是我的代码： import pandas as p

浏览 15提问于2021-06-09得票数 0

1回答

我能加快多色组的速度，然后有一个周期的差异吗？

python、pandas、performance、numpy

'b': np.random.randint(0, 4000, 10**7), 我想按前两列进行分组(无序，大约与我在这里提供的组数相同)，然后区分第三列。df.groupby(['a', 'b']).c.diff(periods=-1)有什么<e

浏览 7提问于2019-10-18得票数 1

回答已采纳

1回答

使用groupby和NaN列选择第一行

python、pandas、dataframe

我正在尝试选择数据帧每组的第一行。import pandas as pdx = [{'id':"a",'val':np.nan, 'val2':-1},{'id':"a",'val':'TREE','val2':15}]# 0 a NaN -1 #

浏览 1提问于2014-09-29得票数 0

回答已采纳

1回答

Pandas groupby groups返回值而不是索引

python、pandas

30434960.0 240.098.0 30435079.0 213.0 80.0 30435119.0 160.0 我创建了一个groupby对象，将第一列中的项按第二列中的项进行分组： dx = df.groupby(df[2])[1] 在调用dx.groups时，我得到一个字典，其中列2的值作为键，列1的索引作为值。但是，我希望获得列1的

浏览 28提问于2021-10-25得票数 0

3回答

PySpark中pandas_udf的隐式模式？

python、apache-spark、pyspark、user-defined-functions

This answer很好地解释了如何使用pyspark的groupby和pandas_udf进行自定义聚合。StructField("key", StringType()),]) 因为我将返回具有自动生成的名称的100+列。有没有办法告诉PySpark只隐含地使用我的函数返回的模式，并假定它对所有工作节点都是相同的？这个模式在运

浏览 26提问于2019-02-20得票数 3

0回答

Pandas agg函数，具有对多列的操作

python、pandas、aggregate、multiple-columns

如果我们可以使用pandas.core.groupby.DataFrameGroupBy.agg函数对多列进行算术运算，我很感兴趣。例如：import pandas as pd df['C'] =[0, 0, 2, 2, 5] print(df.groupby('C').mean()[0] - d

浏览 3提问于2017-12-09得票数 0

1回答

Ultra win网格列过滤器

c#、infragistics、ultrawingrid

我使用的是ultrawingrid，下面是示例数据集维卡斯|昆特| 27 |迈索尔David | Wiesse | 26 |班加罗尔维卡斯|昆特| 27 |迈索尔同样，如果我想根据年龄进行</em

浏览 4提问于2015-04-24得票数 0

1回答

处理pandas数据帧中的换行符

pandas、amazon-athena

当我按列分组时，我从另一个字段中获得了意外的值。以下是示例数据： https://gist.github.com/shantanuo/c8272978575b4a403596ae87f10074c7 下面是我导入它的方式： import pandastest.csv', header=None, escapechar='\\') df.columns=['id', 'client', 'code', '

浏览 28提问于2019-01-15得票数 0

3回答

按索引对熊猫系列进行排序

python、pandas、sorting

我有一个名为pd的Pandas数据帧，我使用以下命令提取该数据帧其中一列中的唯一值的数量：B是一个Pandas系列对象，如下所示：6 248 50N 10 我正在尝试绘制此系列的条形图，但是，我想首先根据第一列对其进行排序我尝试传递sort命令，但它根据第二列</

浏览 4提问于2013-10-03得票数 9

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在进行pandas groupby时，有没有办法使用索引号来选择列？

相关·内容

在进行pandas groupby时，有没有办法使用索引号来选择列？

使用pandas to_csv仅引用所需的列

pandas groupby中的索引创建

访问groupby列值

如何在python pandas中使用groupby连接字符串？

Pandas.DataFrame.GroupBy.agg，聚合函数中需要的独立列。如何让它进入agg？

Dataframe中的Pandas中的聚合列

列上的Pandas Multiindex Groupby

Pandas Groupby取值范围

聚合空DataFrame时保留列

Pandas / Groupby /应用优化

在python中合并行

我能加快多色组的速度，然后有一个周期的差异吗？

使用groupby和NaN列选择第一行

Pandas groupby groups返回值而不是索引

PySpark中pandas_udf的隐式模式？

Pandas agg函数，具有对多列的操作

Ultra win网格列过滤器

处理pandas数据帧中的换行符

按索引对熊猫系列进行排序

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐