首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >pandas: groupby和aggregate,不会丢失已分组的列

pandas: groupby和aggregate,不会丢失已分组的列
EN

Stack Overflow用户
提问于 2016-09-12 07:03:57
回答 2查看 26.9K关注 0票数 24

我有一个熊猫数据框架,如下所示。对于每个Id,我可以有多个名称和子Id。

代码语言:javascript
运行
复制
Id      NAME   SUB_ID
276956  A      5933
276956  B      5934
276956  C      5935
287266  D      1589

我希望压缩数据帧,使每个id只有一行,并且每个id下的所有名称和sub_ids都显示为该行上的单个集合。

代码语言:javascript
运行
复制
Id      NAME           SUB_ID
276956  set(A,B,C)     set(5933,5934,5935)
287266  set(D)         set(1589) 

我尝试按id分组,然后聚合所有其他列。

代码语言:javascript
运行
复制
df.groupby('Id').agg(lambda x: set(x))

但是在这样做的时候,得到的数据帧没有Id列。当您执行groupby时,id将作为元组的第一个值返回,但我猜当您聚合该值时,它就丢失了。有没有办法得到我要找的数据帧?也就是说,在不丢失被分组的列的情况下进行groupby和aggregate。

EN

Stack Overflow用户

回答已采纳

发布于 2016-09-12 10:23:13

如果您不想将groupby作为索引,可以使用参数来避免进一步的重置:

代码语言:javascript
运行
复制
df.groupby('Id', as_index=False).agg(lambda x: set(x))
票数 28
EN
查看全部 2 条回答
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/39441484

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档