首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Python:如何根据不同的列获得值的总和

Python:如何根据不同的列获得值的总和
EN

Stack Overflow用户
提问于 2018-05-29 20:50:44
回答 2查看 46关注 0票数 1

我有一个数据框df,如下所示:

代码语言:javascript
运行
复制
df  name     city
0   John    New York
1   Carl    New York
2   Carl     Paris
3   Eva      Paris
4   Eva      Paris
5   Carl     Paris

我想知道不同城市的总人数。

代码语言:javascript
运行
复制
df2  city      number
0   New York     2
1    Paris       3

或者城市中同名的人数

代码语言:javascript
运行
复制
df2    name     city      number
0      John    New York     1
1      Eva      Paris       2
2      Carl     Paris       2
3      Eva      New York    0
EN

回答 2

Stack Overflow用户

发布于 2018-05-29 20:53:29

我相信需要GroupBy.size

代码语言:javascript
运行
复制
df1 = df.groupby(['city']).size().reset_index(name='number')
print (df1)
       city  number
0  New York       2
1     Paris       4

代码语言:javascript
运行
复制
df2 = df.groupby(['name','city']).size().reset_index(name='number')
print (df2)
   name      city  number
0  Carl  New York       1
1  Carl     Paris       2
2   Eva     Paris       2
3  John  New York       1

如果需要所有组合,一种解决方案是添加unstackstack

代码语言:javascript
运行
复制
df3=df.groupby(['name','city']).size().unstack(fill_value=0).stack().reset_index(name='count')
print (df3)
   name      city  number
0  Carl  New York       1
1  Carl     Paris       2
2   Eva  New York       0
3   Eva     Paris       2
4  John  New York       1
5  John     Paris       0

或使用MultiIndex.from_productreindex

代码语言:javascript
运行
复制
df2 = df.groupby(['name','city']).size()
mux = pd.MultiIndex.from_product(df2.index.levels, names=df2.index.names)
df2 = df2.reindex(mux, fill_value=0).reset_index(name='number')
print (df2)
   name      city  number
0  Carl  New York       1
1  Carl     Paris       2
2   Eva  New York       0
3   Eva     Paris       2
4  John  New York       1
5  John     Paris       0
票数 1
EN

Stack Overflow用户

发布于 2018-05-29 20:58:54

统计同一城市中不同名字的人数:

代码语言:javascript
运行
复制
groups = df.groupby('city').count().reset_index()

统计不同城市的同名人数:

代码语言:javascript
运行
复制
groups = df.groupby('city').count().reset_index()
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50584887

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档