首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >大熊猫图案匹配数之和

大熊猫图案匹配数之和
EN

Stack Overflow用户
提问于 2020-11-10 09:18:14
回答 2查看 41关注 0票数 0

你好,我有一个df,如:

代码语言:javascript
运行
复制
Groups COL1
G1   Seq:1
G1   Seq:2
G1   Seq_1
G1   Seq:4
G2   Seq_2
G2   Seq_3
G2   Seq_4
G3   Seq:5
G3   Seq:6
G4   Seq:7
G4   Seq_5

我想数一数:

  1. Nb群与":“:”=1 (G3)
  2. Nb群":“= 2(G1和G4 )
  3. Nb群":”=1 (G2)

有人知道吗?我想我应该起诉一个re.sub,然后在熊猫中计算每个Groups的总和?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-11-10 09:37:31

您可以使用这个来计算使用pd.Series.str.contains,然后使用GroupBy.allGroupBy.any

代码语言:javascript
运行
复制
om = df['COL1'].str.contains(':')

one = om.groupby(df['Groups']).all().sum() # 1
two = om.groupby(df['Groups']).any().sum() - one # 2 
# minus one because `any` counts all Trues too so we need 
# subtract groups with all Trues.
three = (~om).groupby(df['Groups']).all().sum() # 1
票数 2
EN

Stack Overflow用户

发布于 2020-11-10 09:25:30

使用Series.str.contains作为掩码,然后通过numpy.setdiff1dDataFrame.loc过滤的值与~或掩码的反向掩码进行比较:

代码语言:javascript
运行
复制
m = df['COL1'].str.contains(':')

a = np.setdiff1d(df['Groups'], df.loc[~m, 'Groups']).tolist()
print (a)
['G3']

c = np.setdiff1d(df['Groups'], df.loc[m, 'Groups']).tolist()
print (c)
['G2']

b = np.setdiff1d(df.loc[~m, 'Groups'], c).tolist()
print (b)
['G1', 'G4']

用于计数的Anf获取列表长度:

代码语言:javascript
运行
复制
print (len(a))
print (len(b))
print (len(c))
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64765989

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档