使用pandas中的方差范围对列进行分组

内容来源于 Stack Overflow,并遵循CC BY-SA 3.0许可协议进行翻译与使用

  • 回答 (1)
  • 关注 (0)
  • 查看 (68)

我正在尝试按照彼此更接近的值对列进行分组,例如:

column1 column2
322      a
326      b
323      c
323      d
323      e
324      f
325      g
498      h
498      i
495      j
496      k

我希望group column1使用方差+ - 3的值

结果:

column1 , column2
323 (+-3) a,b,c,d,e,f,g
495 (+-3) h,i,j,k
提问于
用户回答回答于

sort_values然后使用diffcumsum创建组键对值进行排序

df=df.sort_values('column1')
df.sort_index().\
    groupby(df.column1.diff().gt(3).cumsum()).\
      agg({'column1':'first','column2':','.join})
         column1        column2
column1                        
0            322  a,b,c,d,e,f,g
1            498        h,i,j,k

所属标签

可能回答问题的人

  • 找虫虫

    0 粉丝0 提问6 回答
  • 不吃貓的鱼oo

    5 粉丝466 提问5 回答
  • 优惠活动秘书

    0 粉丝2 提问5 回答
  • 爸爸

    腾讯 · 客户端安全 (已认证)

    4 粉丝4 提问5 回答

扫码关注云+社区

领取腾讯云代金券