我有以下数据:
1 2 3 4 5 6 7 8 9
0 0 0 1 0 0 0 0 0 1
1 0 0 0 0 1 1 0 1 0
2 1 1 0 1 1 0 0 1 1
...我希望为每一行获得行中值0的最长序列。因此,该数据帧的预期结果将是如下所示的数组:
[5,4,2,...]与第一行一样,值0的最大顺序ect为5,以此类推。
我已经看过this帖子,并尝试在第一行中获得这个(虽然我希望立即对整个dataframe进行此操作),但我得到了错误:
s=df_day.iloc[0]
(~s).cumsum()[s].value_counts().max()TypeError: ufunc‘反向’不支持输入类型,并且根据“安全”规则不能安全地将输入强制到任何受支持的类型。
当我手动插入如下的值时:
s=pd.Series([0,0,1,0,0,0,0,0,1])
(~s).cumsum()[s].value_counts().max()
>>>7我得到了7,这是行中0的总数,而不是最大的序列。但是,我不明白为什么一开始它会引发错误,更重要的是,我想要在while dataframe和每一行上运行它。
我的最终目标:连续获得值0的最大不间断值。
发布于 2022-03-17 09:28:07
每行计数连续0的矢量化解决方案,因此为了最大限度地使用DataFrame c
#more explain https://stackoverflow.com/a/52718619/2901002
m = df.eq(0)
b = m.cumsum(axis=1)
c = b.sub(b.mask(m).ffill(axis=1).fillna(0)).astype(int)
print (c)
1 2 3 4 5 6 7 8 9
0 1 2 0 1 2 3 4 5 0
1 1 2 3 4 0 0 1 0 1
2 0 0 1 0 0 1 2 0 0
df['max_consecutive_0'] = c.max(axis=1)
print (df)
1 2 3 4 5 6 7 8 9 max_consecutive_0
0 0 0 1 0 0 0 0 0 1 5
1 0 0 0 0 1 1 0 1 0 4
2 1 1 0 1 1 0 0 1 1 2https://stackoverflow.com/questions/71509547
复制相似问题