我的数据帧如下所示
ID Stage Recipe
1 ABC X
1 ABC D
1 ABC D
1 ABC D
2 ABC X
2 ABC X
1 BCD Y
1 CDE Y
我想要的是为一个特定的ID计算在特定阶段(相当于返工)出现多次的Recipe。
因此,此数据帧的输出应如下所示:
ID Rework_steps
1 2
2 1
非常感谢您的帮助!
发布于 2020-10-11 22:28:02
我现在实际上自己解决了这个问题,只需简单地计算重复的duplicates=`df[df.duplicated(subset=['ID','Stage','Recipe'])]
和duplicates.groupby('ID').size()
https://stackoverflow.com/questions/64304443
复制相似问题