我有dataframe,我需要申请下面的条件
数据帧:
Temp colA colB colC
ob1 50 HDP HDP
ob1 50 HDP recycled HDP
ob1 50 HDP HDP
ob2 0 PE PE
ob2 0 PE PE
ob3 30 PE recycled PE recycled
ob3 30 PE PE recycled
输出:
Temp colA colB colC output
ob1 50 HDP recycled HDP Anomaly
ob2 0 PE PE Pass
ob3 30 PE recycled PE recycled Pass
我尝试过的代码:
f=pp.groupby('Temp')['colB'].apply(lambda x:
x.str.contains('Recycled').any()).map({True:'Pass',False:'anomaly'})
发布于 2019-06-04 05:33:30
尝试使用Rank函数
data['Rank'] = data.groupby('Temp')['output'].rank(method='dense',ascending=True)
data['Final'] = data.groupby('Temp')['Rank'].rank(method='first',ascending=True)
https://stackoverflow.com/questions/56433820
复制相似问题