我想替换列“风险评级”中的值,当且仅当三个条件满足了来自数据数据的三列的条件。我使用了掩码技术,也用了.loc方法,但是它对我没有用。我只想做9行。我想把这个单数的“风险评级”值从0替换到9。数据帧的长度为180002。下面是我写的代码:
safety.loc[((safety['Employee Name']=="Shabbir Hussain") & (safety['Employee Number']==11231) &
(safety['Attendance Date']=="2020-03-12")),['Risk Rating']]=9
mask = (safety['Employee Name']=="Shakir Hussain") & (safety['Employee Number']==11026) &
(safety['Attendance Date']=="2020-03-12") & (safety['Risk Rating']==0)
safety['Risk Rating'][mask]=9
发布于 2021-02-20 10:29:04
mask = (safety['Employee Name']=="Shakir Hussain") &
(safety['Employee Number']==11026) &
(safety['Attendance Date']=="2020-03-12") &
(safety['Risk Rating']==0)
如果要有条件地赋值,则需要使用.loc来定位特定的索引,然后可以分配值。
safety.loc[mask, 'Risk Rating']=9
或者您也可以使用numpy选择来应用掩蔽。
safety['Risk Rating'] = np.select([mask], [9], default=safety['Risk Rating'])
发布于 2021-02-20 11:01:26
改进@Bikhyat Adhiakri回答,考虑到您将处理数千行,请使用numpy:
import numpy as np
arr = safety.to_numpy()
# replace 0, 1, 2 with the row numbers
mask = (arr[:,0] == "Shakir Hussain") * (arr[:,1] == 11026) * (df_np[:,2] == "2020-03-12")
arr[mask,4] = 9 # but your data will be in numpy format
# or you can use
# safety.loc[mask, 'Risk Rating'] = 9
对于大行号,numpy可能使处理速度提高1000倍。
https://stackoverflow.com/questions/66290127
复制相似问题