我想创建一个掩码列,其中1表示在一组其他列中有数据,当同一组中有空白时为0
A B C D E mask1
0 13 2 45 96 1
1 14 2 45 96 1
2 15 9 1. NaN 1
3 16 9 1.0 NaN 1
4 17 5 0.0 NaN 1
5 18 6 1.0 967 1
6 19 6 1.0 976 1
7 20 9 1.0 294 1
8 21 5 0.0 372 1
9 13 5 NaN 170 0
10 62 5 NaN 100 0
11 22 20 NaN 170 0
12 13 NaN 0.0 996 0我使用以下代码成功做到了这一点:
df2["mask1"] = np.where((df2['C'].isnull() | df2['D'].isnull()) , 0, 1)现在,我想为具有更多变量的更大的数据帧自动执行此操作,即,我想指定要用于此掩码的变量。我在考虑创建一个变量列表,比如
var = [C, D, E]我可以使用它来执行此操作,但不确定如何应用我使用此列表想出的相同代码。for循环?
https://stackoverflow.com/questions/47701550
复制相似问题