我有一个有1000万行的dataframe,如何有效地将"AA BB CC DD EE FF“以外的项目分组并重命名为”other“?
原始数据
name
0 AA
1 BB
2 CC
4 DD
5 EE
6 FF
7 htruj
9 uyd3
10 dr6y5
11 gery5
12 pihd
期望输出
name new_name
0 AA AA
1 BB BB
2 CC CC
4 DD DD
5 EE EE
6 FF FF
7 htruj others
9 uyd3 others
10 dr6y5 others
11 gery5 others
12 pihd others
发布于 2018-06-22 07:33:27
在isin
中使用np.where
df['New']=np.where(df.name.isin(['AA','BB','CC','DD','EE','FF']),df.name,'other')
df
name New
0 AA AA
1 BB BB
2 CC CC
4 DD DD
5 EE EE
6 FF FF
7 htruj other
9 uyd3 other
10 dr6y5 other
11 gery5 other
12 pihd other
https://stackoverflow.com/questions/50978730
复制相似问题