我尝试将输入数据帧中的值打乱,将这些新值存储到字典中,然后通过将输入数据框值替换为它们的字典映射来获得输出数据帧。
然而,我得到了“不允许替换重叠的键和值”的错误。
下面是我的代码示例:
in_df = ['A','B','C']
in_df = pd.DataFrame(in_df,columns=['Alphabets'])
df_temp = in_df.sample(frac=1).reset_index(drop=True)
df_temp = df_temp.rename(columns={'Alphabets':'sample'})
mask_dict = dict(zip(in_df['Alphabets'], df_temp['sample']))
out_df= in_df.replace({'Alphabets': mask_dict})
in_df如下所示:
Alphabets
A
B
C
mask_dict看起来像这样:
{'A': 'C', 'B': 'A', 'C': 'C'}
我希望out_df看起来像这样:
Alphabets
C
A
C
我找到了一种方法来做到这一点!
df_temp = in_df.stack().unique()
df_temp = pd.DataFrame(df_temp, columns=['Alphabets'])
df_temp1 = df_temp.sample(n=df_temp.size, random_state=123)
mask_dict = dict(zip(df_temp['Alphabets'], df_temp1['Alphabets']))
out_df = in_df.applymap(mask_dict.get)
https://stackoverflow.com/questions/50891292
复制相似问题