在Python中不允许用重叠的键和值替换怎么办?

内容来源于 Stack Overflow,并遵循CC BY-SA 3.0许可协议进行翻译与使用

  • 回答 (1)
  • 关注 (0)
  • 查看 (57)

我试图将输入数据的值进行洗牌,将这些新值存储到字典中,然后通过将输入数据rame值替换为它们的字典映射来获得输出数据。

但是,我得到了“不允许用重叠的键和值替换”错误。

下面是我的代码示例:

in_df = ['A','B','C']
in_df = pd.DataFrame(in_df,columns=['Alphabets'])
df_temp = in_df.sample(frac=1).reset_index(drop=True)
df_temp = df_temp.rename(columns={'Alphabets':'sample'})
mask_dict = dict(zip(in_df['Alphabets'], df_temp['sample']))
out_df= in_df.replace({'Alphabets': mask_dict})

在……里面_DF看起来如下:

Alphabets
A
B
C

mask_dict看起来是这样的:

{'A': 'C', 'B': 'A', 'C': 'C'}

我要实现如下所示的out_df:

Alphabets
C
A
C

我道德办法是:

df_temp = in_df.stack().unique()
df_temp = pd.DataFrame(df_temp, columns=['Alphabets'])
df_temp1 = df_temp.sample(n=df_temp.size, random_state=123)
mask_dict = dict(zip(df_temp['Alphabets'], df_temp1['Alphabets']))
out_df = in_df.applymap(mask_dict.get)
提问于
用户回答回答于

虽然我无法解释你的错误,但你可以使用pd.DataFrame.applymap而不是:

out_df = in_df.applymap(mask_dict.get)

这种方法也应该比pd.DataFrame.replace更高效 ,如果只需要在单个系列中替换值,则可以使用pd.Series.map:

out_df = in_df.copy()
out_df['Alphabets'] = out_df['Alphabets'].map(mask-dict)

扫码关注云+社区

领取腾讯云代金券