我有一个住房数据框架:

价格列中缺少值的位置。我希望通过各自郊区的平均价格来填充缺失的值。
这是我的代码,用来填写同一列的平均价格:
all_housing_df['Price'].fillna(all_housing_df['Price'].mean())如何填写各郊区的均价?
发布于 2021-04-11 14:07:45
您可以使用transform在按郊区分组后使用完整列表填充缺少的值
all_housing_df["Price"].fillna(all_housing_df.groupby("Suburb")["Price"].transform("mean"))发布于 2021-04-11 14:13:28
您可以按Suburb分组,获取平均值Price并将其另存为字典,以便有条件地替换空值。
# Create dictionary for NaN values
nan_dict = all_housing_df.groupby('Suburb')['Price'].mean().to_dict()
# Replace NaN with dictionary
all_housing_df['Price'].fillna(all_housing_df['Suburb'].map(nan_dict))https://stackoverflow.com/questions/67041854
复制相似问题