首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Python:如何填充从另一个数据框列引用的平均值

Python:如何填充从另一个数据框列引用的平均值
EN

Stack Overflow用户
提问于 2021-04-11 13:48:05
回答 2查看 54关注 0票数 2

我有一个住房数据框架:

价格列中缺少值的位置。我希望通过各自郊区的平均价格来填充缺失的值。

这是我的代码,用来填写同一列的平均价格:

代码语言:javascript
复制
all_housing_df['Price'].fillna(all_housing_df['Price'].mean())

如何填写各郊区的均价?

EN

回答 2

Stack Overflow用户

发布于 2021-04-11 14:07:45

您可以使用transform在按郊区分组后使用完整列表填充缺少的值

代码语言:javascript
复制
all_housing_df["Price"].fillna(all_housing_df.groupby("Suburb")["Price"].transform("mean"))
票数 1
EN

Stack Overflow用户

发布于 2021-04-11 14:13:28

您可以按Suburb分组,获取平均值Price并将其另存为字典,以便有条件地替换空值。

代码语言:javascript
复制
# Create dictionary for NaN values
nan_dict = all_housing_df.groupby('Suburb')['Price'].mean().to_dict()

# Replace NaN with dictionary
all_housing_df['Price'].fillna(all_housing_df['Suburb'].map(nan_dict))
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67041854

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档