问潘达斯DataFrame的条件平均值
EN

Stack Overflow用户

提问于 2018-11-18 21:27:27

回答 1查看 2.5K关注 0票数 0

我有一个有多列房地产销售数据的数据。我想找到所有1张床的'ppsf'的平均价格，按邮政编码计算。下面是我的尝试( dict中的每个键都是一个邮政编码)：

bed1_bath1={}
for zip in zip_codes:
    bed1_bath1[zip]= (df.loc[(df['bed']==1) & (df['bath']==1) & (df['zip']==zip)]).mean()

问题是，这会将从dataframe到字典的所有列的平均值增加。我确信有更好的方法可以做到这一点；也许使用numpy.where？

回答已采纳

发布于 2018-11-18 21:33:50

(df[(df['bed']==1) & (df['bath']==1) & (df['zip']==zip)])['ppsf'].mean()会这么做的。在计算平均值之前，您只需选择您感兴趣的列(因此，您甚至不会对其余的列进行处理)。

票数 4

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/53365640

复制

相似问题

问潘达斯DataFrame的条件平均值EN