我有一个有多列房地产销售数据的数据。我想找到所有1张床的'ppsf'的平均价格,按邮政编码计算。下面是我的尝试( dict中的每个键都是一个邮政编码):
bed1_bath1={}
for zip in zip_codes:
bed1_bath1[zip]= (df.loc[(df['bed']==1) & (df['bath']==1) & (df['zip']==zip)]).mean()问题是,这会将从dataframe到字典的所有列的平均值增加。我确信有更好的方法可以做到这一点;也许使用numpy.where?
发布于 2018-11-18 21:33:50
(df[(df['bed']==1) & (df['bath']==1) & (df['zip']==zip)])['ppsf'].mean()会这么做的。在计算平均值之前,您只需选择您感兴趣的列(因此,您甚至不会对其余的列进行处理)。
https://stackoverflow.com/questions/53365640
复制相似问题