是否有一种直接的方法来计算熊猫中数据列的平均值,但不考虑以零为值的数据?类似于.mean()函数中的参数吗?目前正在这样做:
x = df[df[A]!=0]
x.mean()
发布于 2015-10-19 07:45:57
它还取决于数据中0的含义。
发布于 2021-11-19 03:50:18
df[df["Column_name"] != 0]["Column_name"].mean()
或者您的列名不包含空格char。
df[df.Column_Name != 0].Column_Name.mean()
希望它可以作为参数包含在下一个“均数”对象版本中。
.mean(exclude=0) #wondering in next versions
发布于 2020-10-04 23:06:09
可以将df转换为numpy数组并使用numpy.nanmean()。
import numpy as np
df = pd.DataFrame(data=np.array([[1, 2],
[3, 4],
[6, 7],
[8, np.nan],
[np.nan, 11]]),
columns=['A', 'B'])
df_col_means = numpy.nanmean(df.values) # by columns
df_row_means = numpy.nanmean(df.values, axis=1) # by rows
col_A_mean = numpy.nanmean(df['A'].values) # particular column mean
https://stackoverflow.com/questions/33217636
复制