我有一份清单:
s = [0.995537725, 0.994532199, 0.996027983, 0.999891383, 1.004754272, 1.003870012, 0.999888944, 0.994438078, 0.992548715, 0.998344545, 1.004504764, 1.00883411]
我在Excel中计算了它的标准差,得到了答案:0.005106477
,我使用的函数是:=STDEV(C5:N5)
然后,我使用numpy.std
进行与以下相同的计算:
import numpy as np
print np.std(s)
然而,我得到了答案:0.0048890791894
我甚至写下了我自己的性病功能:
def std(input_list):
count = len(input_list)
mean = float(sum(input_list)) / float(count)
overall = 0.0
for i in input_list:
overall = overall + (i - mean) * (i - mean)
return math.sqrt(overall / count)
我自己的函数给出了和numpy一样的结果。
所以我想知道这有什么区别吗?还是我犯了个错误?
发布于 2015-12-07 12:52:38
不同之处在于:Excel的STDEV
计算样本标准差,而NumPy的std
默认计算总体标准差(它的行为就像Excel的STDEVP
)。
要使NumPy的std
函数像Excel的STDEV
那样运行,传递值ddof=1
>>> np.std(s, ddof=1)
0.0051064766704396617
这使用样本方差来计算s
的标准差(即除以n-1
而不是n
)。
https://stackoverflow.com/questions/34133939
复制相似问题