我尝试将matlab代码转换为numpy,并计算出numpy与std函数的结果不同。
在matlab中
std([1,3,4,6])
ans = 2.0817
在numpy中
np.std([1,3,4,6])
1.8027756377319946
这是正常的吗?我该如何处理这个问题呢?
发布于 2014-12-22 17:54:16
NumPy函数np.std
接受一个可选参数ddof
:“增量自由度”。默认情况下,这是0
。将其设置为1
以获得MATLAB结果:
>>> np.std([1,3,4,6], ddof=1)
2.0816659994661326
在计算方差(其标准差是平方根)时,我们通常除以我们拥有的值的数量。
但是,如果我们从较大的分布中选择N
元素的随机样本并计算方差,除以N
可能会导致对实际方差的低估。要解决这个问题,我们可以将除以(the degrees of freedom的数字减少到一个小于N
的数字(通常是N-1
)。ddof
参数允许我们按照指定的量更改除数。
除非另有说明,否则NumPy将计算方差的有偏估计(ddof=0
除以N
)。如果您使用的是整个分布(而不是从较大分布中随机选取的值的子集),这就是您想要的。如果给定了ddof
参数,NumPy将改为除以N - ddof
。
MATLAB的std
的默认行为是通过除以N-1
来校正样本方差的偏差。这消除了标准偏差中的一些(但可能不是全部)偏差。如果您在一个较大分布的随机样本上使用该函数,这很可能是您想要的。
@hbaderts的精彩回答提供了更多的数学细节。
发布于 2014-12-22 18:55:03
标准差是方差的平方根。随机变量X
的方差定义为
因此,方差的估计值为
哪里
表示样本均值。对于随机选择的
,可以证明这个估计器不收敛于实际方差,而是收敛到
如果随机选择样本并估计样本均值和方差,则必须使用校正(无偏)估计器
它将会聚为
。修正项
也被称为贝塞尔校正。
现在,默认情况下,MATLAB std
使用校正项n-1
计算无偏估计器。然而,NumPy (正如@ajcr解释的那样)默认情况下计算无校正项的有偏估计器。参数ddof
允许设置任何校正项n-ddof
。通过将其设置为1,您将获得与MATLAB中相同的结果。
类似地,MATLAB允许添加第二个参数w
,该参数指定“加权方案”。默认值w=0
会产生校正项n-1
(无偏估计器),而对于w=1
,只有n用作校正项(有偏估计器)。
https://stackoverflow.com/questions/27600207
复制相似问题