问为什么numpy std()给出的结果与matlab std()不同？
EN

Stack Overflow用户

提问于 2014-12-22 17:52:11

回答 2查看 43.3K关注 0票数 93

我尝试将matlab代码转换为numpy，并计算出numpy与std函数的结果不同。

在matlab中

std([1,3,4,6])
ans =  2.0817

在numpy中

np.std([1,3,4,6])
1.8027756377319946

这是正常的吗？我该如何处理这个问题呢？

matlab

numpy

standard-deviation

python

回答 2

Stack Overflow用户

回答已采纳

发布于 2014-12-22 17:54:16

NumPy函数np.std接受一个可选参数ddof：“增量自由度”。默认情况下，这是0。将其设置为1以获得MATLAB结果：

>>> np.std([1,3,4,6], ddof=1)
2.0816659994661326

在计算方差(其标准差是平方根)时，我们通常除以我们拥有的值的数量。

但是，如果我们从较大的分布中选择N元素的随机样本并计算方差，除以N可能会导致对实际方差的低估。要解决这个问题，我们可以将除以(the degrees of freedom的数字减少到一个小于N的数字(通常是N-1)。ddof参数允许我们按照指定的量更改除数。

除非另有说明，否则NumPy将计算方差的有偏估计(ddof=0除以N)。如果您使用的是整个分布(而不是从较大分布中随机选取的值的子集)，这就是您想要的。如果给定了ddof参数，NumPy将改为除以N - ddof。

MATLAB的std的默认行为是通过除以N-1来校正样本方差的偏差。这消除了标准偏差中的一些(但可能不是全部)偏差。如果您在一个较大分布的随机样本上使用该函数，这很可能是您想要的。

@hbaderts的精彩回答提供了更多的数学细节。

票数 156

Stack Overflow用户

发布于 2014-12-22 18:55:03

标准差是方差的平方根。随机变量X的方差定义为

因此，方差的估计值为

哪里

表示样本均值。对于随机选择的

，可以证明这个估计器不收敛于实际方差，而是收敛到

如果随机选择样本并估计样本均值和方差，则必须使用校正(无偏)估计器

它将会聚为

。修正项

也被称为贝塞尔校正。

现在，默认情况下，MATLAB std使用校正项n-1计算无偏估计器。然而，NumPy (正如@ajcr解释的那样)默认情况下计算无校正项的有偏估计器。参数ddof允许设置任何校正项n-ddof。通过将其设置为1，您将获得与MATLAB中相同的结果。

类似地，MATLAB允许添加第二个参数w，该参数指定“加权方案”。默认值w=0会产生校正项n-1 (无偏估计器)，而对于w=1，只有n用作校正项(有偏估计器)。

票数 62

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/27600207

复制

相似问题

问为什么numpy std()给出的结果与matlab std()不同？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问为什么numpy std()给出的结果与matlab std()不同？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问为什么numpy std()给出的结果与matlab std()不同？
EN