首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >为什么covariance2()给错了答案?

为什么covariance2()给错了答案?
EN

Stack Overflow用户
提问于 2014-06-25 12:41:08
回答 1查看 62关注 0票数 1
代码语言:javascript
运行
复制
sMean = function(x) {
  sum = 0;
  for (i in 1:length(x)) {
    sum = sum + x[i]
  }
  return(sum/length(x))
}

covariance = function(x,y) {
  #Formula is E((x-E[x])(y-E[y])) => E[xy] - E[x]E[y]
  meanX = sMean(x)
  meanY = sMean(y)
  cov = 0;
  for (i in 1:length(x)) {
    cov = cov + ((x[i] - meanX) * (y[i] - meanY))
  }
  cov = cov/(length(x)-1)
  return (cov)
}

covariance2 = function(x,y) {
  #Formula is E((x-E[x])(y-E[y])) => E[xy] - E[x]E[y]
  meanX = (sMean(x) * length(x)) /(length(x)-1)
  meanY = (sMean(y) * length(x)) /(length(x)-1)
  meanXY = (sMean(x*y) * length(x)) /(length(x)-1)
  return (meanXY - meanX*meanY)
}

#Output
  #> cov(arr,arr2)
  #[1] 16.75
  #> covariance(arr,arr2)
  #[1] 16.75
  #> covariance2(arr,arr2) #Why this function give wrong output?
  #[1] -9.5

为什么covariance2给错了输出?根据http://en.wikipedia.org/wiki/Covariance#Definition输出应该是相同的。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-06-25 13:30:53

covariance2()中,您需要用length(x)而不是length(x) - 1除以。

代码语言:javascript
运行
复制
covariance2 = function(x,y) {
    meanX <- sMean(x)
    meanY <- sMean(y)
    meanXY <- sMean(x*y)
    return((meanXY - meanX * meanY) * length(x) / (length(x) - 1))
}

这背后的数学是用Ex=sum(x)/N表示长度N向量x的期望(即平均值),可以证明ExEy=E(x(X))(y(Y))。这是一个普遍的事实,来自期望算子的线性。您的covariance()函数返回此等式的右侧乘以N/(N-1) (这是样本协方差)。因此,在covariance2()中计算的左手边也需要乘以相同的因子。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/24408978

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档