首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >从glm和lmer中提取剩余方差

从glm和lmer中提取剩余方差
EN

Stack Overflow用户
提问于 2012-09-08 03:54:37
回答 1查看 8K关注 0票数 2

我试图把我读到的关于多级建模的内容与R中关于glm的知识结合起来,我现在使用的是来自这里的身高增长数据。

我已经做了如下代码:

代码语言:javascript
运行
复制
library(lme4)
library(ggplot2)

setwd("~/Documents/r_code/multilevel_modelling/")

rm(list=ls())

oxford.df <- read.fwf("oxboys/OXBOYS.DAT",widths=c(2,7,6,1))
names(oxford.df) <- c("stu_code","age_central","height","occasion_id")
oxford.df <- oxford.df[!is.na(oxford.df[,"age_central"]),]
oxford.df[,"stu_code"] <- factor(as.character(oxford.df[,"stu_code"]))
oxford.df[,"dummy"] <- 1

chart <- ggplot(data=oxford.df,aes(x=occasion_id,y=height))
chart <- chart + geom_point(aes(colour=stu_code))

# see if lm and glm give the same estimate
glm.01 <- lm(height~age_central+occasion_id,data=oxford.df)
glm.02 <- glm(height~age_central+occasion_id,data=oxford.df,family="gaussian")
summary(glm.02)
vcov(glm.02)
var(glm.02$residual)
(logLik(glm.01)*-2)-(logLik(glm.02)*-2)
1-pchisq(-2.273737e-13,1)
# lm and glm give the same estimation
# so glm.02 will be used from now on

# see if lmer without level2 variable give same result as glm.02
mlm.03 <- lmer(height~age_central+occasion_id+(1|dummy),data=oxford.df,REML=FALSE)
(logLik(glm.02)*-2)-(logLik(mlm.03)*-2)
# 1-pchisq(-3.408097e-07,1)
# glm.02 and mlm.03 give the same estimation, only if REML=FALSE

mlm.03提供了以下输出:

代码语言:javascript
运行
复制
> mlm.03
Linear mixed model fit by maximum likelihood 
Formula: height ~ age_central + occasion_id + (1 | dummy) 
   Data: oxford.df 
  AIC  BIC logLik deviance REMLdev
 1650 1667 -819.9     1640    1633
Random effects:
 Groups   Name        Variance Std.Dev.
 dummy    (Intercept)  0.000   0.0000  
 Residual             64.712   8.0444  
Number of obs: 234, groups: dummy, 1

Fixed effects:
            Estimate Std. Error t value
(Intercept)  142.994     21.132   6.767
age_central    1.340     17.183   0.078
occasion_id    1.299      4.303   0.302

Correlation of Fixed Effects:
            (Intr) ag_cnt
age_central  0.999       
occasion_id -1.000 -0.999

您可以看到,random effect部分中的残差有一个方差,这是我从Applied Multilevel Analysis - A Practical Guide上读到的Jos W.R.Twisk的文章,这代表了模型中“无法解释的方差”的数量。

我想知道是否可以从glm.02获得相同的剩余方差,因此我尝试了以下方法:

代码语言:javascript
运行
复制
> var(resid(glm.01))
[1] 64.98952
> sd(resid(glm.01))
[1] 8.061608

结果与mlm.03输出略有不同。这是否指mlm.03中相同的“剩余方差”?

EN

回答 1

Stack Overflow用户

发布于 2014-08-26 11:51:56

您的glm.02glm.01使用最小二乘法估计一个简单的线性回归模型。另一方面,mlm.03是通过极大似然估计的线性混合模型。我不知道您的数据集,但是看起来您使用dummy变量在2级创建了一个零方差的集群结构。

所以你的问题基本上有两个答案,但只有第二个答案对你的情况很重要。模型glm.02mlm.03不包含相同的残差估计,因为.

  1. 模型通常是不同的(混合效应与经典回归)。但是,在您的示例中,dummy变量似乎抑制了混合模型中的附加方差分量。所以对我来说,模特们似乎是平等的。
  2. 估计残差方差的方法不同。glm使用LS,lmer在代码中使用ML。毫升对剩余方差的估计略有偏倚(导致较小的方差估计)。这可以通过使用REML而不是ML来估计方差分量来解决。

然而,对于似然比检验,使用经典ML (而不是REML)仍然是必要和正确的。使用REML,比较这两种可能性是不正确的。

干杯!

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/12758508

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档