使用R (contr.treatment)中的默认对比度,线性模型对象的摘要根据级别名称给出行名称。当我将对比度更改为contr.sum时,线性模型对象的摘要根据虚构的数字给出行名称。
对于下面的示例代码,处理对比度的行名是xa xb xc xd xe,对于总和对比度,它们是x1 x2 x3 x4 x5。
除了手动重命名行之外,有没有一种方法可以使这些行的行为相同?
示例:
y <- rnorm(10, 0, 1)
x <- factor(rep(letters[1:5], each = 2))
options(contrasts = c("contr.treatment", "contr.poly"))
summary(lm(y ~ x))
options(contrasts = c("contr.sum", "contr.poly"))
summary(lm(y ~ x))
发布于 2012-06-02 00:27:08
我仍然不确定这是不是一个好主意,我认为对对比意味着什么感到困惑的可能性太高了。尽管如此,我要做的是创建一个新的对比函数,该函数计算和对比,但将名称设置为与处理对比的默认名称相等。
set.seed(5)
n <- 5
y <- c(10 + rnorm(n, 0, 1), 20 + rnorm(n, 0, 1), 30 + rnorm(n, 0, 1))
wFactor <- as.factor(c(rep("A", n), rep("B", n), rep("C", n)))
contr.sumX <- function(...) {
conT <- contr.treatment(...)
conS <- contr.sum(...)
colnames(conS) <- colnames(conT)
conS
}
作为参考,下面是通常的输出:
> m1 <- lm(y ~ wFactor, contrasts = list(wFactor=contr.sum(n = levels(wFactor))))
> coef(summary(m1))
Estimate Std. Error t value Pr(>|t|)
(Intercept) 19.8218432 0.2481727 79.8711599 9.889455e-18
wFactor1 -9.6079241 0.3509692 -27.3754029 3.480430e-12
wFactor2 -0.1934654 0.3509692 -0.5512319 5.915907e-01
这是contr.sumX
函数的输出。
> m2 <- lm(y ~ wFactor, contrasts = list(wFactor=contr.sumX(n = levels(wFactor))))
> coef(summary(m2))
Estimate Std. Error t value Pr(>|t|)
(Intercept) 19.8218432 0.2481727 79.8711599 9.889455e-18
wFactorB -9.6079241 0.3509692 -27.3754029 3.480430e-12
wFactorC -0.1934654 0.3509692 -0.5512319 5.915907e-01
或者,您可以提前设置特定因子的对比度:
contrasts(wFactor) <- "contr.sumX"
m3 <- lm(y ~ wFactor)
> coef(summary(m3))
Estimate Std. Error t value Pr(>|t|)
(Intercept) 19.8218432 0.2481727 79.8711599 9.889455e-18
wFactorB -9.6079241 0.3509692 -27.3754029 3.480430e-12
wFactorC -0.1934654 0.3509692 -0.5512319 5.915907e-01
发布于 2016-02-16 21:07:23
我喜欢你的解决方案@Aaron,并已经实现了它,但我认为它包含了一个危险的错误。总和对比度给出了前n-1个因子和总体平均值之间的差异,而不是最后的n-1个因子,后者是命名算法返回的结果。参见Crawley's R Book第二版,第442-443页。
因此,我认为正确的函数应该是:
contr.sum.keepnames <- function(...) {
conS <- contr.sum(...)
colnames(conS) = rownames(conS)[-length(rownames(conS))]
conS
}
顺便说一句,我试着将这个作为注释添加,但在注释中添加代码块有困难。
https://stackoverflow.com/questions/10808853
复制相似问题