首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >为什么带有R [ PLS ]的pls回归系数与其他R包的回归系数不同?

为什么带有R [ PLS ]的pls回归系数与其他R包的回归系数不同?
EN

Stack Overflow用户
提问于 2021-02-09 09:33:30
回答 1查看 204关注 0票数 2

出于好奇,我试图找出为什么用pls获得的偏最小二乘回归系数与用plsRglmroplsplsdepot获得的系数不同,这都提供了相同的结果。

下面是一些可以开始的代码。我曾尝试使用plsr函数的scale、center和method参数……但到目前为止还没有成功。

代码语言:javascript
运行
复制
library(pls)
library(plsRglm)
library(ropls)
library(plsdepot)

data(Cornell)

pls.plsr <- plsr(
  Y~X1+X2+X3+X4+X5+X6+X7, 
  data = Cornell, 
  ncomp = 3, 
  scale = TRUE, 
  center = TRUE
)

plsRglm.plsr <- plsR(
  Y~X1+X2+X3+X4+X5+X6+X7, 
  data = Cornell, 
  nt = 3, 
  scaleX = TRUE
)

ropls.plsr <- opls(
  as.matrix(Cornell[, grep("X", colnames(Cornell))]),
  Cornell[, "Y"], 
  scaleC = "standard"
)

plsdepot.plsr <- plsreg1(
  as.matrix(Cornell[, grep("X", colnames(Cornell))]),
  Cornell[, "Y"],
  comps = 3
)

## extract PLS regression coefficients for the PLS model with three components
coef(pls.plsr) # a
coef(plsRglm.plsr, type = "original") # b
coef(plsRglm.plsr, type = "scaled") # c
coef(ropls.plsr) # c
plsdepot.plsr$std.coefs # c
plsdepot.plsr$reg.coefs # b
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-04-22 21:54:04

首先,只是为了重新格式化,我们写道:

代码语言:javascript
运行
复制
library(pls)
library(plsRglm)
library(ropls)
library(plsdepot)

data(Cornell)
pls.plsr <- plsr(Y ~ X1 + X2 + X3 + X4 + X5 + X6 + X7, 
                 data = Cornell, 
                 ncomp = 3, scale = T, center = T)
plsRglm.plsr <- plsR(Y ~ X1 + X2 + X3 + X4 + X5 + X6 + X7, 
                    data = Cornell, 
                    nt = 3, scaleX = TRUE)
ropls.plsr <- opls(as.matrix(Cornell[, grep("X", colnames(Cornell))]),
                   Cornell[, "Y"], scaleC = "standard")
plsdepot.plsr <- plsreg1(as.matrix(Cornell[, grep("X", colnames(Cornell))]),
                         Cornell[, "Y"], comps = 3)

完成后,您可以提取原始比例中的系数:

代码语言:javascript
运行
复制
### ORIGINAL SCALE -  plsRglm, plsdepot
coef(plsRglm.plsr, type = "original")
plsdepot.plsr$reg.coefs

或者您可以对它们进行缩放:

代码语言:javascript
运行
复制
### SCALED - plsRglm, ropls, plsdepot
coef(plsRglm.plsr, type = "scaled")
coef(ropls.plsr)
plsdepot.plsr$std.coefs

因此,现在所有的方法都会产生相同的系数。除了pls::plsr。为什么?你可能会问。关键在命令中。当你运行时:

代码语言:javascript
运行
复制
coef(pls.plsr) # , , 3 comps

你可以看到",,3“。这是张量对象的特征。这是什么?系数应该是一个简单的向量。原因是coef是一个泛型函数,它对于pls::plsr模型不能正常工作。要查看实际提取的内容,请执行以下操作:

代码语言:javascript
运行
复制
pls.plsr$coefficients
matrix(pls.plsr$coefficients, ncol = 3) # or in matrix form. coef simply extracts the third column (it should not)

但是,如果您检查每个R-package中的等效对象,则可以看到所有模型都具有相同的拟合效果,如下所示:

代码语言:javascript
运行
复制
matrix(pls.plsr$projection, ncol = 3)    
plsRglm.plsr$wwetoile
plsdepot.plsr$mod.wgs
ropls.plsr@weightStarMN

因此,对于pls::plsr,您根本没有提取系数。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66111762

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档