首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >R中基于泊松的回归模型代码运行非常慢

R中基于泊松的回归模型代码运行非常慢
EN

Stack Overflow用户
提问于 2021-08-17 19:12:59
回答 1查看 58关注 0票数 0

我正在处理一个计数数据,并尝试了几个不同的泊松固定效果回归模型,使用zeroinfl (来自pscl软件包)和pglm (来自pglm软件包)来处理非零膨胀模型。然而,我的R代码运行非常慢,需要9-10个小时以上。为了清楚起见,我通过添加时间和ID虚拟来手动添加固定效果。

代码语言:javascript
运行
复制
model<- zeroinfl(y~ x1+ x2+ x3+ x4 + as.factor(time) 
               + as.factor(ID) | 1, data = df, dist = "poisson")

我知道这个问题:R Zeroinfl model。然而,我的数据是高度零膨胀的,平均值为0.587,中位数等于0,我担心数据的这一特征可能会被建议的方法丢失。我对R还是个新手,任何帮助都很感谢。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-08-17 19:59:50

考虑到您到目前为止所说的内容,可能值得一试

代码语言:javascript
运行
复制
library(glmmTMB)
model <- glmmTMB(y~ x1+ x2+ x3+ x4 + as.factor(time) 
               + as.factor(ID),
          dispformula = ~ 1, 
          data = df, 
          family = "poisson",
          sparseX = c(cond = TRUE))

您可以对零膨胀成分做任何您喜欢的事情(例如,使用dispformula = ~ x1 + x2 + x3 + x4来包含这些协变量)。如果希望零膨胀模型矩阵也是稀疏的,请向sparseX向量添加zi = TRUE

原因(特别是对于sparseX)是,使用zeroinfl为具有87K行和2500个is的数据集生成模型矩阵将(我认为)创建一个大约2500*87e3*8/2^30 = 1.620501 is的模型矩阵……

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/68822862

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档