我正在处理一个计数数据,并尝试了几个不同的泊松固定效果回归模型,使用zeroinfl (来自pscl软件包)和pglm (来自pglm软件包)来处理非零膨胀模型。然而,我的R代码运行非常慢,需要9-10个小时以上。为了清楚起见,我通过添加时间和ID虚拟来手动添加固定效果。
model<- zeroinfl(y~ x1+ x2+ x3+ x4 + as.factor(time)
+ as.factor(ID) | 1, data = df, dist = "poisson")
我知道这个问题:R Zeroinfl model。然而,我的数据是高度零膨胀的,平均值为0.587,中位数等于0,我担心数据的这一特征可能会被建议的方法丢失。我对R还是个新手,任何帮助都很感谢。
发布于 2021-08-17 19:59:50
考虑到您到目前为止所说的内容,可能值得一试
library(glmmTMB)
model <- glmmTMB(y~ x1+ x2+ x3+ x4 + as.factor(time)
+ as.factor(ID),
dispformula = ~ 1,
data = df,
family = "poisson",
sparseX = c(cond = TRUE))
您可以对零膨胀成分做任何您喜欢的事情(例如,使用dispformula = ~ x1 + x2 + x3 + x4
来包含这些协变量)。如果希望零膨胀模型矩阵也是稀疏的,请向sparseX
向量添加zi = TRUE
。
原因(特别是对于sparseX
)是,使用zeroinfl
为具有87K行和2500个is的数据集生成模型矩阵将(我认为)创建一个大约2500*87e3*8/2^30 = 1.620501
is的模型矩阵……
https://stackoverflow.com/questions/68822862
复制相似问题