这个问题是关于使用R来理解逻辑回归输出的
以下是我的示例数据框:
Drugpairs AdverseEvent Y N
1 Rebetol + Pegintron Nausea 29 1006
2 Rebetol + Pegintron Anaemia 21 1014
3 Rebetol + Pegintron Vomiting 14 1021
4 Ribavirin + Pegasys Nausea 5 238
5 Ribavirin + Pegasys Anaemia 12 231
6 Ribavirin + Pegasys Vomiting 1 242
7 Ribavirin + Pegintron Nausea 15 479
8 Ribavirin + Pegintron Anaemia 7 487
9 Ribavirin + Pegintron Vomiting 9 485这基本上描述了特定药物对引起医学不良事件的次数。(Y=yes,N=no)。我使用以下命令在R中对此数据运行逻辑回归:
mod.form="cbind(Y,N) ~ Drugpairs * AdverseEvent"
glmhepa.out=glm(mod.form, family=binomial(logit), data=hepatitis.df)总结输出如下(仅显示系数表)
Estimate Std. Error z value
(Intercept) -3.8771 0.2205 -17.586
DrugpairsRibavirin + Pegasys 0.9196 0.3691 2.491
DrugpairsRibavirin + Pegintron -0.3652 0.4399 -0.830
AdverseEventNausea 0.3307 0.2900 1.140
AdverseEventVomiting -0.4123 0.3479 -1.185
DrugpairsRibavirin + Pegasys:AdverseEventNausea -1.2360 0.6131 -2.016
DrugpairsRibavirin + Pegintron:AdverseEventNausea 0.4480 0.5457 0.821
DrugpairsRibavirin + Pegasys:AdverseEventVomiting -2.1191 1.1013 -1.924
DrugpairsRibavirin + Pegintron:AdverseEventVomiting 0.6678 0.6157 1.085我知道系数给出了概率赔率。然而,我很好奇,为什么AdverseEventAnaemea没有系数,为什么药物的任何组合和不良事件都没有系数?(最后4行是药物和不良事件的联合效应)
发布于 2014-04-11 10:48:54
离散变量的系数用于效果差异(也称为对比)。在hte级别向量的排序顺序中,基线被视为因子的最低级别,默认情况下按字母顺序排序。您可以更改排序,这将更改参考点和系数。对于像第二个模型中这样的相互作用项,你几乎永远不会发现查看系数本身是有用的。查看选定比较的预测效果会更好。
还有..。不要忘记,对于logistic模型,系数是在log0odds尺度上估计的。这将使predict的使用更有帮助,因为在使用type= "response"的predict.glm中,您可以按概率级别报告影响。
发布于 2014-04-11 10:04:40
在阐述rawr的评论时,这是一个自由度问题。例如,考虑一个模型
lm(height ~ sex, data = dat)其中,性别变量是具有男性和女性水平的因子。模型的输出将显示一个截距和一个系数-如果男性是基准面,则只显示女性系数。这是因为男性效应被截获。
显示相同模型的另一种方法是
lm(height ~ 0 + sex, data = dat)这将给出一个具有男性和女性系数的模型,但没有截距。
https://stackoverflow.com/questions/23001718
复制相似问题