首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >理解logistic回归R的系数

理解logistic回归R的系数
EN

Stack Overflow用户
提问于 2014-04-11 08:58:01
回答 2查看 145关注 0票数 0

这个问题是关于使用R来理解逻辑回归输出的

以下是我的示例数据框:

代码语言:javascript
运行
复制
    Drugpairs             AdverseEvent  Y    N
1   Rebetol + Pegintron       Nausea   29 1006
2   Rebetol + Pegintron      Anaemia   21 1014
3   Rebetol + Pegintron     Vomiting   14 1021
4   Ribavirin + Pegasys       Nausea    5  238
5   Ribavirin + Pegasys      Anaemia   12  231
6   Ribavirin + Pegasys     Vomiting    1  242
7 Ribavirin + Pegintron       Nausea   15  479
8 Ribavirin + Pegintron      Anaemia    7  487
9 Ribavirin + Pegintron     Vomiting    9  485

这基本上描述了特定药物对引起医学不良事件的次数。(Y=yes,N=no)。我使用以下命令在R中对此数据运行逻辑回归:

代码语言:javascript
运行
复制
mod.form="cbind(Y,N) ~ Drugpairs * AdverseEvent"
glmhepa.out=glm(mod.form, family=binomial(logit), data=hepatitis.df)

总结输出如下(仅显示系数表)

代码语言:javascript
运行
复制
                                                      Estimate Std. Error z value
(Intercept)                                          -3.8771     0.2205 -17.586
DrugpairsRibavirin + Pegasys                          0.9196     0.3691   2.491
DrugpairsRibavirin + Pegintron                       -0.3652     0.4399  -0.830
AdverseEventNausea                                    0.3307     0.2900   1.140
AdverseEventVomiting                                 -0.4123     0.3479  -1.185
DrugpairsRibavirin + Pegasys:AdverseEventNausea      -1.2360     0.6131  -2.016
DrugpairsRibavirin + Pegintron:AdverseEventNausea     0.4480     0.5457   0.821
DrugpairsRibavirin + Pegasys:AdverseEventVomiting    -2.1191     1.1013  -1.924
DrugpairsRibavirin + Pegintron:AdverseEventVomiting   0.6678     0.6157   1.085

我知道系数给出了概率赔率。然而,我很好奇,为什么AdverseEventAnaemea没有系数,为什么药物的任何组合和不良事件都没有系数?(最后4行是药物和不良事件的联合效应)

EN

回答 2

Stack Overflow用户

发布于 2014-04-11 10:48:54

离散变量的系数用于效果差异(也称为对比)。在hte级别向量的排序顺序中,基线被视为因子的最低级别,默认情况下按字母顺序排序。您可以更改排序,这将更改参考点和系数。对于像第二个模型中这样的相互作用项,你几乎永远不会发现查看系数本身是有用的。查看选定比较的预测效果会更好。

还有..。不要忘记,对于logistic模型,系数是在log0odds尺度上估计的。这将使predict的使用更有帮助,因为在使用type= "response"predict.glm中,您可以按概率级别报告影响。

票数 1
EN

Stack Overflow用户

发布于 2014-04-11 10:04:40

在阐述rawr的评论时,这是一个自由度问题。例如,考虑一个模型

代码语言:javascript
运行
复制
lm(height ~ sex, data = dat)

其中,性别变量是具有男性和女性水平的因子。模型的输出将显示一个截距和一个系数-如果男性是基准面,则只显示女性系数。这是因为男性效应被截获。

显示相同模型的另一种方法是

代码语言:javascript
运行
复制
lm(height ~ 0 + sex, data = dat)

这将给出一个具有男性和女性系数的模型,但没有截距。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/23001718

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档