4.2.2二分类结局变量(Binary outcome)
二分类结局的两阶段估计方法和连续型结局类似,只是其中第二阶段(X–Y)回归使用对数线性或逻辑回归模型。
4.2.3 调整的两阶段方法(Adjusted two-stage method)
调整的两阶段方法其实就是将第一阶段回归(X-G)的残差和暴露的拟合值一起作为自变量和结局进行第二阶段回归,这也被称为两阶段残差包含(2SRI)法。如果我们在第一阶段的回归中得到拟合值X^ | G和残差R^ | G = X - X^ |G,则经过调整的两阶段估计值将分别来自第二阶段在X^| G和R^ | G(或等效于X和R^ | G)上对Y进行回归。
第一阶段回归的残差包含有关混杂因素的信息,那么将残差项纳入第二阶段的回归模型则可以较好控制混杂因素的干扰。如果第二阶段回归是线性的,并且结局是连续型变量,则将第一阶段的残差包括在第二阶段回归模型中不会改变估计值,这是因为第一阶段的残差与拟合值是正交的(两者不相关)。如果结局是二分类变量,则将这些残差包含在第二阶段逻辑回归模型中意味着IV估计将是矫正这些残差后的结果。在数值上,它使IV估计更接近条件对数比值比(conditional log odds ratio),也即对数线性模型中的参数β1。因此,当第二阶段回归是逻辑回归时,一些研究者建议使用调整后的两阶段方法,这主要是因为它比未调整的两阶段方法具有较小的偏差。在特定的数学模型选择下,调整后的两阶段估计与参数β1一致。
然而,该数学模型是不符合实际的,并且通常调整后的两阶段估计对该参数有偏差。此外,当混杂因素未知时(在IV分析中十分常见),我们不清楚第一阶段残差代表的是什么变量,因此我们也无法知道在第二阶段回归中我们矫正的到底是什么变量。我们无法确定调整后的两阶段估计方法估计的是何种比值。因此,我们不建议在两阶段方法中对第一阶段的残差进行调整。