我在SAS和R中运行了相同的概率回归,虽然我的系数估计(本质上)是相等的,但报告的测试统计数据是不同的。具体地说,SAS将测试统计数据报告为t统计数据,而R将测试统计数据报告为z统计数据。
我检查了我的计量经济学文本,发现(几乎没有详细说明)它以t统计的形式报告概率结果。
哪种统计数据是合适的?为什么R不同于SAS?
下面是我的SAS代码:
proc qlim data=DavesData;
model y = x1 x2 x3/ discrete(d=probit);
run;
quit;
这是我的R代码:
> model.1 <- glm(y ~ x1 + x2 + x3, family=binomial(link="probit"))
> summary(model.1)
发布于 2010-09-16 16:10:21
只是回答一点-这是严重的离题,问题实际上应该结束-但t统计量和z统计量都没有意义。它们都是相关的,因为Z只是标准正态分布,T是一种经过调整的“接近正态”分布,它考虑到你的样本被限制在n种情况下。
现在,z和t统计量都为零假设提供了意义,即相应的系数等于零。用于该测试的系数的标准误差基于残差。使用link函数,您实际上可以将响应转换为使残差恢复正常的方式,而实际上残差表示观察到的和估计的比例之间的差异。由于这种转换,T统计量的自由度计算不再有用,因此R假设测试统计量的标准正态分布。
这两个结果是完全相等的,R只会给出稍微更尖锐的p值。这是一个有争议的问题,但如果你看一下比例差异测试,它们也总是使用标准正态近似(Z-test)完成的。
这让我回到了这一点,这两个值实际上都没有任何意义。如果你想知道一个变量是否对p值有显着的贡献,你可以使用卡方检验,如似然比检验(LR),得分检验或Wald检验。R只给你标准的似然比,SAS也给你另外两个。但这三个测试在本质上是等价的,如果它们有很大的不同,那么是时候重新查看您的数据了。
例如在R中:
anova(model.1,test="Chisq")
对于SAS :参见示例here以了解对比度、获取LR、Score或Wald测试的用法
https://stackoverflow.com/questions/3721431
复制相似问题