我正在使用R
和XLStat
软件。我已经进行了单向ANOVA
(我的分类变量是3模态(1,2,3),我的响应变量是1-10尺度的定量变量)。
我已经对R和XLStat进行了方差分析,F- fisher,p值,系数估计,t值,std error…的输出是完全一样的。
但是,XLstat提供了一个额外的输出:标准化系数(称为too beta系数)。首先,我很惊讶,因为我不认为我们可以计算分类变量的β系数,根据我读的参考书目,它没有任何意义。
总之,我试着用R来找出这些系数,这要归功于我找到的唯一公式:beta = estimate * sd(x)/sd(y)
。sd(x)是分类变量的标准差(为了计算sd(x),它会自动转换为数值变量,以计算sd(X),这似乎是合乎逻辑的),sd(y)是我的响应变量的标准差。
我使用R获得的第一个测试版与XLstat中的相同,但第二个和第三个不同。考虑到第一个变量与R和XLStat相同,我认为Xlstat也将类别变量转换为数值变量(这是没有意义的,但这不是问题所在)。此外,我对Statistica进行了方差分析,以查看XLStat是否有任何错误,但其β系数的输出与Xlstat…相同
所以,我的问题是:用单因素方差得到β系数的公式是什么?
然后,我想问你关于分类变量的这些beta系数的相关性。根据我的想法和我读到的出版物,它没有任何意义…
R和Xlstat中的ps对比度为sum(ai)=0。对于β系数,XLStat删除截距。我想这个事实可能很重要,但我不知道怎么回事
发布于 2016-04-14 20:14:37
对于方差分析,从度量系数中获得β系数的公式与线性回归的公式相同。系数没有合理的解释(对于分类变量),但标准化系数在比较不同度量的IVs的相对效果时很有用。
在R中,要么使用scale()将数据转换为z分数,然后再拟合模型,要么使用lm.beta()而不是lm()。
目前还不清楚为什么你会用XLStat得到不同的β系数,但如果这不是一个错误,它可能与自由度有关。This example将R中的lm.beta()函数与SAS进行比较,并获得相同的系数。
https://stackoverflow.com/questions/36620837
复制相似问题