我想知道一种用Python进行方差分析(协方差分析)的方法。这基本上是回归线的统计比较。我知道Python可以做方差分析,也可以做与Scipy.stats拟合的回归曲线。如果可能的话,我不知道如何把它们组合在一起才能得到一个有效的方差分析。
发布于 2010-06-30 07:18:54
ANCOVA可以通过回归来完成,在设计矩阵中使用虚拟变量来表示依赖于范畴变量的效果。
一个简单的示例是在线程/线程/aa31b08f3df1a69?hl=en使用来自scikits.statsmodels的OLS类。
设计矩阵xg的相关部分包括组号/标签,x1是连续解释变量。
>>> dummy = (xg[:,None] == np.unique(xg)).astype(float)
>>> X = np.c_[x1, dummy[:,1:], np.ones(nsample)]估计模型
>>> res2 = sm.OLS(y, X).fit()
>>> print res2.params
[ 1.00901524 3.08466166 -2.84716135 9.94655423]
>>> print res2.bse
[ 0.07499873 0.71217506 1.16037215 0.38826843]
>>> prstd, iv_l, iv_u = wls_prediction_std(res2)“假设所有组都有相同的截距”
>>> R = [[0, 1, 0, 0],
... [0, 0, 1, 0]]
>>> print res2.f_test(R)
<F test: F=array([[ 91.69986847]]), p=[[ 8.90826383e-17]],
df_denom=46, df_num=2>强烈拒绝,因为拦截的差异很大。
更新(两年半后):
scikits.statsmodels已重命名为statsmodels
关于这个问题:
随着状态模型的最新发布,使用公式来指定分类效果和交互效果更为方便。statsmodels使用帕齐处理公式并创建设计矩阵。
更多信息可在https://stackoverflow.com/a/19495920/333700中的statsmodels文档链接中获得。
https://stackoverflow.com/questions/2916760
复制相似问题