今天跟大家分享excel数据分析工具库系列三——回归分析!
主要内容有:
相关系数
协方差矩阵
回归
相关系数:
原数据区域是我用randbetween函数生成的随机数:
打开数据分析——相关系数,在弹出菜单中选中要求解相关系数的变量区域,如果区域内有标题行且已经选中则要勾选标题位于第一行。然后勾选逐列,输出位置,确定。
从输出的相关系数矩阵中可以看出,X1与X2之间相关关系并不明显,而X2、X3之间存在中度负相关关系。
协方差:
下面是协方差矩阵,再次点击数据分析工具,在下拉列表中调出协方差,参数设置与上述相关系数一模一样,设置完之后点击确定,就可以输出三变量之间的协方差矩阵。
从协方差矩阵输出结果上来看,与相关系数的结果保持一致,其中对角线上的协方差值是三个变量各自的方差值,X1与X3之间的相关关系最弱,其协方差仅为-32.06,符号为负,其次是X1与X2协方差为-109.1,最大的为X2与X3之间。协方差阵与三者之间的相关关系矩阵对应关系一致。
回归:
调出回归菜单:
将因变量区域输入Y值输入区域,自变量区域输入X值输入区域(多个自变量就同时选中多个区域),如果所选区域包含标题行,则勾选标志选项,否则忽略。(常熟为零输出无截距回归,一般很少用。)
在输出选项中设置输出位置,最后是输出结果选项,残差选项中包含残差、残差图、标准残差,线性拟合图。以及正态概率图,我们全部选中,然后确定看下输出结果。
回归的输出结果中给出了很多信息;
其中列表形式给出的主要有:
回归统计:Multiple R、R Square、Adjusted R、标准误差以及观测值;
方差分析表:
自由度(df),回归平方和、残差平方和以及总平方和及对应均方差,F统计量和相应水平的显著性(本例为0.109725<0.05,接受原假设:X1、X2系数都等于0)
回归系数表:
包含常数项、X1、X2、X3四个变量的参数估计值、标准误、T检验值及对应P值,还有对应的每个95%置信区间的上下限值。(看来三个变量的都不显著,本来嘛,随机生成的数据都显著了才不正常呢)。
残差表及Y值的百分比排位。
最后是图表输出:(包含Y值与X1、X2、X3的线性关系图、以及X1、X2、X3与残差的关系图和正太概率图(对应百分比排位表))。
excel的回归结果所有能输出的信息就这些,当然作为非专业数据统计软件,很多高级的检验方法与修正过程都没有相应的内置程序,只能手动计算变量,不过还是能够给我们的数据分析工作带来一些便利!