首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >方差分析分类及SAS实现代码

方差分析分类及SAS实现代码

作者头像
许卉
发布2019-07-15 17:07:44
1.4K0
发布2019-07-15 17:07:44
举报
文章被收录于专栏:Data AnalystData AnalystData Analyst

方差分析为多样本检验,其核心为假设检验,此外,方差分析还可以做多重比较。方差分析本身是一种假设检验,同时也是一种模型,是回归模型的特例,回归模型为线性模型,方差分析为一般线性模型。实际应用中方差分析单独出现的可能性很小,一般在实验设计场景用的较多,项目中用方差分析去支撑项目的情景基本不会出现。

方差分析分类

1单因素方差分析

单因素方差分析用来研究一个因素的不同水平对观测所产生的影响,例如不同浇水量对家里绿萝生长的影响、不同的省的日照差异对人的寿命的影响、不同工作时长对人情绪的影响等等,以上皆可以使用单因素方差分析的方法进行探索分析。

下面即为其实现的SAS代码:

SYMBOL1 INTERPOL=BOX VALUE=CIRCLE;

PROC GPLOT DATA=XUHUI.DATA;

PLOT InCome * Edu/

VAXIS=AXIS1

HAXIS=AXIS2;

RUN; QUIT;

2单因子方差分析

单因子方差分析为只考虑一个分类型自变量影响的方差分析,例如全家便利店的选址对营业额是否有显著影响、不同学历对收入的影响是否显著等,这类问题都可以用单因子方差分析进行解决。

如下为其实现的SAS代码:

PROC GLM DATA=XUHUI.DATA ;

CLASS edu;

MODEL avg_exp= edu_class/

SS3

SS1

SS2

SS4

SOLUTION

SINGULAR=1E-07

;

lsmeans edu_class/pdiff;

RUN;

QUIT;

参数解释:

2.1 class参数告诉SAS软件edu变量是因子

2.2 SS形式表示离差平方和,离差平方和共有四种类型,一般默认的是第三种类型SS3,如果代码中不进行说明,则默认为SS3类型;

2.3 solution意为需在结果中显示参数估计结果

2.4 lsmeans表示多重比较,如果P值小于0.05则表示差异显著,或者可以通过图形来查看多重比较的结果,图形的解读方法为 如果图形中两个相减等于0则表示他们相等,然后求出两者均值差并做区间估计,如果区间包含0则有可能两者相等,即不显著,图中的对角线即所谓的0,图中各个斜线表示差的区间,如果对角线相交表示差异不显著,这张图很明显都没有与对角线虚线相交,如果相交则为红色,这里表示均显著。

2.5 singular表示奇异值。在统计软件的后台计算过程全部都是矩阵计算,singular默认值为1E-07

3多因子方差分析

多因子方差分析为考虑了多分类自变量影响的方差分析,这种分析会涉及到多因子交互的问题,例如收入是否受到学历与性别的显著影响,如下为有交叉项的双因素方差分析的SAS代码:

PROC GLM DATA=XUHUI.DATA PLOTS(ONLY)=INTPLOT;

CLASS edu_class gender;

MODEL avg_exp=edu_class gender edu_class*gender/

SS3

SOLUTION

SINGULAR=1E-07

;

RUN;

OUTPUT OUT=WORK.PRED PREDICTED=predicted_avg_exp ;

RUN;

QUIT;

下图中的残差图用于判断方差分析是否符合假定,即下面的第一个小图,这里明显出现了异方差,因此需要对因变量Y做一些变换处理,此处分布为正态分布,故需对Y进行对数变换,目的是将右偏的数据往正态状态拉一拉。如果分布是水平、U型与J型分布,对Y进行对数变换则不可行,需要进行Box-Cox变换。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-02-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Data Analyst 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 方差分析分类
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档