【Excel系列】Excel数据分析:方差分析

单因素方差分析

12.1 单因素方差分析基本理论

(1)单因素方差分析的概念

单因素方差分析,是指对单因素试验结果进行分析,检验因素对试验结果有无显著性影响的方法。单因素方差分析是两个样本平均数比较的引伸,它是用来检验多个平均数之间的差异,从而确定因素对试验结果有无显著性影响的一种统计方法。。

因素:影响研究对象的某一指标、变量。 水平:因素变化的各种状态或因素变化所分的等级或组别。 单因素试验:考虑的因素只有一个的试验叫单因素试验。

例如,将抗生素注入人体会产生抗生素与血浆蛋白质结合的现象,以致减少了药效。下表列出了5种常用的抗生素注入到牛的体内时,抗生素与血浆蛋白质结合的百分比。现需要在显著性水平α = 0.05下检验这些百分比的均值有无显著的差异。设各总体服从正态分布,且方差相同。

表 12-1 试验数据

在这里,试验的指标是抗生素与血浆蛋白质结合的百分比,抗生素为因素,不同的5种抗生素就是这个因素的五个不同的水平。假定除抗生素这一因素外,其余的一切条件都相同。这就是单因素试验。试验的目的是要考察这些抗生素与血浆蛋白质结合的百分比的均值有无显著的差异。即考察抗生素这一因素对这些百分比有无显著影响。这就是一个典型的单因素试验的方差分析问题。

(2)单因素方差分析的基本思想

(3)检验所需的统计量

(4)假设检验的拒绝域

表 12-2 方差分析表

12.2 单因素方差分析工具使用

如果只有两个样本,则可使用工作表函数 TTEST。如果有两个以上的样本,则没有使用方便的 TTEST 归纳,可改为调用“单因素方差分析”模型。

(1)建立一张工作表,输入数据:

图 12-1 输入数据

(2)从“数据”选项卡选择“数据分析”,从“数据分析”列表框中选择“方差分析:单因素”,单击“确定”弹出单因素方差分析对话框。

图 12-2 数据分析工具对话框

图 12-3 单因素方差分析对话框

图 12-4 方差分析输出结果

无重复双因素分析

13.1 无重复双因素方差分析原理简介

(1)无重复双因素方差分析的概念

在许多实际问题中,往往要同时考虑两个因素对试验指标的影响. 例如,要同时考虑工人的技术和机器对产品质量是否有显著影响. 这里涉及到工人的技术和机器这样两个因素. 多因素方差分析与单因素方差分析的基本思想是一致的,不同之处就在于各因素不但对试验指标起作用,而且各因素不同水平的搭配也对试验指标起作用. 统计学上把多因素不同水平的搭配对试验指标的影响称为交互作用. 交互作用的效应只有在有重复的试验中才能分析出来.

对于双因素试验的方差分析,我们分为无重复和可重复试验两种情况来讨论. 对无重复试验只需要检验两个因素对试验结果有无显著影响;而对等重复试验还要考察两个因素的交互作用对试验结果有无显著影响。

设因素A,B作用于试验指标。因素Ar个水平A1,A2,…,Ar,因素Bs个水平B1,B2,…,Bs. 对因素AB的每一个水平的一对组合(Ai,Bj),(i=1,2, ,r,j=1,2, ,s)只进行一次实验,得到rs个试验结果Xij。列于下表中。

表 13-1 试验数据表

(2)无重复双因素方差分析的假设前提

(3)偏差平方和及其分解

类似于单因素方差分析,需要将总偏差平方和进行分解. 记

(4)检验方法

表 13-2 方差无重复试验双因素方差分析表

13.2 无重复双因素方差分析工具使用

例:4名工人(B1,B2,B3,B4)操作机器(A1,A2,A3)各一天,其日产量如表,问不同工人和同机器对日产量是否有显著影响(α=0.05)。

Excel操作:

(1)在一张Excel表格中输入如下数据

图 13-1 输入实验数据

(2)从“数据”选项卡选择“数据分析”,从“数据分析”列表框中选择“方差分析:无重复双因素”。

图 13-2 数据分析对话框

(3)单击“确定”弹出“方差分析:无重复双因素分析”对话框。

图 13-3 无秤星双因素方差分析对话框

(4)设置完对话框后,单击“确定”,得方差分析表。

图 13-4 结果输出

当P值大于显著水平时,就将显著,否则不显著。可见,若显著水平为0.05,行(A因素)效应显著,而列效应不显著。

可重复双因素分析

14.1 可重复双因素方差分析原理简介

(1)可重复双因素方差分析的概念

可重复双因素方差分析与无重复双因素方差分析的区别在于考虑交互作用。因素A与因素B每一对组合(Ai,Bj)(i=1,…,r,j=1…,s)要进行t(t≥2)次实验(也称为等重复双因素试验)。实验结果为Xijk。

例:某问题因素A有4个水平,因素B有3个水平,每一组合下做3次试验,试验结果如下:

表 14-1 试验数据表

试进行等重复双因素方差分析

(2)双因素方差分析的假设前提

可重复双因素方差分析的假设前提与无重复双因素方差分析相同。

(3)偏差平方和及其分解

(4)检验方法

可得如下方差分析表:

表 14-2 有秤星试验双因素方差分析表

14.2 可重复双因素方差分析工具的使用

承上例,Excel操作如下:

(1)打开一张新的EXCEL表,输入如下数据。

图 14-1 试验数据

(2)从“数据”选项卡选择“数据分析”,选择“方差分析:可重复双因素分析”调出可重复双因素方差分析

图 14-2 可重复双因素方差分析对话框

图中“输入区域”应包括因素名称等全部单元格区域;每一样本的行数为各因素每一水平搭配实验的次数“k”

(3)单击“确定”按钮,得到方差分析表。

图 14-3 结果输出

这里的样本为B因素效应,列为A样本效应,交互为A×B效应,内部为误差。我们关心的是P值(P-value),即截尾概率。当P值<α时,就可以说在显著水平α下效应显著。由表可见,B因素效应显著,交互作用效应显著,而A因素效应不显著。也可以由F统计量和F临界值进行判断:当F>F crit时,效应显著,否则不显著。

原文发布于微信公众号 - 大数据杂谈(BigData07)

原文发表时间:2017-07-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏IT派

用Python对用户评论典型意见进行数据挖掘

用户体验的工作可以说是用户需求和用户认知的分析。而消费者的声音是其中很重要的一环,它包含了用户对产品的评论,不管是好的坏的,都将对我们产品的改进和迭代有帮助。另...

19330
来自专栏AI科技评论

视频 | 自适应神经网络模拟运动轨迹,四足动物旋转跳跃栩栩如生

AI科技评论按:这里是,雷锋字幕组编译的 SIGGRAPH 2018系列,带你了解 Computer Vision 领域的最新研究成果。

15040
来自专栏新智元

AI摩尔定律继续超速?2028年,1美元能买200GFLOPS计算力!

【新智元导读】摩尔定律不断给人这种感觉:就是在此时此刻,我们正处于人工智能行业独一无二的大变革时期。然而,只要计算力的增长继续遵循指数级的价格-性能曲线,那么未...

11930
来自专栏EAWorld

人体运动轨迹的人工智能动画模拟

作为博客文章的处女秀,我将简要介绍一下我的研究领域。从现在起,我将之命名为“人体运动轨迹的人工智能动画模拟”(Physically-Based Animatio...

36040
来自专栏新智元

超酷的神经网络合成动物运动动画,解救动画师!(代码开源+视频)

68530
来自专栏机器之心

资源 | PyTorch第一版中文文档发布

机器之心报道 参与:黄小天 近日,使用 GPU 和 CPU 优化的深度学习张量库 PyTorch 上线了其第一版中文文档,内容涵盖介绍、说明、Package 参...

38560
来自专栏量子位

马库斯:DeepMind新出的机器心智网络不错,但有误导性

原作 Gary Marcus Root 编译 量子位 报道 | 公众号 QbitAI DeepMind最新出的论文Machine Theory of Mind还...

37060
来自专栏量子位

这个变态级难度的小游戏,只为证明:人类的聪明没那么简单

先别说话。 给自己几分钟的时间,玩一下这个游戏,看看是否能顺利通关。几分钟就好,别为难自己。因为普通人通关平均需要20分钟。 游戏地址:https://high...

36760
来自专栏IT派

40行Python代码实现“旅行者困境“演化过程

在纳米比亚的 PyCon 会议上,我发表了一篇名为 《使用 Python 解决“升级版的剪刀石头布”》(Rock, Paper, Scissors, Lizar...

18010
来自专栏AI科技评论

英特尔IDF PPT揭秘: 高性能计算和深度学习发展的趋势

进行深度学习的训练向来不被认为是CPU的强项,但是以CPU研发见长的英特尔并不甘心屈服于这个定位,在过去的几年里,英特尔及其合作伙伴一直在探索用CPU来进行快速...

38140

扫码关注云+社区

领取腾讯云代金券