专栏首页机器学习与统计学北大@Coursera 医学统计学与SPSS软件 第四周多组数值变量比较的假设检验

北大@Coursera 医学统计学与SPSS软件 第四周多组数值变量比较的假设检验

方差分析的基本思想

一、检验目的

多组数值变量比较的假设检验常用方差分析(Analysis of Variance,简称为ANOVA)。检验目的是推断多个总体均数是否相等。

二、离均差平方和的分解

总变异三组所有人的载脂蛋白测定值大小不等,此变

异称为总变异。用总离均差平方和SS总表示。

SS总 =åå( Xij-`X)2 n总=N -1

组间变异三组人的载脂蛋白样本均数也大小不等,它们之间的变异称为组间变异。用组间离均差平方和SS组间表示。

SS组间 =åni(Xi- `X)2 n总=N -1

MS组间= SS组间/ n组间

组内变异三组人内部的载脂蛋白也大小不等,这种处理组内部的变异称为组内变异。用组内离均差平方和SS组内表示。

SS总 =åå( Xij-`Xi)2 n总=N -k

可以证明以上三种变异有如下关系: SS总=SS组间+SS组内n总=n组间+n组内 总变异可以分解为组间变异和组内变异两个部分, 总自由度也分解为组间自由度和组内自由度

三、检验统计量F

F= MS组间/ MS组内

在H0成立时,F值在理论上应等于1。反之,若 H1成立时,F值也将明显大于1。

四、总结方差分析的基本思想就是根据研究设计的类型及研究目的,将总变异分解成两个或多个部分。除随机误差外,其余部分的变异可由某因素的作用来解释,通过比较可能由某因素所致的变异与随机误差的均方(如组内变异),从而了解该因素有无作用。

完全随机设计的单因素方差分析

  • 基本原理

单因素方差分析适用于只有一个处理因素的完全随机设计,这个处理因素可以有两个或者两个以上的处理水平。

单因素方差分析的总变异可以分解为组间变异和组内变异两个部分,总自由度分解为相应的两个部分: SS总=SS组间+SS组内n总=n组间+n组内 若检验处理组间是否有差别,检验统计量F为: F= MS组间/ MS组内

  • 均数之间的多重比较

方差分析的F检验,当P £ 0.05,按a=0.05,拒绝H0,接受H1,故可以认为各组总体均数不等或不全相等。这并不意味着任何两组总体均数都有差别。要想确定哪些组间有差别,必要时应该进一步作均数之间的多重比较在处理组数大于2时,均数之间的多重比较若仍用t 检验对任意两两均数之间进行比较,则会增大犯第一类错误的概率。因此,均数之间的多重比较不宜再用前述t检验方法

探索性研究中均数之间多重比较的方法:多重比较(Multiple Comparisons)如LSD、 Bonferroni、Dunnett方法等。亚组同质性检验(Homogeneous Subsets)如SNK、 Tukey HSD方法等。

  • 单因素方差分析的适用条件各处理组样本来自正态总体(对于正态性要求不严格); 各样本是相互独立的随机样本; 各处理组的总体方差相等,即方差齐性。用Levene 方法检验是否满足方差齐性假定

随机区组设计的两因素方差分析

随机区组设计在医学科研中比较常见,例如在实验研究中,将动物按窝别配伍,再随机分配到各个处理组;在观察性研究中按年龄、性别或地区配伍来抽取和组成研究因素的各个水平组等。

随机区组设计方差分析的总变异可以分解为处理组间变异、区组间变异和误差三个部分: SS总=SS处理+SS区组+SS误差总自由度也可以分解为相应的三个部分:n总=n处理+n区组+n误差

方差分析的注意事项

一、方差分析与t 检验的联系两个独立样本均数比较的t检验,可以用单因素方差分析代替;配对设计的t检验,可以用随机区组设计的两因素方差分析代替。两者的计算结果有如下关系: F = t2

二、两种类型的方差分析比较由于区组内的个体特征比较一致,减少了个体间差异对研究结果的影响;与完全随机设计的单因素方差分析相比,随机区组设计更容易检验出处理组间的差别,提高了统计效率

三、参数统计与非参数统计

(一)Kruskal-Wallis秩和检验

(二)Friedman秩和检验

SPSS应用

本文分享自微信公众号 - 机器学习与统计学(tjxj666)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2015-04-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 一文看完《统计学习方法》所有知识点

    红色的是牛顿法的迭代路径,绿色的是梯度下降法的迭代路径.牛顿法起始点不能离极小点太远,否则很可能不会拟合.

    统计学家
  • 使用scikit-learn进行建模预测和评估操作_泰坦尼克号获救预测

    统计学家
  • R in action读书笔记(2)-第五章:高级数据管理

     语句(statement)是一条单独的R语句或一组复合语句(包含在花括号{ } 中的一组R语

    统计学家
  • PHP函数

    可变函数类似于可变变量,通过在变量名后面添加一对括号,PHP就会自动寻找与变量名的值相同的函数,并且执行该函数

    白胡杨同学
  • 注册+登陆(增删改查)PHP+MYSQL+SESSION。。。+(核心解释在我的博客内,切记,一定要看!!!!!!!!!)

    用户7873631
  • Gentry Lane:VR内容要拒绝肤浅

    镁客网
  • PHP+MYSQL的使用(注册页面)3

    第二核心是判断他是否注册成功的关键在于他是否密码和确认密码的一致性,如果一致,则成功,否则就重新输入把 //这里在于告诉他你的第二次输入的密码与第一次输入的密...

    用户7873631
  • [编程经验] Elasticsearch 初识

    Elasticsearch 中文网站: https://www.elastic.co/cn/ 官网对Elasticsearch 介绍的第一句话: Elastic...

    用户1622570
  • Oracle Advanced Support系统SQL注入漏洞挖掘经验分享

    Oracle Advanced Support系统SQL注入漏洞分析 一年多前我在客户的一个外部环境中执行渗透测试,任何外部环境渗透测试的重要步骤之一就是挖掘出...

    FB客服
  • PHP算法 [杨辉三角的求解]

    版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u011415782/article/de...

    泥豆芽儿 MT

扫码关注云+社区

领取腾讯云代金券