首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >北大@Coursera 医学统计学与SPSS软件 第三周 两组数值变量比较的假设检验

北大@Coursera 医学统计学与SPSS软件 第三周 两组数值变量比较的假设检验

作者头像
统计学家
发布2019-04-10 17:02:33
1K0
发布2019-04-10 17:02:33
举报

均数的抽样误差及总体均数的估计

一、均数的抽样误差

1.定义 在抽样研究中,由于抽样造成的样本均数与 总体均数之间的差异或者样本均数之间的差异,称 为均数的抽样误差(SamplingError,SE)。抽样误差是不可避免的,造成抽样误差的根本原因是个体变异的客观存在。

2.计算 抽样误差的大小,即标准误

3.性质 标准误与

标准差成正比,与样本含量的平方根成 反比。 在实际工作中,减小抽样误差的有效方法是增大样本含量。

二、t分布

1.定义 若从正态分布N(m, s2)总体中随机抽取样本含量 为n的样本,样本均数也服从正态分布

2.性质 一组与自由度n有关的曲线,随着n的增 大接近标准正态分布。

三、总体均数95%置信区间的估计

1.定义 根据样本均数计算出有(1-α)的把握包 含总体均数的一个数值范围,这个数值范围称为 总体均数的置信区间,该(1-α)称为置信度。 一般α取0.05,则置信度为95%,即估计总体均数 95%置信区间。

2.计算

假设检验的基本原理

小概率原理

检验水准:亦称为显著性水准(significance level),符号为α。α 是预先规定的概率值,它是“是否拒绝H0 的界限”。通常α取0.05。检验假设: H0:无效假设 H1:备择假设

三种研究设计类型的t检验

  • 单样本的t 检验
  • 基本原理此方法用于一个样本均数与已知总体均数m0的 比较。检验目的是推断对应的未知总体均数m是 否等于m0 ,其检验假设为: H0:m=m0 H1:m¹m0
  • 适用条件样本对应的总体服从正态分布。当数据偏离正态分布不是很严重时,t检验仍然适用。
  • 两个独立样本的t 检验
  • 基本原理

令两个独立的样本均数对应的总体均数为m1、m2, m1与m2是未知的。检验目的是推断m1与m2是否相 等,其检验假设为: H0:m1=m2 H1:m1¹m2

  1. 适用条件

正态性 两个样本对应的总体分别服从正态分布。 当数据偏离正态分布不是很严重时,t 检验仍然适用。

独立性 两个样本是相互独立的,无任何关联性。

方差齐性 两个样本对应的总体方差相等。

用 Levene方法检验是否满足方差齐性假定

注: 方差齐性是t 检验的重要假定。若违背了方差齐性 假定,则常用统计方法如下: (1)校正t 检验;(2)先变量变换,满足方差齐 性假定后再进行t 检验;(3)两个独立样本的秩和 检验。

  • 配对设计的t 检验
  • 基本原理

此方法常用于两种情况:①自身对照设计。对同一受试对象处理前后的比较。②配对设计。按照某些特征(如性别、年龄等)先将两个受试对象配成对子,再对同一对子中的两个个体分别给予处理;也可以把同一受试对象分成两部分,再分别给予两种不同处理,以比较两种处理是否有差异。以配对设计为例,令每一对子的两个观测变量为X、 Y,差值d=X-Y,d的样本均数对应的总体均数是未知的。检验目的是推断md是否等于0,其检验假设为: H0:md=0 H1:md ¹ 0

  1. 适用条件

正态性:差值d对应的总体服从正态分布。当数据偏离正态分布不是很严重时,t 检验仍然适用。

假设检验的注意事项

一、假设检验的目的推断两个总体均数是否相等。

二、假设检验方法的选择根据不同的研究设计类型,选择不同的方法。

三、 Z检验的应用实际工作中,Z检验常用于“σ未知,n较大”的情况; 此情况下,Z检验是t 检验的近似。

四、t 检验与置信区间之间具有等价性

单样本的t 检验:若接受H0,则样本值与已知总体均数差值的总体均数95%置信区间必包括0。

两个独立样本的t 检验:若接受H0,则两独立样本差值的总体均数95%置信区间必包括0。配对设计的t 检验:若接受H0,则配对差值的总体均数95%置信区间必包括0。

五、假设检验的P值不能反映总体均数差别的大小 P值越小,越有把握认为两总体均数不相等。

六、假设检验的结论具有概率性 H0原本正确, 但P£0.05,拒绝H0 :第一类错误a H0原本不正确,但P>0.05,不拒绝H0 :第二类错误ba为事先指定的检验水准,b未知。

七、功效(Power)的定义又称为检验效能或把握度,是指当两总体确实有差别时,按规定的检验水准α,能够发现两总体间差别的能力,即1- b。实际工作中,要保证比较高的功效,很重要的条件是具有足够的样本含量。

八、专业意义与统计学意义上的差别是不同的差别有统计学意义,并不意味着一定有专业意义。反之,即便差别无统计学意义,但也可能具有专业意义。

九、参数统计与非参数统计

对样本所属的已知分布总体的未知参数进行估计或假设检验,这类统计推断方法称为参数统计。t 检验属于参数统计方法。非参数检验并非比较总体参数,而是直接比较分布,是一种不拘于总体分布的统计方法,它是通过将样本实际数据排序编秩后,对秩次进行比较。若不满足参数检验条件,则适宜用非参数检验。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-04-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习与统计学 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档