专栏首页数据分析1480数据分析 | 工作中无法避免的参数假设检验

数据分析 | 工作中无法避免的参数假设检验

置信概率可以用来评估区间估计的什么性能? 当然是可靠性了,P值反映的是显著性。 有了参数估计,就会有对应的假设检验;知识结构如下:

01. 知识准备

假设检验显著性水平的两种理解:

1. 显著性水平:通过小概率准则来理解,在假设检验时先确定一个小概率标准----显著性水平;用

表示;凡出现概率小于显著性水平的事件称小概率事件;

2. 通过两类错误理解:

为拒绝域面积

原假设与备用假设

H0:原假设,零假设----零是相关系数为0,说明两个变量无关系

H1:备用假设

如何设置原假设:

1)H0与H1是完备事件组,相互对立,有且只有一个成立 2)在确立假设时,先确定备设H1,然后再确定H0,且保证“=”总在H0上 3)原H0一般是需要反驳的,而H1是需要支持的

4)假设检验只提供原假设不利证据

即使“假设”设置严密,检验方法“精确”;假设检验始终是建立在一定概率基础上的,所以我们常会犯两类错误;

第一类:原H0是真,却拒绝原假设;犯

类错误 第二类:原H0是假,却不拒绝原假设;犯

类错误

通常只能犯两种错误中的一种,且

增加,

减少

通常,

类错误是可控的,先设法降低第一类错误概率

什么是双尾检验,单尾检验?

1) 当H0采用等号,而H1采用不等号,双尾检验

2)当H0是有方向性的,单尾检验

P值

当原假设为真时,比所得到的样本观察,结果更极端的结果会出现的概率。

如果P值很小,我们拒绝原假设的理由越充分。

P的意义不表示两组差别大小,p反映两组差别有无统计学意义,显著性检验只是统计结论,判断差别还需要专业知识。

T检验与U检验

当样本容量n够大,样本观察值符合正态分布,可采用U检验 当样本容量n较小,若观测值符合正态分布,可采用T型检验

02. 一个总体参数假设检验

1. 大样本总体均值的检验方法—Z检验与t检验

大样本总体均值的检验方法,在大样本情况下,无论总体服从什么分布,样本均值服从正态分布。

接下来用P值检验:

同样地,还有小样本情况下正态总体均值的检验;检测与大样本总体均值检测一样。

以往的教科书区分大样本,小样本,是因为大样本的统计量用正态分布,小样本用t分布。那是依赖查表时代的产物;如今,计算机软件中,t分布随机变量在大样本时自然就近似正态分布了。---统计学家吴喜之

2. 总体比例的检验

对于总体比例的检验,通常是在大样本条件下进行的,而小样本得到的结果是极不稳定的;所以对总体比例进行检验时,通常用正态分布来确定临界值,即采用Z统计量,Z统计量计算公式:

P为样本比例;

为总体比例

3. 总体方差

的检验

不论样本容量是大是小,都要求总体服从正态分布;总体方差检验使用

.

举例如下:

一个可以接受的罐装量方差

,随机选取20杯饮料进行测试,其样本方差7.63ml,试以0.1的显著性水平,判断样本是否方差过大?

03. 两个总体参数假设检验

1. 两个总体均值之差的检验

场景:比较一个学校的重点班和普通班英语平均成绩是否具有显著差异;比较改善后的平均产量与改善前的平均产量是否具备显著差异,这些问题都属于两个样本均值之差的检验。

2. 独立样本中大样本前提下的总体均值之差检验

贾俊平 | 统计学 第七版 第八章

说明:大样本前提下,两样本均值之差的抽样分布近似服从正态分布

Excel操作:加载数据,选择“数据分析”功能--Z检验双样本均值差检验

选择了99个样本,算作大样本检验:

变量输入:变量1和变量2数据分别输入两列或两行; 假设平均差:如果检验两总体均值是否相等,输入0;如果检验两总体均值差是否等于某个常数,输入常数。 已知方差:输入已知的总体方差或大样本的方差。 显著水平:一般为0.1、0.05或0.01,根据需要填写

从输出结果来看,不仅有单侧z检验和双侧z检验结果:

z:计算得出的z值; P(Z<=z)单尾与z单尾临界:已知显著水平下的单尾临界z值和P值;

P(Z<=z)双尾与z双尾临界:已知显著水平下的双尾临界z值和P值;

分析结论:以假设平均差为0举例

利用检验统计量z :|z|=0.39<z 双尾临界值,说明在0.05显著水平下,不能拒绝H0,两样本均值之差等于0.

利用P值:1.95>0.05,不能拒绝H0;两样本均值之差等于0.

3. 独立样本中小样本前提下总体均值之差检验(*可不掌握)

独立样本提供的数据值可能因为样本个体在其它因素方面的“不同质”而对它们所提供的有关总体均值的信息产生干扰,为有效排除样本个体之间这些“额外”差异带来多误差,可以考虑采用匹配样本。

04. Excel数据分析总结

excel提供的数据分析功能!

对两个正态总体样本均值之差进行检验:excel提供了z检验-双样本平均差检验 对两个正态总体方差进行比较需要用方差比:excel提供了F检验-双样本方差检验

excel未提供单样本均值,比例,方差的检验,未提供双样本总体比例的检验!

End.

作者:求知鸟

来源:知乎

本文分享自微信公众号 - 数据分析1480(lsxxx2011)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-02-02

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • t检验的几种应用案例

    在平时的工作或学习中可能会碰到统计学中的假设检验问题,如常见的卡方检验、t检验以及正态性检验等,而这些检验的目的都是为了论证某个设想,并通过统计学的方法做解释。...

    1480
  • 数据分析师必备的基本统计学知识

    数据分析师,无疑是数据时代最耀眼的职业之一,统计学,又是数据分析师必备的基础知识。

    1480
  • 超全干货 | 整理了一套常用的数据分析方法汇总!

    描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析、离中趋势分...

    1480
  • 北大@Coursera 医学统计学与SPSS软件 第五周 分类变量比较的假设检验

    一般情况下,由于我们研究的是样本,p未知,所以常 用p代替p,得到率的标准误的估计值:

    统计学家
  • 统计学_显著性检验综述

    比如研究血型与性格是否独立,如果性格a的血型比例与性格b的血型比例相同,那么统计上独立。

    用户1147754
  • 2. 两独立样本非参数检验 | 非参数检验汇总

    飞扬 / 撰写 整理 数说君 / 编辑 ---- 1. 关于非参数检验 上一文(1. 单样本非参数检验 | 非参数检验汇总)中已经说过,相比参数检验,非参数检验...

    数说君
  • 卡方分布分析与应用

    卡方检验(chi-square,记为χ2\chi^2检验)是统计学中常用来计数数据分析的方法,对于总体的分布不作任何假设,因此它属于非参数检验法中的一种。本博文...

    锦小年
  • LVS DR模式搭建, keepalived + LVS

    叶瑾
  • [三] java虚拟机 JVM字节码 指令集 bytecode 操作码 指令分类用法 助记符

    计算机指令就是指挥机器工作的指示和命令,程序就是一系列按一定顺序排列的指令,执行程序的过程就是计算机的工作过程。

    noteless
  • 干货分享--统计学知识大梳理(第三部分-最终篇)

    现实生活中,总体的数量如果过于庞大我们无法获取总体中每个数据的数值,进行对总体的特征提取进而完成分析工作。那么接下来就用到了本章节的知识。

    1480

扫码关注云+社区

领取腾讯云代金券