前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据分析 | 工作中无法避免的参数假设检验

数据分析 | 工作中无法避免的参数假设检验

作者头像
1480
发布2020-02-19 13:31:20
1.6K0
发布2020-02-19 13:31:20
举报
文章被收录于专栏:数据分析1480数据分析1480

置信概率可以用来评估区间估计的什么性能? 当然是可靠性了,P值反映的是显著性。 有了参数估计,就会有对应的假设检验;知识结构如下:

01. 知识准备

假设检验显著性水平的两种理解:

1. 显著性水平:通过小概率准则来理解,在假设检验时先确定一个小概率标准----显著性水平;用

表示;凡出现概率小于显著性水平的事件称小概率事件;

2. 通过两类错误理解:

为拒绝域面积

原假设与备用假设

H0:原假设,零假设----零是相关系数为0,说明两个变量无关系

H1:备用假设

如何设置原假设:

1)H0与H1是完备事件组,相互对立,有且只有一个成立 2)在确立假设时,先确定备设H1,然后再确定H0,且保证“=”总在H0上 3)原H0一般是需要反驳的,而H1是需要支持的

4)假设检验只提供原假设不利证据

即使“假设”设置严密,检验方法“精确”;假设检验始终是建立在一定概率基础上的,所以我们常会犯两类错误;

第一类:原H0是真,却拒绝原假设;犯

类错误 第二类:原H0是假,却不拒绝原假设;犯

类错误

通常只能犯两种错误中的一种,且

增加,

减少

通常,

类错误是可控的,先设法降低第一类错误概率

什么是双尾检验,单尾检验?

1) 当H0采用等号,而H1采用不等号,双尾检验

2)当H0是有方向性的,单尾检验

P值

当原假设为真时,比所得到的样本观察,结果更极端的结果会出现的概率。

如果P值很小,我们拒绝原假设的理由越充分。

P的意义不表示两组差别大小,p反映两组差别有无统计学意义,显著性检验只是统计结论,判断差别还需要专业知识。

T检验与U检验

当样本容量n够大,样本观察值符合正态分布,可采用U检验 当样本容量n较小,若观测值符合正态分布,可采用T型检验

02. 一个总体参数假设检验

1. 大样本总体均值的检验方法—Z检验与t检验

大样本总体均值的检验方法,在大样本情况下,无论总体服从什么分布,样本均值服从正态分布。

接下来用P值检验:

同样地,还有小样本情况下正态总体均值的检验;检测与大样本总体均值检测一样。

以往的教科书区分大样本,小样本,是因为大样本的统计量用正态分布,小样本用t分布。那是依赖查表时代的产物;如今,计算机软件中,t分布随机变量在大样本时自然就近似正态分布了。---统计学家吴喜之

2. 总体比例的检验

对于总体比例的检验,通常是在大样本条件下进行的,而小样本得到的结果是极不稳定的;所以对总体比例进行检验时,通常用正态分布来确定临界值,即采用Z统计量,Z统计量计算公式:

P为样本比例;

为总体比例

3. 总体方差

的检验

不论样本容量是大是小,都要求总体服从正态分布;总体方差检验使用

.

举例如下:

一个可以接受的罐装量方差

,随机选取20杯饮料进行测试,其样本方差7.63ml,试以0.1的显著性水平,判断样本是否方差过大?

03. 两个总体参数假设检验

1. 两个总体均值之差的检验

场景:比较一个学校的重点班和普通班英语平均成绩是否具有显著差异;比较改善后的平均产量与改善前的平均产量是否具备显著差异,这些问题都属于两个样本均值之差的检验。

2. 独立样本中大样本前提下的总体均值之差检验

贾俊平 | 统计学 第七版 第八章

说明:大样本前提下,两样本均值之差的抽样分布近似服从正态分布

Excel操作:加载数据,选择“数据分析”功能--Z检验双样本均值差检验

选择了99个样本,算作大样本检验:

变量输入:变量1和变量2数据分别输入两列或两行; 假设平均差:如果检验两总体均值是否相等,输入0;如果检验两总体均值差是否等于某个常数,输入常数。 已知方差:输入已知的总体方差或大样本的方差。 显著水平:一般为0.1、0.05或0.01,根据需要填写

从输出结果来看,不仅有单侧z检验和双侧z检验结果:

z:计算得出的z值; P(Z<=z)单尾与z单尾临界:已知显著水平下的单尾临界z值和P值;

P(Z<=z)双尾与z双尾临界:已知显著水平下的双尾临界z值和P值;

分析结论:以假设平均差为0举例

利用检验统计量z :|z|=0.39<z 双尾临界值,说明在0.05显著水平下,不能拒绝H0,两样本均值之差等于0.

利用P值:1.95>0.05,不能拒绝H0;两样本均值之差等于0.

3. 独立样本中小样本前提下总体均值之差检验(*可不掌握)

独立样本提供的数据值可能因为样本个体在其它因素方面的“不同质”而对它们所提供的有关总体均值的信息产生干扰,为有效排除样本个体之间这些“额外”差异带来多误差,可以考虑采用匹配样本。

04. Excel数据分析总结

excel提供的数据分析功能!

对两个正态总体样本均值之差进行检验:excel提供了z检验-双样本平均差检验 对两个正态总体方差进行比较需要用方差比:excel提供了F检验-双样本方差检验

excel未提供单样本均值,比例,方差的检验,未提供双样本总体比例的检验!

End.

作者:求知鸟

来源:知乎

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-02-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据分析1480 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 大样本总体均值的检验方法—Z检验与t检验
  • 同样地,还有小样本情况下正态总体均值的检验;检测与大样本总体均值检测一样。
  • 2. 总体比例的检验
  • 3. 总体方差
  • 举例如下:
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档