【Excel系列】Excel数据分析:假设检验

Excel数据分析工具库中假设检验含5个知识点:

  1. Z-检验:双样本均值差检验
  2. T-检验:平均值的成对二样本检验
  3. T-检验:双样本等方差假设
  4. T-检验:双样本异方差假设
  5. F检验:双样本方差检验

Z检验:双样本平均差检验

Z检验:双样本均值差检验概述

(1)假设条件

  • 两个样本是独立的样本
  • 正态总体或非正态总体大样本(样本量不小于30)
  • 两样本方差已知

(2)检验统计量及其分布、原假设及拒绝域

表 7‑1 z检验原假设、统计量及拒绝域

Z检验工具的使用

例:对如下两样本标准差均为10,试以0.05的显著水平检验两样本均值是否相等。

(1)在EXCEL中输入数据(图 7‑2 A:C列)。

(2)数据|分析|数据分析|z检验:双样本平均差检验,设置对话框如下。

图 7‑1 z检验:双样本平均差检验对话框

(2)单击“确定”生成分析报告。

图 7‑2 检验结果

本问题是检验两样本均值是否相等,故为双尾检验。由分析报告可见,截尾概率为0.001756<0.05,拒绝均值相等的原假设。

t检验:成对双样本平均值

t检验:成对双样本平均值检验概述

(1)假设条件

  • 两个总体配对差值构成的总体服从正态分布
  • 配对差是由总体差随机抽样得来的
  • 数据配对或匹配(重复测量(前/后))

(2)检验统计量及其分布、原假设及拒绝域

t检验:成对双样本平均值工具的应用

例:对如下成对数据检验X的均值是否大于Y的均值。

图 8‑1 数据资料

(1)数据|分析|数据分析|t检验:成对双样本平均值,弹出对话框并设置如下:

图 8‑2 平均值成对双样本检验对话框

(2)单击“确定”得检验结果报告:

图 8‑3 检验结果

图 8‑4 单边t检验拒绝域

t检验:双样本等方差假设

t检验:双样本等方差假设检验概述

(1)假设条件

  • 两个独立的小样本
  • 两总体都是正态总体
  • 两总体方差未知,但值相等

(2)检验统计量及其分布、原假设及拒绝域

表 9‑1 z检验原假设、统计量及拒绝域

t检验:双样本等方差假设工具的应用

例:对如下数据检验X与Y的均值,假设两总体方差相等,检验两总体均值是否存在显著差异(显著水平0.05)。

图 9‑1 数据资料

(1)数据|分析|数据分析|t检验:成对双样本平均值,弹出对话框并设置如下:

图 9‑2 单等方差检验对话框

(2)单击“确定”得检验结果报告:

报告结果显示,双尾P值0.84>0.05不拒绝原假设,即认为两总体均值无显著差异。

图 9‑3 检验结果报告

t检验:双样本异方差假设

t检验:双样本异方差假设检验概述

(1)假设条件

  • 两总体都是正态总体
  • 两总体方差未知,且值不等

(2)检验统计量及其分布、原假设及拒绝域

表 10‑1 z检验原假设、统计量及拒绝域

t检验:双样本异方差假设工具应用

例:对如下数据检验X与Y的均值,假设两总体方差不等,检验两总体均值是否存在显著差异(显著水平0.05)。

图 10‑1 数据资料

(1)数据|分析|数据分析|t检验:成对双样本平均值,弹出对话框并设置如下:

图 10‑2 异方差检验对话框

(2)单击“确定”得检验结果报告。由报告可见,双尾截尾概率(P值)为0.85>0.05不拒绝原假设,即两样本总体均值无显著差异。

我们关注的是P值,当该值小于显著水平时,图中的P值值远小于0.05,效应显著。

图 10‑3 检验结果报告

F检验:双样本方差齐性检验

F检验简介

F检验又叫方差齐性检验。从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用秩和检验等方法。其中要判断两总体方差是否相等,就可以用F检验。F检验法是英国统计学家Fisher提出的,主要通过比较两组数据的方差 S2,以确定他们的精密度是否有显著性差异。至于两组数据之间是否存在系统误差,则在进行F检验并确定它们的精密度没有显著性差异之后,再进行t 检验。

查F分布临界值表得临界值Fα,如果F < Fα表明两组数据没有显著差异;F ≥ Fα表明两组数据存在显著差异。若能得到F所对应的截尾概率(P值),则P值小于显著水平时差异显著。F分布函数描述见(图 10‑3),分布曲线见(图 11‑2)。

图 11‑1 F分布基本概念

图 11‑2 F分布曲线

图11-2蓝色部分为面积为F分布累积概率=1-α;红色部分的概率则为α,横轴为F值。

F检验:双样本方差工具的使用

例:对如下数据,利用EXCEL的F检验工具检验两组数据方差是否有显著差异。

(1)在EXCEL中输入数据。

图 11‑3数据资料

(2)从“数据”选项卡选择“数据分析”,选择“F检验:双样本方差”,单击“确定”弹出对话框如下:

图 11‑4 F检验对话框

(3)单击“确定”得到输出结果(图 11‑5)

图 11‑5 F检验结果

由图3可见,F统计量=1.488,F临界值为3.1789,F0.05,没有落入否定域,不拒绝原假设。

原文发布于微信公众号 - 大数据杂谈(BigData07)

原文发表时间:2017-07-02

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏算法channel

3 张PPT理解如何训练 RNN

损失函数选用交叉熵,机器学习的很多算法模型也都会选用交叉熵。显然,损失函数大小不想受训练语料库的单词数影响,因此计算所有训练单词的交叉熵再求平均即可。

1271
来自专栏fangyangcoder

数字图像处理之复原处理

                                                        by方阳

1053
来自专栏磐创AI技术团队的专栏

新手入门机器学习十大算法

【磐创AI导读】:对于想要了解机器学习的新手,本文为大家总结了数据科学家最经常使用的十大机器学习算法来帮助大家快速入门。如果喜欢我们的文章,欢迎点赞、评论、转发...

851
来自专栏阮一峰的网络日志

相似图片搜索的原理(二)

二年前,我写了《相似图片搜索的原理》,介绍了一种最简单的实现方法。 昨天,我在isnowfy的网站看到,还有其他两种方法也很简单,这里做一些笔记。 ? 一、颜色...

4046
来自专栏大数据互联网思维

如何使用MaskRCNN模型进行图像实体分割

目标检测是计算机视觉和模式识别的重要研究方向,主要是确定图像中是否有感兴趣的目标存在,并对其进行探测和精确定位。传统的目标检测流程采用滑动窗口进行区域选择,然后...

3813
来自专栏Brian

机器学习常用算法-线性回归算法

2484
来自专栏计算机视觉

图像风格转移Automatic Photo Adjustment Using Deep Neural Networks

P图技术日新月异,有些P图大神的作品,让我们驻足相忘~嗷嗷,如何使用神经网络对这些大神的P图风格进行学习,我们这篇论文就提出了下面的方法。我认为这篇文章能很好的...

43211
来自专栏书山有路勤为径

Regularizing your neural network

如果怀疑神经网络过度拟合了数据,即存在高方差问题那么最先想到的方法可能就是正则化,另一个解决高方差的方法就是准备更多数据,这也是非常可靠的办法,但你可能无法时时...

583
来自专栏人工智能

吴恩达深度学习课程笔记之卷积神经网络基本操作详解

卷积层 CNN中卷积层的作用: CNN中的卷积层,在很多网络结构中会用conv来表示,也就是convolution的缩写。 卷积层在CNN中扮演着很重要的角色—...

3837
来自专栏数据小魔方

excel数据分析工具库系列四|假设检验

今天要跟大家分享的是excel数据分析工具库系列四——假设检验! 一共会讲到关于假设检验的5个知识点: Z-检验:双样本均值差检验 T-检验:平均值的成对二样本...

3696

扫码关注云+社区

领取腾讯云代金券