ISLR_t统计量

回顾

之前讲了Z统计量。 Z统计量的总体逻辑是:假设H0成立,建立群体均值的正态分布。正态分布的均值是总体均值,标准差是σ/n−−√\sigma /\sqrt{n},σ\sigma一般用ss估计。这时候,根据样本的均值算出样本均值在群体均值正态分布的位置,如果位置很偏(p值很小,也就是取极限值的概率很小),那么就把H0拒绝了,因为从概率角度上,低概率事件可以默认为不可能事件,但是有一定的犯错概率,也就是Type 1 Error。

t分布的起源

大样本的好处 在obes独立不相关以及群体分布不是太skew的前提下,一个大的样本意味着

  1. sample distribution of the mean 是正态的
  2. 估计的standard error更可信:sn√\frac{s}{\sqrt{n}}

sample样本越小,那么对standard error的估计就越不确信,因此相应的CI需要变得更宽一些,这就产生了T分布。

t分布概述

t分布的形状和自由度有关,自由度dfdf一般是df=n−1df=n-1。样本越大,t分布越接近正态分布。 样本越小,t分布越宽,这样解释了σ\sigma的不确定性。

inference for a mean

inference for comparing two independent means

inference for comparing two paired means

比较paird means和independent means的区别有:

  1. 前者的点估计是每个pair的差值的平均数,后者的点估计是每一组的平均数的差值
  2. 前者的se是是pair的差值的ss,然后s/sqrtns/sqrt{n},后者的se是两组se的二范数。
  3. 前者的假设是,后者的假设是组内和组件独立不相关,size/skew。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ATYUN订阅号

Python中的统计假设检验速查表

本文是一个机器学习项目中最流行的统计假设检验的速查表,包含使用Python接口的示例。

1406
来自专栏数据处理

最大似然函数最大似然原理小结:最大似然估计法的一般步骤:例子:

1K2
来自专栏Vamei实验室

概率论06 连续分布

作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢!

731
来自专栏深度学习之tensorflow实战篇

python KS-检验(Kolmogorov-Smirnov test) -- 检验数据是否符合某种分布

python 检验数据分布,KS-检验(Kolmogorov-Smirnov test) – 检验数据是否符合某种分布 Kolmogorov-Smirnov...

1.1K6
来自专栏CDA数据分析师

【从零开始学统计】3.置信度置信的到底是什么?

连载系列3:置信度置信的到底是什么? 前两期楼主分别作了均值和拟合优度的专题,今天就来说说置信度。 要说置信度,首先老师肯定会在此前已经介绍过了点估计了,那么引...

18310
来自专栏ATYUN订阅号

t检验的工作原理和在Python中的实现

因此,总有一天你可能会使用t检验,深入了解它的工作原理非常重要。作为开发人员,通过从头开始实现假设检验以理解。

2313
来自专栏大数据挖掘DT机器学习

常用连续型分布介绍及R语言实现

作者:张丹(Conan), 程序员Java,R,PHP,Javascript blog: http://blog.fens.me 随机变量在我们的生活中处处可...

3336
来自专栏数说工作室

【学点统计学·非参数检验汇总】3. 多独立样本的非参数检验

飞扬 / 撰写 整理 数说君 / 编辑 ---- 本系列为【学点统计学·非参数检验汇总】 1. 回顾 单样本非参数检验 两独立样本非参数检验 2. 多独立样...

32511
来自专栏算法channel

2000字详解:极大似然估计, 最大后验概率估计

统计学中,似然函数是一种关于统计模型参数的函数。给定输出x时,关于参数θ的似然函数为L(θ|x),似然函数在数值上等价与给定θ后的

870
来自专栏量化投资与机器学习

【Python量化统计】——『置信区间』全角度解析(附源码)

一、置信区间 置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个...

3409

扫码关注云+社区