开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

社区首页 >专栏 >ISLR_t统计量

ISLR_t统计量

用户1147754

发布于 2018-01-02 17:09:12

7610

发布于 2018-01-02 17:09:12

举报

文章被收录于专栏：YoungGy

回顾
t分布的起源
t分布概述
inference for a mean
inference for comparing two independent means
inference for comparing two paired means

回顾

之前讲了Z统计量。 Z统计量的总体逻辑是：假设H0成立，建立群体均值的正态分布。正态分布的均值是总体均值，标准差是σ/n−−√\sigma /\sqrt{n}，σ\sigma一般用ss估计。这时候，根据样本的均值算出样本均值在群体均值正态分布的位置，如果位置很偏（p值很小，也就是取极限值的概率很小），那么就把H0拒绝了，因为从概率角度上，低概率事件可以默认为不可能事件，但是有一定的犯错概率，也就是Type 1 Error。

t分布的起源

大样本的好处在obes独立不相关以及群体分布不是太skew的前提下，一个大的样本意味着

sample distribution of the mean 是正态的
估计的standard error更可信：sn√\frac{s}{\sqrt{n}}

sample样本越小，那么对standard error的估计就越不确信，因此相应的CI需要变得更宽一些，这就产生了T分布。

t分布概述

t分布的形状和自由度有关，自由度dfdf一般是df=n−1df=n-1。样本越大，t分布越接近正态分布。样本越小，t分布越宽，这样解释了σ\sigma的不确定性。

这里写图片描述

这里写图片描述

inference for a mean

这里写图片描述

这里写图片描述

这里写图片描述

inference for comparing two independent means

这里写图片描述

这里写图片描述

这里写图片描述

inference for comparing two paired means

比较paird means和independent means的区别有：

前者的点估计是每个pair的差值的平均数，后者的点估计是每一组的平均数的差值
前者的se是是pair的差值的ss，然后s/sqrtns/sqrt{n}，后者的se是两组se的二范数。
前者的假设是，后者的假设是组内和组件独立不相关，size/skew。

这里写图片描述

这里写图片描述

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。

如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自作者个人站点/博客前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

评论

登录后参与评论

0 条评论

热度

最新

LV.

目录

回顾
t分布的起源
t分布概述
inference for a mean
inference for comparing two independent means
inference for comparing two paired means