前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >从零开始学统计 11 | 理解置信区间

从零开始学统计 11 | 理解置信区间

作者头像
白墨石
发布2021-01-12 10:24:46
7810
发布2021-01-12 10:24:46
举报
文章被收录于专栏:生信情报站

置信区间

假设现在测量了12个小鼠体重的值,注意这里只测量了12只小鼠(样本),而不是地球上的每一只小鼠(总体)

取12个测量值,计算平均值,注意这里是样本均值,而不是总体均值(地球上所有小鼠的均值)

理解样本均值与总体均值:https://cloud.tencent.com/developer/article/1771478

但是,我们可以通过 Bootstrap 方法,确定一个比较合理的均值范围来代表小鼠总体均值

  • 随机选12个小鼠体重值 Boostrap 是可放回抽样,意味着抽样时可能会抽到同一个值
  • 计算随机样本的均值
  • 重复1,2步,重复次数大于10000

现在,选择95%的bootstrap过程中产生的均值,下面画一条黑线,这段范围就是置信区间

因为这个置信区间可以覆盖 95% 的平均值,除此之外发生的概率只有 5%。换句话说,在置信区间外的P值都小于 0.05,意味着有统计显著差异。

我们开始的计算的样本均值,是对所有小鼠总体均值的估计,现在利用置信区间,我们就能知道小鼠总体均值和P值。

绿圈显示,测量均值落在该区域的概率小于 0.05,P值小于 0.05,说明这几乎不可能发生。

因此,根据置信区间,我们可以确定总体均值和任意小于20的数值之间在统计上都存在显著差异。

如果两个样本的置信区间有重叠,最好进行统计检验,如 t-test 来查看差异是否显著。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020/10/24 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 置信区间
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档