专栏首页生信修炼手册没想到你是这个样子的置信区间

没想到你是这个样子的置信区间

在关联分析的结果中,对于odd ratio值会给出95% CI的结果,这里的CI其实是confidence interval的缩写,代表置信区间。那么置信区间有什么用呢?

关联分析的核心思想是通过抽样的数据来评估总体的分布,在数学上通过样本统计量来评估总体的参数是一个典型的参数估计问题。对于参数估计,有两大类方法,第一个是点估计,第二个是区间估计。顾名思义,点估计就是给出参数的一个具体数值,区间估计就是给出一个取值的范围,置信区间就属于区间估计。

为什么我们需要区间估计呢?先来看一个例子,随机抽取40名男生来计算男生的平均身高,第一次抽样得到的平均身高是173cm, 第二个抽样平均身高为175cm,很显然,两次抽样对于总体均值的估计存在了波动,每次抽样给出的均值就看做是点估计,可以看出,对于同一个总体,不同抽样实验给出的点估计值存在了波动。这样的情况下,如何来准确描述总体的参数呢?此时就需要区间估计上场了。

不同于点估计,区间估计会给出总体参数分布的一个范围,对应两个值,分别为下限和上限。这两个值如何来确定呢?如果我说男生的平均身高范围在0到正无穷之间,这句话肯定是没有问题的,但是这样没有任何意义,我们需要一个系统的方法和规则,给出有意义的区间范围。

这个方法就是概率,和置信区间伴生的有一个概念,叫做置信水平,也称之为置信度。在描述概率时,我们通常会选定一个显著性水平,比如0.05,而置信度就是1减去显著性水平,所以经常会看到95%的置信度这样的叫法,置信度描述的是总体参数的真实值落在对应置信区间的概率, 以95%置信度为例,代表100次抽样中,其中有95次抽样的置信区间会包含总体参数的真实值。

置信度是计算置信区间的前提,所以在描述置信区间的值时,一定会给出对应的置信度,比如文章开头提到的,95%置信度下的置信区间。置信度根据我们选定的显著性水平来确定,是一个主观选定的数值,通常使用的是95%的置信度。置信度确定了之后,如何来计算置信区间呢?既然涉及到了概率,肯定想要知道总体的分布,以方便我们确定对应的概率密度分布。

根据中心极限定理,抽样个数超过30的情况下,可以用样本均值来表征总体均值,而且总体的数值分布在均值附近呈现正态分布,如下图所示

对于任意的正态分布,可以通过Z值将其转换为标准正态分布,公式如下

以95%置信度为例,位于置信区间内的概率为95%,则位于其他两侧的概率分别为2.5%,用R计算对应的z值,代码如下

qnorm是累计概率密度函数,四舍五入之后,结果为-1.96和-1.96, 所以经常看到如下所示的图

得到z值之后,就可以计算对应的置信区间了,公式如下

标准差除以样本个数的开方其实就是标准误了,以R语言中的逻辑回归为例

之前的文章介绍过,逻辑回归的OR值就是自变量的回归系数,上述例子中自变量x的回归系数为1.5046,而标准误为0.6287,根据这个结果,我们可以计算出该变量OR值的95%的置信区间

置信区间能够更加准确的描述总体参数的分布情况,在数据分析中广泛使用。

本文分享自微信公众号 - 生信修炼手册(gh_0146e37a8a70),作者:lzyg

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-10-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • RADAR:RNA编辑位点的数据库

    RNA编辑作为一种重要的转录后调控机制,是转录组研究中的热点。在不同类型的RNA编辑中,A->I的RNA编辑是最常见的,有许多的软件可以用于识别这种类型的RNA...

    生信修炼手册
  • miRanda和mirSVR:预测miRNA结合位点的工具

    预测miRNA结合位点的工具很多,以TargetScan为代表的工具,利用结合位点的保守性进行预测,对于大部分保守的结合位点而言其准确性较好,然而还是有部分mi...

    生信修炼手册
  • VAF:Variant Allel Frequency简介

    VAF是Variant Allel Frequency的缩写,通常称之为变异等位基因频率, 计算公式如下

    生信修炼手册
  • 【从零开始学统计】3.置信度置信的到底是什么?

    连载系列3:置信度置信的到底是什么? 前两期楼主分别作了均值和拟合优度的专题,今天就来说说置信度。 要说置信度,首先老师肯定会在此前已经介绍过了点估计了,那么引...

    CDA数据分析师
  • GameEngineArchitecture读书笔记(三)

    逍遥剑客
  • DeepMind新突破!首次用深度学习从第一性原理计算分子能量

    DeepMind发表了一项新研究,展示了深度学习如何帮助解决现实系统中的量子力学基本方程问题,相关论文发表在物理学期刊《Physical Review Rese...

    AI科技评论
  • Redis 相关命令和Springboot中的使用

    Redis是单线程的!Redis是基于内存操作,速度很快~,Redis的性能瓶颈跟机器的内存和网络带宽有关!跟CPU没有多大关系。

    HcodeBlogger
  • 当Jetson TX2遇到处女座买家....

    原来这个买家是想帮他的客户购买Jetson TX2,但是他说客户给他的图片上风扇叶片数量是六片,而我发的图片是7片,以至于他怀疑是不同的产品....

    GPUS Lady
  • ThreadPool怎样判断子线程全部执行完毕

    多线程执行顺序是不确定的, 那使用ThreadPool怎样判断子线程全部执行完毕?

    javascript.shop
  • 【SAP HANA系列】BW on HANA 迁移问题

    SAP HANA-optimized DataStores (使用事务代码 RSMIGRHANADB)。

    matinal

扫码关注云+社区

领取腾讯云代金券