首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

样本含量估计的主要研究设计类型

上期已经讲完样本含量估计的基础知识,这期开始讲样本含量估计的主要研究设计类型。样本量估算的研究设计类型可以从多个角度进行分类,以下是比较常见的样本量估算的研究设计类型:随机对照试验(RCT)-对列研究+分类变量、随机对照试验(RCT)-对列研究+连续变量、成组设计的病例对照研究、匹配设计的病例对照研究、横断面调查+分类变量、横断面调查+连续变量、生存分析、估计灵敏度和特异度的诊断试验、ROC曲线下面积、非劣效性试验+分类变量、非劣效性试验+连续变量及非劣效性试验+生存分析等。下面进行详细讲解。

随机对照试验(RCT) - 队列研究 + 分类变量

(1)设计特点:随机对照试验(RCT)结合队列研究方法,将研究对象随机分配到不同干预组,然后像队列研究一样追踪观察各组在一段时间内分类变量(如疾病发生与否、治疗有效或无效等)的情况。

(2)样本量估算考虑因素

干预组和对照组的预期事件发生率:通过前期研究、文献资料或预试验来估计干预后两组中发生特定事件(如疾病治愈、出现并发症等)的概率。

相对危险度降低率(RRR)或比值比(OR):用于衡量干预措施的效果大小。RRR 或 OR 偏离 1 越远,说明干预效果越明显,所需样本量相对越小。

把握度(1 - β)和检验水准(α):把握度一般取 80% - 90%,检验水准通常为 0.05 或 0.01。较高的把握度和较低的检验水准会使样本量增加。

(3)估算方法:可采用公式

,其中p1和p2分别是干预组和对照组的预期事件发生率,

,zα/2和zβ分别是标准正态分布的双侧分位数和单侧分位数

随机对照试验(RCT) - 队列研究 + 连续变量

(1)设计特点:同样是 RCT 与队列研究的结合,不过观察的指标是连续变量,如血压值、血糖值、生存质量评分等,用于比较不同干预组在一段时间内连续变量的变化情况。

(2)样本量估算考虑因素

干预组和对照组连续变量的预期均值和标准差:需要对干预后的两组均值差异有一个初步估计,同时了解变量的离散程度(标准差)。均值差异越大、标准差越小,所需样本量越小。

把握度和检验水准:与上述分类变量情况相同,把握度和检验水准决定了样本量的大小。(3)估算方法:以两组均数比较为例,若两组方差相等,样本量计算公式为

,其中μ1和μ2是两组的预期均数,σ2是总体方差的估计值,可通过预试验或文献查阅获得。

成组设计的病例对照研究

(1)设计特点:将病例组(患有某种疾病的患者)和对照组(未患该病的人群)分别作为两组,然后回顾性地调查他们过去暴露于某些因素的情况,分析暴露因素与疾病的关系,两组之间没有匹配关系。

(2)样本量估算考虑因素

病例组和对照组中暴露因素的预期暴露率:通过查阅相关文献、以往研究资料或预试验来估计两组人群中暴露于研究因素的比例。

比值比(OR):反映暴露因素与疾病之间关联强度的指标,OR 值偏离 1 越远,说明暴露与疾病的关联越强,所需样本量相对越小。

把握度和检验水准:把握度一般要求在 80% - 90% 以上,检验水准通常取 0.05 或 0.01。

(3)估算方法:样本量计算公式为

,其中p0和p1分别是对照组和病例组中暴露因素的预期暴露率,q0=1−p0,q1=1−p1。

匹配设计的病例对照研究

(1)设计特点:在病例对照研究中,为了控制某些混杂因素的影响,将病例和对照按照某些特征(如年龄、性别等)进行一对一或一对多的匹配,然后比较匹配对中病例和对照的暴露情况。

(2)样本量估算考虑因素

匹配因素的影响:考虑匹配因素与研究因素以及疾病之间的关系,匹配的目的是减少混杂因素对结果的干扰,提高研究效率。如果匹配因素与疾病或暴露因素密切相关,样本量可能会有所减少。

暴露因素的预期暴露率和比值比:与成组设计类似,需要估计病例组和对照组中暴露因素的暴露率以及 OR 值,以确定样本量。

匹配比:即每个病例匹配的对照数量,如 1:1、1:2、1:3 等。匹配比不同,样本量计算方法也有所不同。一般来说,随着匹配比的增加,样本量会相应增加,但增加幅度逐渐减小。

(3)估算方法:以 1:1 匹配为例,计算公式为

,其中m是匹配组数,pi是第i个匹配组中病例暴露而对照未暴露的概率。对于其他匹配比,有相应的修正公式。

横断面调查+ 分类变量

(1)设计特点:在某一特定时间点,对研究人群进行一次性的调查,收集有关分类变量的信息,如性别、疾病状态、职业类型等,以描述这些分类变量在人群中的分布情况。

(2)样本量估算考虑因素

总体大小:总体规模越大,理论上所需样本量也越大,但当总体达到一定规模后,样本量的增加幅度会逐渐减小。

预期患病率或比例:对于所研究的分类变量,如某种疾病的患病率、某种行为的发生率等,需要有一个预先的估计值。

允许误差和置信水平:允许误差越小,置信水平越高,所需样本量越大。通常置信水平取 95% 或 99%。

(3)估算方法:对于估计总体率的情况,可用公式

计算,其中zα/2是标准正态分布的双侧分位数,P是预期患病率或比例,δ是允许误差。

横断面调查+ 连续变量

(1)设计特点:与横断面调查 + 分类变量类似,只是观察的指标是连续变量,如身高、体重、血压等,用于描述这些连续变量在人群中的分布特征。

(2)样本量估算考虑因素

总体均值和标准差:需要对总体的均值和标准差有一个大致的估计,可通过查阅文献、预试验或以往经验获得。标准差越大,所需样本量越大。

允许误差和置信水平:与分类变量情况相同,允许误差和置信水平决定了样本量的大小。

(3)估算方法:可用公式

计算,其中σ是总体标准差的估计值,δ是允许误差,zα/2是标准正态分布的双侧分位数。

生存分析

(1)设计特点:主要用于研究事件发生的时间数据,如疾病的复发时间、患者的生存时间等,同时考虑到观察过程中可能存在的截尾数据(如失访、研究结束时事件未发生等)。

(2)样本量估算考虑因素

两组的预期生存曲线:通过前期研究或文献资料,估计不同组(如干预组和对照组)的生存函数或累积风险函数。生存曲线差异越大,所需样本量越小。

事件发生率和截尾率:事件发生率高,截尾率低,所需样本量相对较小。需要对研究过程中的事件发生情况和可能的截尾情况有一个合理的估计。

把握度和检验水准:与其他研究一样,把握度一般要求在 80% - 90% 以上,检验水准通常取 0.05 或 0.01。

(3)估算方法:常用的方法有基于对数秩检验的样本量估算公式,如

,其中λ1和λ2分别是两组的事件发生率,可根据预期生存曲线计算得到。

估计灵敏度和特异度的诊断试验

(1)设计特点:旨在评估某种诊断试验正确识别患病者(真阳性)和非患病者(真阴性)的能力,通过将诊断试验结果与金标准诊断结果进行对比,计算出灵敏度和特异度等指标。

(2)样本量估算考虑因素

预期灵敏度和特异度:根据前期研究或同类试验的结果,对要评估的诊断试验的灵敏度和特异度进行初步估计。

允许误差和置信水平:允许误差越小,置信水平越高,所需样本量越大。一般置信水平取 95% 或 99%。

疾病患病率:疾病在研究人群中的患病率会影响样本量的计算。患病率过高或过低都会使样本量增加,通常在患病率适中时样本量相对较小。

(3)估算方法:对于估计灵敏度Se的样本量,可用公式

,其中δSe是灵敏度的允许误差。对于估计特异度 Sp的样本量,公式为

,其中δSp是特异度的允许误差。然后取n=max(nSe, nSp) 作为最终的样本量估计值。

ROC曲线下面积

(1)设计特点:通过绘制受试者工作特征曲线(ROC 曲线),以真阳性率(灵敏度)为纵坐标,假阳性率(1 - 特异度)为横坐标,展示诊断试验在不同临界值下的性能。ROC 曲线下面积(AUC)用于衡量诊断试验的准确性,AUC 越接近 1,说明诊断试验的准确性越高。

(2)样本量估算考虑因素

预期 AUC 值:根据以往研究或初步试验结果,估计所研究诊断试验的 AUC 值。AUC 值越接近 0.5(随机水平),所需样本量越大;AUC 值越接近 1,所需样本量越小。

允许误差和置信水平:允许误差和置信水平决定了样本量的大小,通常置信水平取95% 或 99%。

对比的组数:如果是比较多个诊断试验的 AUC,样本量计算会更复杂,需要考虑组间差异和比较的次数等因素。

(3)估算方法:有多种方法可用于估算样本量,一种简单的方法是基于正态近似的公式

,其中p0和p1分别是患病组和非患病组中阳性结果的比例,可根据预期AUC 值和患病率进行估计。

非劣效性试验+ 分类变量

(1)设计特点:旨在验证新的干预措施(试验组)在疗效上不劣于已有的标准干预措施(对照组),观察的指标为分类变量,如治愈率、有效率等。

(2)样本量估算考虑因素

非劣效界值(δ):这是预先设定的一个数值,表示试验组与对照组之间允许的最大差异,在不超过此界值的情况下,认为试验组非劣于对照组。δ 值的确定需要综合考虑临床意义、前期研究结果等因素。

对照组的预期有效率(pC):通过以往研究或文献资料估计对照组的有效率。

试验组的预期有效率(pT):在假设试验组非劣于对照组的前提下,对试验组的有效率进行估计。一般来说,pT应接近pC。

把握度和检验水准:把握度通常要求在 80% - 90% 以上,检验水准一般取 0.05 或 0.01。

(3)估算方法:样本量计算公式为

,其中zα和zβ分别是标准正态分布的单侧分位数,对应检验水准 α 和把握度 (1−β) 。

非劣效性试验+ 连续变量

(1)设计特点:与非劣效性试验 + 分类变量类似,只是观察指标为连续变量,如血压降低值、血糖变化值等,用于比较试验组和对照组在连续变量上的差异是否在非劣效界值范围内。

(2)样本量估算考虑因素

非劣效界值(δ):根据临床意义和研究目的设定,是试验组与对照组均值之间允许的最大差异。

对照组和试验组连续变量的预期均值和标准差:需要对两组的均值和标准差进行估计,可通过预试验、文献查阅或以往经验获得。标准差越大,所需样本量越大。

把握度和检验水准:与其他非劣效性试验相同,把握度和检验水准决定了样本量的大小。

(3)估算方法:以两组均数比较为例,样本量计算公式为

,其中μT和μC分别是试验组和对照组的预期均值,σ2是总体方差的估计值,可假设两组方差相等并通过预试验等方法获得。

非劣效性试验+ 生存分析

(1)设计特点:在非劣效性试验中,观察指标为生存时间等时间 - 事件数据,同时考虑到截尾数据的情况,用于评估试验组的生存情况是否不劣于对照组。

(2)样本量估算考虑因素

非劣效界值(δ):通常以风险比(HR)的形式表示,如设定试验组与对照组的 HR 不超过某个值(如 1.2)时,认为试验组非劣于对照组。

对照组的预期生存函数和事件发生率:通过前期研究或文献资料估计对照组的生存曲线和事件发生率。

试验组的预期生存函数:在假设非劣效的前提下,对试验组的生存情况进行估计。一般来说,试验组的生存曲线应接近对照组。

把握度和检验水准:把握度一般要求在 80% - 90% 以上,检验水准通常取 0.05 或 0.01。

截尾率:考虑研究过程中可能出现的截尾情况,截尾率过高会影响样本量的估计,需要对截尾率进行合理的估计和调整。

(3)估算方法:样本量估算较为复杂,常用的方法是基于生存分析的假设检验,如利用对数秩检验或 Cox 比例风险模型进行计算。具体公式涉及到较多的参数估计和假设,一般需要借助专门的统计软件进行计算。例如,可根据 Pocock 等提出的方法,通过估计对照组和试验组的累积风险函数,结合非劣效界值、把握度和检验水准等因素来计算样本量。

欢迎关注我,让你身边多一位熟悉统计分析方法的帮手,有以下付费视频或服务可供选购:

1.单个问题答疑咨询。1对1答疑、小额付费、48小时内有效。

2.答疑咨询年度会员。一年365天时限内各种统计分析问题1对1答疑,性价比高。

3.购买视频课程赠送课程相关主题内容1对1答疑1年。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OWn53DuDoBTyBNKMTy1KMPpA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券