首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

不要把预测建模写成危险因素筛选

2023年以来浙中医大学郑老师开设了一系列医学科研统计课程,零基础入门医学统计包括R语言、meta分析、临床预测模型、真实世界临床研究、临床试验数据分析、重复测量资料分析等9门课程,如果您有需求,不妨点击下方跳转查看: 

2023年9门科研统计课程预售:多次直播,课题报销可先开发票

====================================================================

在我个人审稿过程中,关于预测建模类的文章我觉得比较常见的一个问题就是:用危险因素筛选的思路来写预测建模过程。事实上,危险因素筛选和预测建模尽管有关系,但并不是一回事。不少临床医师很容易搞混,写文章的时候不知不觉就写成了四不像,导致被拒稿的几率大增。所以今天特地说一下这个问题。

举个例子,有个研究要构建某生化指标c对某疾病的预测模型。该文章题目很清楚,就是看c这个指标对某病的预测性能(当然,当我看到文章正文的时候我严重怀疑作者并不清楚自己究竟要做什么)。

在文章的材料方法中,作者介绍了下面内容:

病例选自于某一时期内该医院就诊患者,进行CT造影检查,根据检查结果确定结局。这一点说明结局的确定还是比较客观的。

关于预测变量,主要包括年龄、性别、多个生化指标。

统计方法主要采用logistic回归,采用逐步筛选方法,构建模型。

其实当我看到采用逐步筛选的时候,就已经觉得有点不对。既然作者想分析的是c这个指标,却又用逐步筛选。我不禁替作者有点担心,万一逐步筛选时候把c这个指标筛出去了怎么办?(当然,我相信肯定不会,也许很可能是作者倒推来写的,先发现了c有意义,然后再说用筛选,这时候c没有被晒出去)。

最后的分析结果显示,经logistic回归逐步筛选,结果发现性别和5个生化指标对结局有影响,包括生化指标c。作者列表展示了各影响因素的分析结果,其中生化指标c的OR值要大于其它因素。提示生化指标C对结局具有较大影响和较好的预测价值。

最终作者给出结论:生化指标c对结局具有较好的预测效果。

看到这里,不知道读者有没有一种熟悉的感觉,我反正是看到不少类似文章,这些文章尽管指标各不相同,疾病各不相同,但思路都差不多。或者说,出现的毛病都差不多:从题目来看,作者的思路是要构建一个预测模型,但从文章正文来看,作者通过危险因素筛选,然后比较OR值大小,说明指标的预测效果。

这里我不说文章的其它问题(比如有没有测试集,有没有其它模型性能指标等等),只说这个大致分析思路。事实上,我觉得在涉及统计分析的问题方面,不少临床医师更需要的是捋清楚分析思路,软件实现反而是次要的。下面就说一下这个文章的思路问题。

如果作者的目的真的是想分析c这个指标对疾病的预测性能,那就仔细分析c就好了,没有必要再去逐步筛选,因为你的预测变量已经很明确了。然而说实话,这种情形不多见,真正要预测一个模型,很少说一个指标就足够,通常都是多个指标一起预测。除非这个指标对疾病非常特异,否则很少会只看某一个指标对疾病的预测效果。

所以从这个角度来看,我非常怀疑作者没有搞清楚自己到底要做什么。很可能作者其实只是想看c这个指标对疾病的影响大小,而不是真的为了构建一个预测模型。注意这是两回事,一个变量对结局的影响有统计学意义,不见得一定有很好的预测价值。不少临床大夫会把二者混淆,从而导致文章思路也变得混乱,搞不清自己到底要做什么。

对于这篇文章:

(1)如果要分析c对结局的影响,那思路应该是以校正混杂因素为主,通过调整可能的混杂因素,发现c对结局确实有影响。这种思路不能用逐步筛选,但可以用OR值说事。

(2)如果作者想考察c对结局的预测性能,那可以考虑比较单独的c和c加其它变量的预测性能是否有差异,如果没有统计学差异,可以认为单独的c预测效果也可以。

(3)如果作者侧重的是想构建一个预测该疾病的模型,而不是为了看c指标,那可以纳入包括c和其它生化指标,选择相应的分析方法,确定一个最佳预测模型。

然而作者的做法包含了上述三种思路,却又把三种思路混在一起,从而导致分析思路不清楚。

最后的建议:我们在分析数据前,一定先想清楚自己到底要做什么,到底想实现什么研究目的。听起来很简单,但体现在写作中,真的有很多文章让人摸不着头脑。

详情请点击下方:

https://mp.weixin.qq.com/s/4jiAwtsk4dldTG_e_xGT7g

关注”医学论文与统计分析“公众号,获取更多精彩内容!

====================================================================

2023年统计服务

2023年,我们将开展从科研设计、数据分析、统计学报告等医学科研研究方法咨询与服务多项服务,若您有课题经费可以支持,欢迎您提前和我们联系,2022底前采用预付方式与我们开展合作。

2023年统计服务开启!欢迎提前洽谈数据分析、科研合作服务

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230316A03KMF00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券