我有多中心的临床试验数据汇集两个类似设计的研究。我用cox回归分析建立了基于治疗的事件危险度模型。这些研究都有关于临床中心的数据,但是临床中心数量太多,规模太小。我该如何在考克斯模型中处理这个问题?
例:coxph(结果~治疗状态)这是不考虑临床中心的模式。
什么是我的最后一种模式,可以解释太多的中心注册人数少的问题。
发布于 2017-09-03 07:40:21
听起来,你似乎已经假设,个体诊所会对你所做的“事件”产生影响--首先,值得你自己来验证这个假设。如果所有的诊所都对所有受试者进行相同的治疗,那么为什么要使用“诊所”作为变量呢?毕竟,如果治疗是相同的,那么它不应该是一个预测,它是在哪个诊所做的!
现在,如果你读了这段话,心里想:“这家伙以为他是谁,他对我的行业一无所知!当然,诊所会影响事件发生的可能性!”那就太好了..。很可能就像你想的那样,诊所的一些特征在脑海中浮现.清洁,有某种类型的专家,设备,靠近最近的骆驼,诸如此类的事情。
不要使用诊所标识本身作为输入变量,而是使用您有假设的诊所的特性(即使data科学有时也应该遵循科学方法!)所以你的模型不再说“123号诊所的危险就是这样的”。相反,它说,“有设备的诊所有这样或那样的危险”,这应该会减少你输入空间的大小,并阻止你所看到的过度适应/过度颗粒化。
最后一个想法:小心选择诊所本身的特征,而不是他们所服务的人群。特定诊所可能为特定的人口、种族或条件服务,其结果非常不同,但这将是病人的一个特征,而不是诊所,因此(我认为)是由病人数据而不是临床数据控制的。
希望这能帮上忙!
https://stackoverflow.com/questions/46017980
复制相似问题