首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

R语言ROC曲线下的面积-评估逻辑回归中的歧视

对于模型协变量的给定值,我们可以获得预测的概率。如果观察到的风险与预测的风险(概率)相匹配,则称该模型已被很好地校准。也就是说,如果我们要分配一组值的大量观察结果,这些观察结果的比例应该接近20%。如果观察到的比例是80%,我们可能会同意该模型表现不佳 - 这低估了这些观察的风险。 我们是否应满足于使用模型,只要它经过良好校准?不幸的是。为了了解原因,假设我们为我们的结果拟合了一个模型但没有任何协变量,即模型: 对数几率,使得预测值将与数据集中的观察的比例相同。 这个(相当无用的)模型为每个观察分配相同的预测概率。它将具有良好的校准 - 在未来的样品中,观察到的比例将接近我们的估计概率。然而,该模型并不真正有用,因为它不区分高风险观察和低风险观察。这种情况类似于天气预报员,他每天都说明天下雨的几率为10%。这个预测可能已经过很好的校准,但它没有告诉人们在某一天下雨的可能性是否更大或更低,因此实际上并不是一个有用的预测!

03

【姊妹篇】预测模型研究利器-列线图(Cox回归)

人类总是痴迷于“算命”。无论是中国文化中的“算命”,还是西方文化中的“占星术”,都显示出人们对此的热情。在这一部分,我们将讨论另一种科学的“算命”。 该模型将用于评估患者的预后。作为一名肿瘤科医生,在临床实践中你将面临癌症患者提出的诸如“我能活多久”之类的问题。这是一个令人头痛的问题。大多数情况下,我们可以根据相应疾病的临床分期来判断患者的中位生存时间。实际上,临床分期是我们对这些患者进行生存预测的基础,换句话说,临床分期就是“预测模型”。我们根据患者的临床分期用中位生存期来回答这个问题。但是,这样做可能会引出新的问题,因为用一群人的中位生存期来预测特定个体的生存时间可能并不那么准确,无法判断该特定个体的预后是更好还是更差。

05
领券