学习
实践
活动
工具
TVP
写文章

用机器学习进行倾向性评分?

作为真实世界数据分析的重要工具之一,倾向性评分(Propensity Score)在因果推断方面的地位不用再多说了,有兴趣的可以去膜拜一下Rosenbaum和Rubin那篇83年的被引用1.8万次的雄文“The Central Role of thePropensity Score in Observational Studies for Causal Effects"。

倾向性评分对于真实世界数据分析的最大价值,在于充分利用已有数据,作出最具统计学意义的推断,尽管这些推断目前大多来自于回顾性的研究,在循证医学上的证据等级还略显不足。

越来越多的新方法被应用在倾向性评分的理论和实战改进中,比如2009年发表在Epidemiology的这篇 "High-dimensional propensity score adjustment instudies of treatment effects using health care claims data",通过新的算法降低在超过500个协变量上进行评分(即高维倾向性评分)时的误差。

该算法由于契合真实应用场景而具有较强的实用价值,这种方法随即被很多文献借鉴,比如2017年8月发表在BMJ上的“Risk of neonatal drug withdrawal after intrauterine co-exposure to opioids and psychotropic medications: cohort study”,通过高维倾向性评分来评估了孕期服用抗精神药物和阿片类药物对新生儿药物戒断的影响。

值得注意的是今年3月发表在Epidemiology上的另一篇文章“Can We Train Machine Learning Methods to Outperform the High-dimensional Propensity Score Algorithm?”,将热门的机器学习技术引入进来,提升倾向性评分中协变量的选择准确率。下图是文中机器学习技术相对于传统算法的性能对比:

机器学习在大规模医疗数据分析中的准确性和操作性优势已经越来越被认可,而倾向性评分对于因果关系的判定价值也会随着自身理论的不断完善而日益凸显,如果两者能够持续深度结合,必然会对真实世界的临床问题发现和解决起到巨大的作用。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180809G0LBW800?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券