Bringing medical advances from the lab to the clinic.
关键词:#数据共享 #临床试验 #个体患者数据 #Kaplan-Meier曲线 #伪IPD重建 #时间-事件数据 #透明度 #可重复性 #肿瘤研究
前言:
随机对照临床试验(RCT)是肿瘤治疗进展的关键,但个体患者数据(IPD)并未被视为公共资源,共享率严重不足。尽管NIH在2023年发布数据共享政策并要求管理计划,NCI及多个平台也相继成立数据归档和访问渠道,肿瘤RCT的IPD可访问性和重用度仍然有限。目前只有少数癌症RCT数据集在上述平台公开,IPD重用活动仍屈指可数。
一个重要原因在于现有平台的数据获取流程过于繁琐:研究者需提交正式提案并经多方审批,且通常只能在受限的虚拟桌面环境中操作,使用不便,令二次分析、荟萃研究及转化医学进展受阻。尤其在肿瘤学领域,研究迫切需要基于现有数据进行更多探索,但繁复流程使得研究者望而却步。
与此同时,方法学进展使得从公开的Kaplan-Meier生存曲线中逆向提取时间-事件数据成为可能,通过提取生存概率、在险人数、事件总数和删失信息,可重建高度拟合的个体参与者伪IPD。随着人工智能和图像处理算法的发展,伪IPD重建将趋于全自动化。这一技术已在HARMONi-A等试验中得到验证,其伪数据显示与原始数据高一致性。
基于此现实,作者呼吁在RCT结果发表时,以补充材料形式公布简化版数据集,仅包括随机组别以及关键终点(如PFS、OS)的时至事件信息,不含敏感协变量。该数据集可采用通用模型规范,例如同时包含复合终点及其组成子事件。这样的简化数据集既可满足最常见的生存分析需求,又不增加研究者的数据准备负担,有助于标准化和自动化共享流程。
发布简化数据能让审稿人和研究者在投稿及发表阶段评估数据质量,检测信息性删失和比例风险假设的合理性,探索受限平均生存时间等替代疗效指标,促进荟萃分析,并为未来试验设计提供生存分布参数参考,提升科研效率和精度。此外,开放访问的时至事件数据也为机器学习和AI模型提供了丰富的训练资源,进一步推动精准医疗研究。
文章也指出潜在挑战:
总体生存数据常延迟或缺失、亚组分析KM曲线不完整,简化数据发布或削弱对全面IPD共享的紧迫感。但作为推动透明化和可重复性的首要举措,期刊若将其纳入强制规范,将显著降低共享门槛并为未来全面IPD共享奠定制度基础,最终助力肿瘤研究和患者获益。作者呼吁肿瘤学期刊、试验发起方和研究者共同推动该模式的实施,与现有临床试验注册和发表政策相结合,形成数据透明化的制度闭环,持续推动科研创新。
编者按:
期刊在论文发表时,附带简化的时间-事件数据集,以最低成本实现数据公开,既保障患者隐私,又减少研究者顾虑。此举有望为同行评审和二次分析提供必要支撑,促成更丰富、更严谨的荟萃研究,并为未来试验设计提供参考。我们期待肿瘤学界携手推动这项务实举措,让数据真正成为公共资源,从而造福患者和科学进步
参考来源:https://jama.docapi.xyz/journals/jamaoncology/fullarticle/2835769?resultClick=1
声明:
本文只是分享和解读公开的研究论文及其发现,以作科学文献记录和科研启发用;并不代表作者或本公众号的观点。
为了给大家提供一个完整而客观的信息视角,我们有时会分享有冲突或不同的研究结果。请大家理解,随着对疾病的研究不断深入,新的证据有可能修改或推翻之前的结论。
编辑:Justin L,助理:ChatGPT