科学家们构建了一种人工智能系统,它能够利用单夜的睡眠数据,预测数十种严重疾病的风险。通过识别大脑与身体信号间细微的不协调,该系统能在疾病显现前很久就揭示出早期预警信号。图片来源: Shutterstock
辗转难眠的夜晚通常会导致次日疲劳,但它也可能预示着更晚才会显现的健康问题。斯坦福医学院(Stanford Medicine)的科学家及其合作者开发了一种人工智能系统,可以检测单夜睡眠中的身体信号,并评估一个人罹患100多种不同医学疾病的风险。
该系统名为 SleepFM,使用了来自65,000名个体近60万小时的睡眠记录进行训练。这些记录来自多导睡眠图,这是一种深入的睡眠测试,在睡眠期间使用多个传感器追踪大脑活动、心脏功能、呼吸模式、眼球运动、腿部运动以及其他身体信号。
多导睡眠图被认为是评估睡眠的黄金标准,通常在实验室环境中通宵进行。虽然它广泛用于诊断睡眠障碍,但研究人员意识到,它也捕获了大量鲜少被充分分析的生理信息。
“我们在研究睡眠时记录了数量惊人的信号,”这项新研究的共同高级作者伊曼纽尔·米尼奥(Emmanual Mignot)医学博士、哲学博士说。该研究将于1月6日发表在《自然医学》杂志上。“我们在一个完全被动的受试者身上,用八小时研究了一种通用的生理学。这蕴含着极其丰富的数据。”
在常规临床实践中,这些信息中只有一小部分被检视。人工智能的最新进展现在使研究人员能够更彻底地分析这些庞大而复杂的数据集。据该团队称,这项工作是首次将人工智能大规模应用于睡眠数据。
“从人工智能的角度来看,睡眠的研究相对不足。有很多其他人工智能工作在关注病理学或心脏病学,但关注睡眠的相对较少,尽管睡眠是生命中如此重要的一部分,”该研究的共同高级作者、生物医学数据科学副教授詹姆斯·邹(James Zou)哲学博士说。
为了从数据中发掘洞见,研究人员构建了一个基础模型,这是一种旨在从非常庞大的数据集中学习广泛模式,然后将该知识应用于众多任务的人工智能类型。像ChatGPT这样的大型语言模型使用了类似的方法,尽管它们是在文本而非生物信号上进行训练的。
SleepFM 在从睡眠诊所评估的患者那里收集的 585,000 小时多导睡眠图数据上进行了训练。每个睡眠记录被分割成五秒的片段,其功能类似于用于训练基于语言的 AI 系统的“单词”。
“SleepFM 本质上是在学习睡眠的语言,”邹说。
该模型整合了多路信息流,包括大脑信号、心律、肌肉活动、脉搏测量值和呼吸时的气流,并学习这些信号如何相互作用。为了帮助系统理解这些关系,研究人员开发了一种名为留一法对比学习的训练方法。这种方法每次移除一种类型的信号,并要求模型利用剩余数据重建它。
“我们在这项工作中取得的技术进步之一是,弄清楚如何协调所有这些不同的数据模式,使它们能够汇聚在一起学习同一种语言,”邹说。
训练完成后,研究人员调整模型以执行特定任务。他们首先在标准的睡眠评估上对其进行了测试,例如识别睡眠阶段和评估睡眠呼吸暂停的严重程度。在这些测试中,SleepFM 匹配或超越了当前使用的主流模型的性能。
随后,团队追求一个更雄心勃勃的目标:确定睡眠数据能否预测未来的疾病。为此,他们将多导睡眠图记录与同一批个体的长期健康结果关联起来。这之所以成为可能,是因为研究人员可以访问来自单一睡眠诊所的数十年医疗记录。
斯坦福睡眠医学中心由已故的威廉·德门特(William Dement)医学博士、哲学博士于1970年创立,他被广泛认为是睡眠医学之父。用于训练 SleepFM 的最大群体包括约 35,000 名年龄在2至96岁之间的患者。他们的睡眠研究是在1999年至2024年间在该诊所记录的,并与电子健康记录配对,这些记录跟踪了部分患者长达25年之久。
(米尼奥在2010年至2019年间指导该睡眠中心,他表示,该诊所的多导睡眠图记录甚至可以追溯到更早,但仅限于纸质记录。)
利用这个组合数据集,SleepFM 审查了 1000 多个疾病类别,并识别出 130 种仅使用睡眠数据就能以合理准确度预测的疾病。在癌症、妊娠并发症、循环系统疾病和心理健康障碍方面,结果最为显著,其 C-index 预测得分高于 0.8。
C-index,即一致性指数(concordance index),衡量模型根据风险对人群进行排序的能力。它反映了模型正确预测两个个体中谁将先经历健康事件的频率。
“对于所有可能的个体对,模型会给出一个排序,表明谁更有可能更早经历某个事件——比如心脏病发作。C-index 为 0.8 意味着,在 80% 的情况下,模型的预测与实际发生的情况一致,”邹说。
SleepFM 在预测帕金森病(C-index 0.89)、痴呆(0.85)、高血压性心脏病(0.84)、心脏病发作(0.81)、前列腺癌(0.89)、乳腺癌(0.87)和死亡(0.84)方面表现尤为出色。
“我们惊喜地发现,对于相当多样化的疾病,模型能够做出有信息量的预测,”邹说。
邹还指出,准确性较低的模型(通常 C-index 在 0.7 左右)已经在医疗实践中使用,例如帮助预测患者对某些癌症治疗可能有何反应的工具。
研究人员现在正致力于改进 SleepFM 的预测,并更好地理解系统是如何得出结论的。未来的版本可能会整合来自可穿戴设备的数据,以扩展生理信号的范围。
“它不会用英语向我们解释,”邹说。“但我们开发了不同的解释技术,来弄清楚模型在进行特定疾病预测时,是在关注什么。”
团队发现,虽然心脏相关的信号在预测心血管疾病方面影响更大,大脑相关的信号在心理健康预测中扮演更重要的角色,但最准确的结果来自于结合所有类型的数据。
“我们获得用于预测疾病的最多信息,是通过对比不同通道的数据,”米尼奥说。不同身体组成部分之间不同步——例如,大脑看起来像在睡觉,但心脏看起来像醒着——似乎预示着麻烦。
生物医学数据科学博士生拉胡尔·塔帕(Rahul Thapa)和丹麦技术大学的博士生马格努斯·鲁德·凯尔(Magnus Ruud Kjaer)是这项研究的共同第一作者。
来自丹麦技术大学、哥本哈根大学医院 - 里格肖斯皮塔莱特、BioSerenity、哥本哈根大学和哈佛医学院的研究人员为这项工作做出了贡献。
该研究获得了美国国立卫生研究院(资助号 R01HL161253)、奈特-汉尼斯学者项目和陈-扎克伯格生物中心的资助。FINISHED
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。