前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Nat. Biotech. | 海量数据举措和AI为大流行病预测提供了试验平台

Nat. Biotech. | 海量数据举措和AI为大流行病预测提供了试验平台

作者头像
DrugAI
修改2021-02-02 11:09:37
4450
修改2021-02-02 11:09:37
举报
文章被收录于专栏:DrugAI

作者/编辑 | 王建民

收集大规模流行病学数据集的举措旨在通过国家COVID-19统计,以了解新的冠状病毒并帮助公共卫生政策制定者。

英国的两项人口规模的COVID-19研究:OpenSAFELY和COVID-19症状研究,首次有力地证明了大数据的力量,可以穿过大流行病产生的混乱的大量信息和统计数据,发现生物信号。虽然机器学习有可能加深研究人员对这种新型病毒及其如何影响人类宿主的理解,但鉴于缺乏开发此类模型所需的高质量数据,大多数能够准确分析真实世界数据的平台仍不成熟。即使许多人工智能(AI)举措可能不会对当前的危机产生多大影响,但从长远来看,一些举措可能会对未来的大流行病预防工作产生深远影响。

OpenSAFELY团队分析了1700多万人(约占英格兰成年人口的40%)的国家卫生服务(NHS)电子健康记录,以确定COVID-19相关死亡的主要风险因素。除了年老和存在潜在的医疗条件外,他们发现黑人和南亚族裔是死亡的主要风险因素之一。COVID-19症状研究使用伦敦国王学院和总部位于伦敦的人工智能公司Zoe Global开发的智能手机应用程序收集了260多万人的自我报告数据。通过分析有症状和没有症状的人的实时报告,研究人员建立了最有可能预测感染的症状组合--包括味觉和嗅觉丧失,他们首先将其标记为COVID-19症状。

由于其规模,这两项研究在统计上都很严谨,这是许多其他COVID-19人口研究所缺乏的。影响流行病学家的最令人不安的不确定因素之一是对实际病例数的混淆。许多为实时跟踪病毒而开发的仪表盘的光滑界面背后,隐藏着一团混乱、不一致的数据,这使得任何跨国比较都变得毫无意义。IQVIA人类数据科学研究所执行主任Murray Aitken说:"我们最终得到的是一堆乱七八糟的指标,有些有用,有些没用"。检测方法不完善,无症状携带者和已从感染中恢复的人的免疫力持续时间不确定,这意味着流行病学家对流行病的理解仍不完整。各国之间和国家内部不同的报告标准,以及官方病例数据的不断修改,使得这种不确定性更加复杂。佐治亚理工学院计算科学与工程学院副教授Aditya Prakash说:"我无法强调情况有多混乱"。

传统的统计分析和机器学习可以帮助清理混乱或不完整的数据。Zoe和Intellegens是几家将其他学科开发的机器学习能力重新用于大流行病预测的公司之一(Table 1)。Intellegens一直专注于材料科学和药物发现等一系列行业,它获得了英国创新署的资助,将其深度学习算法Alchemite应用于为政府和医疗服务提供者建立一个预测工具。其目的是提高算法的预测精度,以便分析人员能够评估不同政策干预可能产生的影响。

机器学习是流行病学预测的一个相对较新的补充。它不能取代经典的模型,但它可以整合来自多个数据流的非结构化和非正式数据,并能在不同的数据集中发现隐藏的模式。相比之下,机械论模型借鉴了更多有限的数据集,但结合了对疾病爆发的传播动态的理解。正如哈佛T.H.Chan公共卫生学院的Inga Holmdahl和Caroline Buckee在最近的一篇Perspective中指出的那样,这两种方法解决了不同的问题,具有不同的局限性。机器学习预测更适合于短期预测,例如可以帮助优先分配医疗资源,而机械模型则用于研究长期趋势和政策措施的影响,例如鼓励社会疏远或强制戴口罩。Prakash说,这两种方法之间的区别正在变得模糊,由包含两者元素的混合方法。

美国疾病控制中心每年举办的流感预测FluSight挑战赛,Prakash参加了,为评估新的疾病预测方法提供了重要的试验平台。Prakash也是几十名研究人员之一,致力于美国国家科学基金会资助的大规模计算流行病学计划,该计划旨在建立复杂的网络模型,在多个规模和多个数据层上运行,以发展对流行病和大流行病控制的见解。由人工智能软件公司C3.ai、微软和美国几家学术机构于3月成立的人工智能研究联盟C3.ai数字转型研究所也在开发建模和基于人工智能的工具,以减轻流行病的影响。其首批研究奖项集中在与COVID-19交叉的广泛课题上,包括住房不稳定和健康的社会决定因素等社会问题,以及数学建模和计算生物学等技术问题。

在一个完全不同的规模上,基因组学代表了另一个可能可以用机器学习来分析的领域。为了应对COVID-19大流行,Adaptive生物技术公司和微软公司扩大了现有的联盟,将T细胞受体(TCR)序列映射到特定的疾病状态。Adaptive正在向疫苗和药物开发者提供来自不同地域和种族的COVID-19感染者的去识别的TCR序列数据,使他们能够在临床试验中评估T细胞反应。同时,合作伙伴正在开发一种由机器学习驱动的COVID-19诊断方法,该方法通过识别血液样本中所有可能的能够结合SARS-CoV-2抗原的TCR来工作。

基于肺部成像的人工智能驱动诊断受到了大量的关注,尽管一些批评者认为该领域仍处于萌芽阶段。"创建机器学习模型是如此容易,"总部位于牛津的Zegami公司创始人兼首席执行官Roger Noble说,该公司将机器学习工具的开发与图像管理和分析软件相结合。"困难的是确保它们正确地工作,它们是无偏见的,它们是公平的,它们针对他们所看到的真实世界的数据工作,而不仅仅是也许在更无菌的环境中收集的训练和验证数据。"

OpenSAFELY项目由牛津大学循证医学数据实验室主任Ben Goldacre和伦敦卫生与热带医学学院临床流行病学教授Liam Smeeth共同领导,该项目展示了释放英国NHS巨大数据资源的潜力,以更好地理解和改善健康结果。目前的危机降低了行政和文化障碍,而在更正常的时期,这些障碍会阻止或延迟这种研究的实施。至关重要的是,它的设计和实施都堪称典范,与那些基于Surgisphere数据的信誉研究形成了鲜明的对比。几个适应症领域的少数基于人工智能的诊断已经获得批准,但评估基于人工智能的技术在医疗保健领域的实用性的监管框架仍在不断发展。无论以何种方式评估这些新兴技术,通常的安全性和有效性临床参数仍将适用。

当然,如果政治领导人及其支持者继续无视基本的公共卫生指导,任何智能技术或先进模式都不可能起到任何作用。美国和其他几个国家由民粹主义政客领导的大流行病的不寻常发展,他们对科学建议不屑一顾,这鲜明地说明了当公共卫生领域变成政治战场时,普通人所付出的代价。在一些国家,作为COVID-19大流行病特征的混乱,既是不良政治的结果,也是报告不一致的结果。任何技术都无法缓解这一根本问题。

参考资料

Sheridan, C. Massive data initiatives and AI provide testbed for pandemic forecasting. Nat Biotechnol 38, 1010–1013 (2020).

https://doi.org/10.1038/s41587-020-0671-4

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-09-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
TI-ONE 训练平台
TI-ONE 训练平台(以下简称TI-ONE)是为 AI 工程师打造的一站式机器学习平台,为用户提供从数据接入、模型训练、模型管理到模型服务的全流程开发支持。TI-ONE 支持多种训练方式和算法框架,满足不同 AI 应用场景的需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档