最新综述| A Review of Graph Neural Networks in Epidemic Modeling
自COVID-19疫情爆发以来,基于图神经网络(Graph Neural Networks, GNNs)的流行病学建模研究得到了广泛的关注。传统机理模型在数学上描述了传染病的传播机制,但在应对当前复杂多变的流行病学挑战时常显不足。得益于对复杂网络的捕捉能力,GNNs逐渐成为流行病学研究中的重要工具。
在本文中,我们系统地描述了GNN在流行病任务中的应用。我们首先完整地定义了流行病任务、数据源和图构造方法的层次分类体系。在方法层面,根据工作特点将现有研究分为神经模型与混合模型两大类,系统地回顾了现有方法,涵盖了其任务目标及技术细节。此外,本文从多角度讨论了现有方法的局限性,并指出了未来研究的方向。我们也建立了一个完整的论文列表仓库,以追踪该领域最新的技术。
- 综述题目: A Review of Graph Neural Networks in Epidemic Modeling
- PDF 链接: https://arxiv.org/abs/2403.19852v2
- Github 仓库: https://github.com/Emory-Melody/awesome-epidemic-modeling-papers
image-20240412125233782
面临挑战
流行病学长期以来是公共健康决策的关键领域,特别是在全球性健康危机,如COVID-19大流行期间,疫情迅速全球蔓延,对医疗资源的生产和分配造成了巨大压力。为了应对这一范围广泛的健康挑战,建立有效的流行病模型显得尤为重要,研究人员已经开发出各种机理模型。然而,这些知识驱动的方法常常依赖于过于简化或固定的假设,可能导致建模偏差,从而影响预测的准确性和泛化能力。为了克服机理模型的限制,采用数据驱动的方法在流行病预测任务中日益流行,特别是机器学习和深度学习模型。其中,图神经网络(GNNs)在处理复杂网络结构数据方面表现出色,能够通过信息聚合和特征提取能力,捕捉流行病的复杂交互关系,这使得GNN特别适用于模拟其中的传播动态。
尽管在流行病建模领域已有许多研究探索GNN的应用,但目前仍缺乏一个系统性的文献综述来全面整合这些研究成果。这篇文章能够系统地总结和评价GNN在流行病建模中的应用,阐明其优势和局限性,同时指出未来的研究方向。我们希望帮助学术界和医疗卫生领域的专业人士更好地利用GNN技术,同时有助于推动相关技术的创新和发展。
主要贡献
我们的主要贡献如下:
全面且开创性的综述:本文提供了对流行病建模中GNN应用的全面且开创性的综述。我们详尽地分类了该领域的各种任务、数据源及图构造技术,为读者提供了一个清晰的研究框架和深入理解的基础。
方法的深入分类:文章对现有的方法进行了深入的分类和详细的描述。
指出现有方法的局限性并提供未来方向:我们不仅指出了当前方法的局限性,还提出了未来的研究方向,推动该研究领域的持续进步和发展。
流行病任务分类
在第3.1节中,我们对流行病学任务进行了详细的分类,从流行病学家的角度出发,将我们研究的工作分为四个类别:检测(Detection)、监视(Surveillance)、预测(Prediction)和投影(Projection)。这些分类体现了研究者在处理流行病数据时的不同目标和方法。
- 检测(Detection):检测任务的目标是识别特定时间发生的健康状态、疾病传播或其他相关事件。在我们的综述中,我们包括了两种不同的检测任务:源检测和传播检测。例如,患者零(Patient-zero)的发现就是一项重要的源检测任务,目的是识别疾病爆发的源头。
- 监视(Surveillance):监视任务旨在提供及时准确的信息以支持决策制定和疾病预防。由于需要快速响应,实时处理能力是建模时最重要的要求之一。例如,及时检测感染个体和实时评估不同地点的感染风险可以视为监视任务。
- 预测(Prediction):预测任务与监视类似,也旨在使用历史数据预测流行病事件。然而,与监视任务不同的是,预测任务通常涉及更长时间跨度的预测,且不需要实时处理。预测任务更关注于在较长时间后的目标预测,如
而非时间
。
- 投影(Projection):在流行病预测中,投影任务类似于预测,但额外包含了理解流行病结果的意图。这些任务通常需要模型能够融入流行病演变过程中的变化,如外部干预和初始状态的变化,以找到最佳干预措施或最大化影响以实现如控制疾病传播的目标。
数据源分类
在第3.2节中,我们对使用的数据源进行了详细分类,这些数据源的分类如下:
- 人口和健康记录:这些数据通常通过大学、政府或其他组织发布的公共数据库获得。数据包括人口统计信息、感染人数和个人或群体的健康记录。在流行病图的构建过程中,这些数据通常直接用作节点特征或用于图结构的构建。
- 流动性信息:流动性信息可以通过记录交通信息、地图或个人联系记录的网站获得。这些信息通常用于构建图结构。
- 在线搜索和社交媒体:通过社交媒体和在线搜索记录也可以获得流行病信息。一个地区大量的疾病相关问题搜索可能表明潜在的疫情爆发,这些数据随后可以作为节点特征使用。
- 传感器数据:多模态数据可以通过摄像头、卫星、无线电等传感器获取。这些数据还可以帮助进行如暴露风险预测等流行病任务。与传统数据源不同,传感器数据通常需要使用专门的模型进行预处理,例如使用ResNet等技术对图像进行编码,然后将其作为节点特征集成。
- 模拟数据:除了现实世界的数据外,一些研究也使用了模拟数据来进行模型训练和测试。这些数据通常需要使用TimeGEO、独立传染模型(ICM)以及SIR模型等模拟模型来生成动态图。
图构造技术分类
在第3.3节中,我们提供了基于节点和边的动态性的图构建分类方法:
- 静态节点特征(Static Node Features):静态节点特征指的是随时间不变的属性。这些特征通常包括感染顺序、性别、年龄和与症状相关的信息,这些都可以在训练和预测时用作节点的特征。静态特征的数据结构通常表示为
,其中
是节点数,
是不同特征的数量。
- 动态节点特征(Dynamic Node Features):与静态特征相对,动态特征代表随时间变化的特性。这种类型的数据通常用于时间序列预测任务,模型需要在每个时间点输入这些特征。动态特征的数据结构可以表示为
,其中
是给定的时间戳。
- 静态图结构(Static Graph Structure):静态图结构通常涉及使用预定义方法根据可用数据生成图。一旦图形结构建立,它在训练迭代过程中或不同时间点间保持不变。例如,在涉及多个地区的任务中,通常使用地理邻接性
来连接不同地区,这些地区在图
中表示为节点。地区之间的距离或移动人流量可以作为边的权重。
- 动态图结构(Dynamic Graph Structure):动态图结构涉及随时间或通过病毒传播过程中的邻接关系的修改。例如,可以使用动态图结构来表示随时间步变化的边集合
,这些边基于传播概率连接个体。此外,传统的地理邻接矩阵可能无法准确表达真实的动态连通性,一些研究也采用训练阶段学习适应性边或边权重的策略。
方法介绍与分类
image-20240412134041353
在第3.4节中,我们探讨了流行病建模中图神经网络(GNN)的方法论区别,主要分为两类:神经模型和混合模型。
- 神经模型(Neural Models):这类模型主要依赖数据驱动的方法,利用深度学习的力量(即本文中的GNN)来揭示疾病动态中的复杂模式,而不需要显式编码流行病学过程的底层逻辑。这些模型从原始数据中自动学习特征,并捕捉多样化输入中的复杂模式,从而显著提高了在各种任务中的表现。
- 混合模型(Hybrid Models):这类模型是机理流行病模型与神经网络的融合,结合了机理模型的结构化、理论驱动的洞察与GNN的灵活、数据驱动的特性。这种整合目的在于提供可解释、准确并且基于专家知识的预测。
神经模型
- 空间动态建模:GNN能够通过各种聚合过程捕捉空间关系,分析并抓取疾病传播的空间维度。许多研究将地理数据的固有结构表示为图数据,节点代表各个区域(如城市、社区或国家),边描述这些区域之间的连接(如道路、航班或疾病传播的潜在途径)。边权重在GNN模型中反映了区域之间的互动强度和性质,这些互动可能基于人员流动或社会联系的密切程度,也可以通过动态调整这些权重,模型能够实时反映区域间互动强度的变化。我们也介绍了其中使用到的位置编码技术,提高了模型对地理位置的敏感性和区分能力。
- 自适应结构学习 :这种策略强调在训练过程中学习和调整图结构,以更好地反映复杂的空间关系和动态变化。例如,一些研究通过引入图结构学习模块,动态计算节点间的相似度,从而能够适应不断变化的流行病学数据和传播模式。
- 多尺度建模:考虑到疾病传播的多尺度性质,如从个体到全球范围,多尺度建模能够同时捕捉从地方到全球层面的疾病传播动态。这种方法通过在不同管理层级(如市、州、国)间建立统一的图模型,来捕获空间相关性动态,确保对疾病传播的全面分析。
- 时间动态建模:利用GNNs的时间动态建模能力,研究可以模拟疾病如何随时间在不同地区传播。通过不断调整图结构中的边权重(如基于区域间的流动性或社交联系密度),可以动态地捕捉传播强度。我们详细探讨了图神经网络(GNNs)在捕捉流行病传播时间动态方面的应用。介绍了基于循环神经网络(如LSTM或GRU)的模型,这些模型通过提取并整合节点特征的时间变化来预测疾病趋势。同时,还探讨了图时空卷积的方法,其中每个时间步的图空间卷积后的输出被用作时间模块的输入,从而为疾病预测提供了全面的空间时间信息。此外,一些方法还研究了时空图神经网络(STGNNs),这种网络通过集成多个ST-Conv模块,以精细化时间动态的处理。一些工作也引入了动态图结构学习,它通过自适应更新注意力矩阵来持续捕捉输入数据期间区域间关系的变化,动态反映节点间的影响力和区域间的互动。
- 干预措施建模:此类建模关注通过GNNs模拟不同公共健康干预措施的影响。研究通过模拟不同的干预策略,如社会隔离或疫苗接种,评估这些措施对疾病传播动态的影响。他们通常引入了强化学习的方法,动态优化公共健康干预措施,以在控制疫情和最小化经济影响之间寻找平衡。
混合模型
与前述的纯神经模型不同,混合模型有效地融合了机理模型的结构化、理论驱动的理解和GNN的灵活、数据驱动的特性,从而增强了疾病预测的准确性和可解释性。这种整合可以进一步分类为两类:机理模型参数估计和机理驱动的神经模型。
- 机理模型参数估计: 我们探索了如何通过混合模型动态调整机理模型的参数来适应流行病的演变。这些混合模型结合了神经网络的预测能力和传统机理流行病学模型的理论基础。一些研究通过图神经网络(GNN)估计如接触率(传播率β)和恢复率γ等关键参数,这些参数随后用于SIR模型来监测疾病的演变。另外还可以利用GNN得到的节点嵌入用来动态计算SIR模型中各个状态的数量,进而预测未来的目标。
- 机理驱动的神经模型: 我们探讨了如何利用机理模型中的领域知识来指导GNN的架构设计和学习过程。它使得GNN能够迅速适应变化的条件,显著提高预测的准确性和干预措施的有效性。具体实施中,一些研究利用SIR模型生成目标数据,通过模拟从单个节点开始的流行病传播,然后使用这些数据来训练GNN进行下游任务。例如,一些源检测任务中,节点状态(SEIR)被编码为独热码,并用作GNN的输入。此外,有研究整合了SIR的变体如SIHR模型和强化学习框架,提供了一个动态的流行病进展模型,以便RL代理能够考虑到住院的个体,实现对移动控制政策的动态修改。
未来方向
- 大规模流行病处理: 目前的方法多集中于处理有限的预定义尺度,如县级和州级数据。未来的工作应开发能够处理更多动态尺度数据的模型,从而更全面地捕捉和利用区域间以及区域内的复杂关系。另一个关键的研究方向是提升模型在大规模数据上的可扩展性,尤其是在需要实时处理的应用场景中。尽管在国家或省一级的流行病建模中节点数量可能较少,但在更细粒度级别,如城市或社区,所需处理的图数据可能会非常庞大。例如,一个大都市的个体接触网络图可能包含成千上万的节点,这对现有方法的计算效率和处理速度提出了挑战。未来的研究需要提高处理这些大规模图数据的效率,确保模型能够在实际应用中快速响应。
- 跨模态流行病学: 整合不同数据类型(如图像、文本和图数据)可以显著提高疾病传播动态的理解和预测准确性。跨模态方法有助于早期检测和干预,进行全面的风险评估,并促进跨学科合作,从而更有效地应对公共卫生挑战。尽管GNN非常适合信息聚合和处理多模态数据,但在流行病学设置中充分利用GNN的多模态能力的研究还相对较少。
- 流行病扩散过程: 当前GNN方法通常在离散的时间点聚合信息,而疾病传播在现实世界中是一个连续的过程,这种方法与实际情况存在不匹配。为解决这一问题,可以应用受到神经常微分方程(Neural ODE)启发的连续GNN模型来模拟疾病的连续传播过程。此外,由于疾病传播和感染具有时间延迟性,它们可能不会同步发生,需要考虑了不同的时空效应。
- 流行病干预措施: 现有的方法通常只包括一种类型的干预 (比如: 疫苗接种、隔离或者公共卫生教育),要么是节点层面的,要么是边的层面。但在现实世界中,干预可以在不同的图层级和不同的尺度上进行。为了更好地模拟实际情况,需要引入多层级和多尺度的干预措施 。
- 可解释性: 神经网络应用于流行病数据时,不仅提供高准确性的预测,还能让机构理解模型的预测理由。这对于建立信任和实际应用非常关键,尤其是在公共卫生决策支持中。可以通过结合GNN与因果推理模型,来增强预测的可解释性,这包括使用因果关系图来明确模型的决策路径。
- 以数据为中心的流行病: 流行病数据往往存在噪声、不完整性、隐私等问题,目前还没有很多研究通过GNN来解决这些问题:
- 噪声数据:流行病数据中的噪声可能来源于多样的数据源,如社交媒体。这些噪声在节点和边的层面上影响数据质量。尽管GNN的去噪和鲁棒性方面的研究还不多,但已有的GNN鲁棒性研究可能为流行病数据提供参考。
- 不完整数据:流行病数据的收集过程中经常出现数据不完整的问题,这可能通过聚合邻居特征或使用数据插补技术来缓解。
- 隐私保护:流行病数据通常包含个人敏感移动信息,需要严格的隐私保护措施。联邦图学习为处理敏感数据提供了一种不需中心化聚合的方法,有助于满足严格的数据隐私法规。