J Biosci｜分子相互作用网络：机遇、挑战和前景

智药邦

发布于 2022-11-16 19:04:51

6060

发布于 2022-11-16 19:04:51

文章被收录于专栏：智药邦智药邦

2022年4月20日，印度CSIR国家化学实验室的RAM RUP SARKAR研究团队在Journal of biosciences上发表论文Emerging landscape of molecular interaction networks: Opportunities, challenges and prospects。

在这篇综述中，作者基于图理论方法对分子互作网络的进展进行了全面概述。为了提供网络生物学方法在理解不同分子水平的基因、蛋白质、酶和代谢物的相互作用和调控方面的广泛应用信息，作者回顾了利用网络拓扑属性的方法、新兴的基于混合网络的方法和整合机器学习技术的方法来分析分子相互作用网络的进展。此外，作者还讨论了这些方法在生物医学研究中的应用，并对未来前景进行了展望。

1 摘要

网络生物学在解释分子相互作用网络、以及使用生物系统的图理论分析提供有见地的推理方面得到了应用。将计算生物建模方法与不同的基于网络的混合技术相结合，可以提供关于复杂系统行为的额外信息。随着生物研究中高通量技术的不断进步，人们试图将这些信息纳入网络结构，这使得网络生物学方法随着时间的推移不断更新。新开发的中心性度量方法容纳了多组学数据和调控网络结构信息的细节。结合经典的数学、计算建模方法的图网络属性和如基于机器学习和人工智能算法的先进方法，可以充分挖掘这些技术的潜在应用。这些计算方面的进展被证明是有益的，并服务于各种应用，如必需基因(essential gene)预测、药物-疾病相互作用的识别和基因优先排序。

2 主要内容

首先，作者介绍了常见的4种分子互作类型，包括：蛋白-蛋白互作网络，代谢网络，基因调控网络，信号转导网络。

接着，作者综述了基于网络拓扑的方法在分子互作网络研究中的应用，主要包括8类方法：中心性度量方法，PPI网络中整合大规模基因组筛选数据的方法，代谢网络分析方法(图2A)，基因共表达网络整合的方法(图2B)，生物化学网络中的扰动模式预测方法，动态网络中聚类模式的识别方法，基因优先排序方法(图2C)，氨基酸互作网络分析的方法。

其中，作者总结了经典的中心性度量方法的基本定义和数学计算方法，如表1所示。

表1 经典网络中心性度量的定义和数学表示

常用的中心性度量有5种，包括度(degree)、中间中心性(betweenness centrality)、接近中心性(closeness centrality)、离心率(eccentricity)和特征向量中心性(eigenvector centrality)。它们通常被称为经典中心性度量(见图1A)。已有研究表明，组学数据与拓扑特征的整合可以开发改进的中心性度量方法。这些中心性是通过经典中心性度量的组合，利用基于连通性的拓扑特征以及从实验输出中整合已知生物信息发展而来的。表2中，作者提供了这些新开发的中心性度量的概述。图1B提供了这些中心性如何通过包括额外的分子信息而从经典中心性度量演变而来的图示。

图1 分子互作网络中的中心性度量。（A）常用中心度度量的示意图，其中节点的颜色梯度和大小对应于所表示的网络中该节点的相应中心度值。网络中的最高中心度对应着节点的最大尺寸和最深颜色。（B）最近开发的一些新的中心性度量方法（如图右侧所示）的Sankey图表示，这些度量是从传统使用的基本中心性度量中派生出来的（如图左侧所示），通过合并各种类型的组学和网络数据（如图中间所示）。

表2 最近新开发的中心性度量的概述

图2 分子网络分析技术最新方法进展的示意图。（A）表示节点的局部可控性的级联数在所示的代谢网络模型上的展示，该模型衡量节点对其下游信息流的影响，并确定影响最大的反应节点。（B）netImpute算法的工作流程图，该算法采用共表达网络的扩散来解决单细胞数据中的丢失(dropout)问题。（C）骨干提取：通过一个示意的转录因子调控二分图，展示骨干提取技术提取重要调控转录因子集合的工作。

接着，如图3所示，作者简要介绍了一些新兴的基于混合网络的建模方法，包括基因调控机制的动力学研究方法、肿瘤异质性识别方法和通路拓扑模块的研究方法。

图3 新兴的混合网络模型的工作流程示意图。网络生物学与不同分子相互作用数据资源（如基因调控相互作用、信号和代谢网络以及蛋白质中的氨基酸相互作用）相结合的新兴综合方法概述。不同系统生物学技术的实现，如布尔形式化(Boolean formalism)、流平衡分析(flux balance analysis)、热扩散(heat diffusion)和机器学习集成等多种应用被证明是破译分子机制的有效工具。

此外，作者也总结了基于机器学习的方法在分子网络分析中的4种应用，包括：必需基因预测（Gene essentiality prediction），药物-疾病关联预测（Prediction of drug–disease interactions），调控基因的表征（Characterization of regulatory genes），基于PPI网络预测蛋白质丰度和蛋白质复合物。

3 总结

本综述全面评估了使用生物系统的图网络进行的推断，以及将其整合到不同的基于混合网络的建模技术中以研究复杂系统行为的更多细节。随着生物研究中高通量技术的不断进步，人们试图将这些信息纳入网络结构，推动了网络生物学方法在过去二十年中不断更新。多种中心性度量方法可用于预测基因组调控因子对靶基因网络的影响及其缺失对靶基因的影响。基于拓扑的方法的进展为成功识别扰动模式、基因优先排序和动态网络聚类铺平了道路。机器学习和人工智能在使用网络图特性方面的融合计算进展已被证明有益于一些应用，如必需基因预测、药物-疾病相互作用识别和基于单细胞数据预测蛋白质丰度。关于研究这些分子相互作用网络的现有方法学进展的现有知识，作者建议在未来可以开发和应用结合网络特性的先进计算方法应用于以下3个领域：

疾病诊断可检验假设的发展。随着图网络在推断包括传染病和癌症在内的不同疾病状况方面的应用，网络生物学方法提供了根据研究中的特定疾病系统的细节阐明特定疾病网络结构的机会。对疾病病例特定条件的差异网络结构和拓扑结构进行实证分析，并与正常生理条件的网络结构进行比较，可以帮助确定有益于治疗的预后靶标和模块。

基因调控靶标的识别。基因表达的翻译和转录后调控的组学和高通量数据的计算分析成功地建立了基因表达调控元件和靶基因的差异表达之间的因果关系（图3）。图网络分析是研究这些调控网络的合适选择，因为这些方法可以提供基于大规模信息整体分析的结论，可以从分析中预测调控靶标，且可以通过体内和体外实验进行进一步研究，以测试它们作为疾病条件下治疗靶标的可行性。

必需基因和分子靶标优先排序的自动识别。基于混合网络的模型，利用网络推理，为开发自动化机器学习和基于人工（贝叶斯、神经）网络的工具铺平了道路，即使在实验数据有限的情况下，也能预测和识别必需基因和排序优先分子靶标。这些整合方法可以不断更新，以提高预测质量，并对额外的异质数据进行验证。当有限的必需基因信息以及基因调控网络数据可用时，半监督算法可以进一步改进以提高预测精度。

不断改进的深度学习领域的统计方法可以有效地应用于改进个性化医学开发背景下分子网络数据的使用。分类算法的进步和利用网络拓扑信息对表型特异性分类敏感性的提高，可以加速个性化医学发展的研究，提高我们对疾病因果机制的理解。

参考资料

Panditrao G, Bhowmick R, Meena C, Sarkar RR. Emerging landscape of molecular interaction networks:Opportunities, challenges and prospects. J Biosci. 2022;47(2):24. doi: 10.1007/s12038-022-00253-y.

--------- End ---------

本文参与腾讯云自媒体分享计划，分享自微信公众号。

原始发表：2022-11-04，如有侵权请联系 cloudcommunity@tencent.com 删除

编程算法

本文分享自智药邦微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体分享计划，欢迎热爱写作的你一起参与！

编程算法

登录后参与评论

0 条评论

热度

J Biosci｜分子相互作用网络：机遇、挑战和前景

J Biosci｜分子相互作用网络：机遇、挑战和前景

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐