首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >网络驱动的药物发现

网络驱动的药物发现

作者头像
智药邦
发布2022-06-08 14:27:46
发布2022-06-08 14:27:46
4530
举报
文章被收录于专栏:智药邦智药邦

本文为《Artificial Intelligence in Drug Design》一书第7章的主要内容,作者是英国生物技术公司E-Therapeutics的Jonny Wray和Alan Whitmore。

该书的总体介绍见Springer推出新书《Artificial Intelligence in Drug Design》

摘要

我们描述了一种早期药物发现的方法,该方法明确涉及人类生物学的复杂性。这种计算和实验相结合的方法是在一个概念框架下制定的,其中网络生物学被用来在单个分子实体和这些实体的细胞表型 (在网络中相互作用时出现的) 之间架起桥梁。

这种方法有助于解决早期药物发现的多个方面的问题,包括阐明与疾病有关的生物过程、靶点识别和验证、活性分子的表型发现及其作用机制分析,以及从人群遗传学数据中提取遗传靶点支持等。本文通过对一些发现项目的总结和一个针对COVID-19疾病的项目的细节来描述方法的验证情况。

1 目标

药物发现的一个主要问题是人类生物学的复杂性。药物发现的核心目标是找到能够有效调节目标生物过程,同时对其他过程几乎没有影响的治疗药物。人类生物学的复杂性在多个层面阻碍了这一研究:识别与疾病有关的生物过程,了解这些过程的分子基础,识别分子干预点,以及设计和开发可以特异性触发这些干预的药物。

早期药物发现中需要新的、基于系统的方法

许多观察结果强调了在早期药物发现中需要新的、基于系统的方法:

分析多个药物发现项目的成功和失败得出的结论是,大量晚期临床失败的原因,是不正确或无效的生物学靶点。

寻找复杂疾病 (与大量基因或蛋白质的变化或失调相关的疾病) 的治疗方法的成功有限,留下了严重的未满足的医疗需求。

后基因组分子分析技术使一个细胞的状态可以通过多种方式进行全系统测量。然而,利用这些数据阐明疾病的分子基础,并为药物发现提供可操作的见解的能力已被证明是难以捉摸的。

人类生物学的复杂性反映在临床前分析未能从模型系统转化为人类的情况。提高可转化性的愿望导致了更复杂的试验的发展和使用的增加,这些试验通常使用人体组织,试图更好地反映疾病的关键因素。然而,这也带来了其他挑战,因为这些检测方法往往不适合高通量实验。

最近个性化医疗的进展表明,尽管表面上有共同的表型,但患者的疾病可能在过程层面上有所不同。在更大的患者群体中,可以根据相似的分子基础来定义特定的亚群,而这些分子基础在各亚群中是不同的。在药物发现的早期阶段,人们很少考虑同一疾病存在多种不同的机制基础,这也是导致模型系统的实验结果缺乏可转化性的另一个突出因素。

在本文中,我们描述了一种明确涉及人类疾病复杂性的早期药物发现方法。这种方法将基于网络生物学的计算方法与基于细胞的复杂表型实验相结合。这种计算和实验相结合的方法旨在结合各自的优势,建立一个"两全其美"的过程。本文将概述基于网络的疾病过程描述的概念基础,以及如何在这些基础上开发一个实用的药物发现方法。还将介绍以具体药物发现项目结果的形式进行的验证。

2 网络生物学和药理学

网络生物学旨在描述和解释细胞和器官的行为,假设稳定的功能来自相互作用的分子网络。生物过程产生于细胞内多种蛋白质、内在小分子等的相互作用,而这些又受到细胞外信号的调控。这些细胞内和细胞间的相互作用网络,以及在其上运行的动态过程,可以被看作是细胞、组织和器官中生物功能的分子基质 (substrate),网络作为分子水平和表型之间的机械性桥梁。

在细胞内,相互作用的网络模块是细胞系统的子模块,形成表型粒度的基本水平。一个细胞过程对扰动有弹性,对其单个分子成分的随机失败有鲁棒性。这样的过程又可以在多个层面与其他过程相互作用,产生更复杂的表型。在疾病方面,网络已被成功用于阐明不同疾病状态的机制基础。

药物 (通常) 通过与内源性配体或底物竞争蛋白质靶点的结合位点而发挥作用。靶点契合导致构象变化,影响靶点与伙伴蛋白的相互作用,从而产生多个蛋白和其他效应物的级联下游调节,影响信号转导、放大、整合和多样化。我们认为,稳定的表型源于特定蛋白质集合的协调网络活动,从而产生个体细胞功能。虽然这种网络结构带来了功能的稳健性,但这些网络还需要能够受到外部信号的影响。所有这样的网络都包含一组关键的蛋白质,它们可以触发状态变化,从而改变它们的表型行为,以应对相关的外部信号。

对于任何对功能子网络产生重大影响的外部干预,如果目标是调节感兴趣的生物学功能并因此改变表型行为,则干预引起的多个下游调节必须最终影响该子网络中的关键蛋白质。一般来说,干预的下游后果,即”效应物特征",可以说是真正的药理干预,它可以调节网络的运行。为了理解药物效应,我们需要考虑这种特征对其所作用的网络的影响。这种”远距离作用”的概念在图1中得到说明,并在下面进一步探讨。

图1 一个细胞的风格化表示,说明了细胞内的子网络。

外部信号A在B处被检测到,在C处被转导,反过来被D调控。启动的网络只有通过扰乱至少两个关键蛋白P1和P2才能成功控制或破坏。任何其他的干预措施都没有什么效果,因为该网络对大多数的扰动是稳健的。

生物子网络的三个特点

图1说明了细胞药理学背景下的生物子网络的三个特点:

需要多种特定的扰动输入来改变稳定的子网络行为,而大多数输入的影响非常小

单一靶点调节可以实现多重扰动。有效的单一靶点调节通过正常的药理信号传导机制转化为下游的多蛋白特征。

有效的靶点不需要在感兴趣的网络内,但其下游效应物的特征必须在网络内,这就是正文中描述的远距离行动的概念。

3 对药物发现的影响

当我们用药时,我们的目的是在疾病状态下以一种有益的方式改变表型。如果从上述网络生物学的角度来看,这就意味着对网络模块的扰动可以显著影响目标表型。从寻找能够影响表型的药物,到寻找能够扰乱潜在的、基于网络机制的药物,这种概念上的转变有许多影响。

3.1 网络识别

网络驱动的药物发现方法的第一阶段是制定干预策略假设。这涉及到对生物过程的识别,对这些过程的扰动可能会对疾病的发展产生有益的影响。

假设的产生可以从两个方向进行。现有的疾病生物学知识,以及疾病的病理生理学进展,可以用来确定这些过程。然后可以收集和分析数据以构建这些过程的基础网络。此外,来自疾病与正常组织的分子分析测量结果可用于生成网络,然后对其进行分析,以确定其体现的过程。

对不同药物反应的分子基础的研究进展突出表明,在总体表型水平上具有明显相似疾病的患者可以被划分为具有不同分子机制的群体。虽然这经常是基于少数受体蛋白的不同表达模式,但在系统层面上往往存在差异,反映在更大的蛋白质集合上。具有相同疾病表型的不同亚组患者可以有不同的功能机制 (有时称为内型) 或生物过程来驱动疾病。

在这样的疾病背景下,给定一个合适的分子分析测量集合,与特定机制亚群相关的网络模块可以被识别,并用于识别亚群特定的生物过程,从而推动发现。

3.2 功能冗余

复杂生物系统的一个关键属性是表型的稳健性和表型的适应性看似矛盾的共存。这样的系统对外部和内部的变化都很稳健 (例如,它们在面对多种基因突变时仍能发挥作用),但也能适应 (例如,对外部输入的特定模式作出动态反应,产生对进化至关重要的表型多样性)。这种稳健性和适应性并存的机制基础被认为是简并 (degeneracy) 或功能冗余 (functional redundancy)即相同的生物功能可以通过结构上不同的机制来实现。

生物稳健性的机制也可以赋予疾病系统以稳定性,导致治疗干预的疗效低于预期,或对药物的适应性。明确考虑生物稳健性和适应性所依据的系统级属性,对于识别复杂疾病的成功疗法至关重要。

作为一个说明性的类比,考虑伦敦的交通系统,其中”感兴趣的表型”被定义为”从东到西穿越伦敦"。牛津广场是该路径中的一个关键节点。然而,如果工程建设关闭了牛津广场,人们仍然可以穿越伦敦。人们会选择其他路线,如环形线、公共汽车,甚至步行。这些替代路线为交通系统提供了功能冗余。

在药物发现的网络生物学的背景下,这意味着表型的网络模型应该明确地纳入感兴趣的细胞表型的冗余和简并。因此,在构建过程中,不应着眼于对经典途径和网络的准确表述,而应额外地捕捉非经典途径、途径与途径之间的相互作用等所反映的简并结构。

3.3 网络扰动

生物网络已被证明对随机扰动具有鲁棒性,但也能做出动态反应并适应特定刺激。这些特性为将网络视为分子和表型水平之间的机械性桥梁的论点提供了重要依据:分子网络是最简单的组织水平,在这个水平上开始出现可识别的表型特性。药物发现的目的是找到能够显著扰乱目标表型所依据的强大网络的药物。在这种情况下,一个关键的考虑因素必须是确定网络节点 (如蛋白质),鉴于生物网络的复杂性,识别这样的节点集远非易事,是网络科学界的一个活跃的研究领域。

网络的扰动可以用许多不同的措施来评估,但通常涉及对干预 (如删除一个节点) 后网络的一些结构的变化进行量化。通常使用的措施有:网络直径的变化和最大连接部分的大小。专注于网络的结构方面,而忽视在这些网络上运行的动态过程,是一种简化,但也是一种有用和实用的简化,特别是由于网络动态受到网络结构的显著制约。随着测量蛋白质-蛋白质相互作用的高技术的发展,细胞内相互作用形式的结构数据在整个蛋白质组范围内都可以得到。可用于约束动态过程模型的信息,如分子反应的时间常数的细节,则要少得多。

3.4 远距离行动

如上所述 (如图1所示),药理干预的分子效应应被认为是完整的下游”效应物特征"。在网络驱动的药物发现中,这意味着我们要寻找的药物,其下游效应物特征是一组蛋白质,这些蛋白质的集体扰动将显著影响目标表型的网络。这也意味着潜在的药物靶点不需要是负责目标生物功能的网络的一部分 (尽管它们显然可以在一定距离内影响它)。药物可以通过信号或代谢途径产生”远距离作用",将药物结合事件转化为下游功能效应。在确定可能的靶点和/或治疗药物时,必须考虑这种”远距离作用"。这种概念上的完善与早期的一些概念 (但仍很普遍) 形成对比,在这些概念中,通过简单的节点指标 (如程度、间隔度) 确定效应器网络中的靶点,通过多向药理学提出多点干预,并且不考虑信号传导和远距离作用作为干预范式的一部分。

4 网络驱动的药物发现

E-therapeutics公司基于前面概述的原则,开发了一种网络驱动的早期药物发现方法。从感兴趣的疾病或生物学开始,该方法提供了多种途径来识别和阐明适合治疗干预的新型生物学和化学。

一个信息学平台已经被开发出来,以使这种网络驱动的方法得以运行。该平台由一些特定领域的数据库和专有的网络分析方法组成,它们的组合是专门为解决上述问题而设计的。内部数据库包括以网络为重点的大量经验数据源的整合,以及使用预测方法 (如机器学习) 得出的数据。预测模型的重点是专门解决经验数据集的偏差,并提供目前可用的经验数据所不能覆盖的化学和生物领域。

网络驱动的发现过程被特意设计为统计性质,以解决众所周知的生物数据的噪声和不可复制性问题。这些统计学上的考虑被应用于平台和发现过程的多个地方。例如,在处理蛋白质相互作用数据时,我们通常不对高置信度的边缘进行过滤,因为这可能会在随后的网络分析中引入假象。相反,我们接受网络中存在假阳性边缘,并设计分析方法和使用这些分析方法的过程。根据我们的经验和实验室测试的结果,在平台内使用了多种统计学空模型。

我们方法的统计学方面在过程层面上体现得最为明显,输出是富含活性成分的实体 (化合物、蛋白质靶点、生物过程等) 的排序列表。然后通过经验性的测试,从这些概率性的列表中确定实际的活性元素。这种富集使得在筛选阶段可以使用复杂的、高鉴别性的表型检测。这种检测的低通量意味着它们对于盲目的高通量方法是不可行的,但网络驱动的方法通过实质性地提高命中率 (见下文)。

在一个特定的兴趣领域,该平台可以以多种方式使用,这取决于项目的具体因素,如期望的产出 (化合物、靶点、过程) 、数据的可用性和类型以及是否寻求遗传验证。应用多种不同但概念一致的方法,可以避免过度依赖一组数据、生物假设或概念性假设,从而提高成功的概率。

网络驱动的方法的主要内容可以总结如下。

机制性假设的产生。使用人类组织来源的数据进行网络生成和分析,可以围绕适合相关疾病背景的生物过程提出新的机制性假设。为测试这些假设而设计的基于细胞的表型试验可以被确定或提出,最好是利用促使最初网络构建的同一人体组织。在这一阶段,也可以考虑亚组的具体机制,以建立针对机制上定义的病人亚组的网络模型。

活性化合物鉴定和靶点解构。在一个类似于表型筛选的方法中,该平台可以识别预测在感兴趣的生物学领域具有活性的化合物。这些化合物是通过网络分析方法确定的,这些方法确定了一个化合物是否有很大的潜力,通过其下游效应物特征,扰乱代表相关生物过程的网络。在药物化学驱动的筛选过程之后,这些化合物在反映靶点生物学的基于细胞的表型检测中进行测试。确定的活性物质可以作为药物化学项目的起点和/或作为进一步研究生物学的工具化合物。重要的是,该方法允许筛选相对较少的化合物 (300-1000个),同时产生足够高的命中率 (2-12%)。这有利于快速执行表型驱动的发现计划的初始阶段。与盲目的表型筛选相比,使用网络驱动的方法鉴定的活性化合物在分子和网络水平上有额外的相关信息。这些信息可以用来帮助进行靶点解构和作用方式的鉴定。

靶点识别和验证。除了表型方法外,该平台还可用于驱动基于靶点的方法。如上所述,靶点应被认为是指其调制可产生下游效应物特征的蛋白质,能够对网络 (因此也是表型) 进行重大扰动。我们根据这些原则开发了一种网络驱动的靶点识别方法,可以识别有可能对感兴趣的网络产生远程、下游影响的蛋白质。该方法将网络影响分析的概念与药理学上的衡量标准结合起来,以捕捉蛋白质对感兴趣的网络产生下游影响的潜力。这些基于网络的衡量标准与更传统的衡量标准相结合,如可药性、组织和/或细胞表达等,以产生可能靶点的排名列表。然后,这些靶点在反映感兴趣的生物学的基于细胞的试验中得到验证。

人类遗传学证据。最近的分析强调了人类基因验证作为药物发现成功的预测因素的作用,使用基因验证靶点的项目在临床试验中成功的可能性高达两倍。然而,一项扩展的分析,结合了更多的最新数据,说明了从OMIM数据库 (孟德尔疾病) 获得的遗传证据与GWAS研究 (复杂疾病) 之间的差异。该分析反映了最近关于GWAS研究普遍缺乏生物洞察力的评论。

为了解决大规模群体遗传学数据缺乏可操作性的问题,我们开发了一种基于网络的方法来分析和使用早期药物发现中的此类数据。该方法遵循前面讨论的核心原则,即就细胞表型而言,基本的分子单位是一个网络模块,而不是一个基因或蛋白质。该方法有助于识别与疾病易感性相关的生物过程和途径。通常情况下,这些过程仅通过GWAS分析是无法识别的,只有当数据被置于网络环境中进行分析时才会显现。与复杂疾病易感性有关的生物过程不一定是直接治疗干预的合适靶点。然而,它们可以与更广泛的疾病机制和进展的知识一起使用,以产生遗传学上的干预假设。此外,关键蛋白分析可用于为从上述表型和/或靶点驱动的方法中获得的靶点提供人类遗传支持,本质上是将这些机制上确定的靶点置于特定的疾病背景中

5 验证

本文所述的网络驱动的早期发现方法已经通过在一系列复杂的生物和治疗环境中的实际药物发现项目中的部署得到了验证。肿瘤学、免疫学、免疫肿瘤学、神经变性、病毒性疾病、纤维化和代谢方面的项目已经在计算阶段取得了进展,并随后在实验室进行了研究。这些不同项目的进展可以归纳为几个关键的成果。

几个关键成果

每个项目的一个标准部分是利用已知的活性化合物和/或相关靶点进行回顾性验证。

被预测为有活性的化合物在基于细胞的试验中进行测试。从相对较小的化合物范围 (测试了300到1000个化合物) 中观察到2%到12%的命中率 (比盲目表型筛选高2个数量级)。

所有的程序都产生了多种活性化学类型。

来自活性化合物的计算来源的数据和信息,结合补充性的额外分析,被用来帮助解构作用机制。

识别靶点的网络感知方法产生了特定疾病背景下的新靶点,并能够通过额外的数据进行验证。

基于网络的人类基因数据分析能够在特定的疾病领域提供新的靶点假设,并为通过其他网络驱动的方法确定的靶点提供基因支持。

以上几点总结了一系列治疗领域的项目的成功结果。为了补充这些一般要点,我们总结了最近一个项目的成果,该项目旨在确定治疗COVID-19疾病的新型药物。

5.1 COVID-19

在以前的抗病毒工作的基础上,我们利用我们的网络生物学平台,试图识别出临床阶段的化合物,这些化合物无论是单独还是组合,都可以被迅速地重新利用来治疗COVID-19。

这个项目与我们以前的工作不同,它的目的是确定可以单独或结合使用的现有化合物。计算平台能够迅速扩展以实现所需的分析,突出了网络驱动方法和实施该方法的计算平台的灵活、敏捷的性质。

在以前的一个项目中,我们利用SIRS (系统性炎症反应综合征) 的网络模型,如败血症,确定了一类小分子化合物、一种机制和靶点,能够抑制人类免疫细胞对一系列炎症触发因素产生的”细胞因子风暴"。

我们平台预测的小分子化合物在经过验证的SARS-CoV-2体外实验中进行了测试。这些化合物具有强大的抗炎活性,也表现出强大的抗病毒活性,证实了我们基于网络的预测。这种活性可以推广到其他α和β冠状病毒。

6 总结

本文概述了一个概念框架,其中网络生物学是单个分子实体和出现的功能表型之间的连接桥梁。这个框架与目前药理学的理解是一致的,并通过提供基质 (网络模块) 来增强现有范式,从而使表型的特性 (稳健性、弹性、适应性) 作为结果出现。这一范式也使我们能够认识到”内型”的基础,在这个基础上,一个共同的疾病表型可以在网络模块水平上根据功能障碍进行区分,蛋白质成员的个体遗传变异被归入过程水平上的子过程的表型。

我们还描述了一个网络生物学驱动的药物发现方法的基本轮廓和验证,该方法虽然与疾病无关,但特别适用于复杂的疾病,此外还允许解释和部署复杂的和迄今很少利用的遗传数据,如来自群体遗传学的数据。我们希望,随着时间的推移,这一概念框架和基于这一框架的实际治疗方法将有助于解决医学中仍未得到满足的巨大需求。

参考资料

Wray J, Whitmore A. Network-Driven Drug Discovery. Methods Mol Biol. 2022;2390:177-190. doi: 10.1007/978-1-0716-1787-8_7.

--------- End ---------

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-05-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智药邦 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档