前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >Briefings in Bioinformatics | 一种提高蛋白质-小分子对接和筛选准确性的评分函数

Briefings in Bioinformatics | 一种提高蛋白质-小分子对接和筛选准确性的评分函数

作者头像
DrugAI
发布于 2022-04-19 02:29:44
发布于 2022-04-19 02:29:44
1.1K0
举报
文章被收录于专栏:DrugAIDrugAI

近日,深圳先进院-上海智峪生科-深圳超算-南洋理工联合团队在《Briefings in Bioinformatics》(影响因子IF=11.622)上发表了题为“Improving protein–ligand docking and screening accuracies by incorporating a scoring function correction term”的论文。该论文提供了一种新的蛋白质-小分子对接评分函数的设计思路,即结合对小分子对接构象的偏差估计作为传统评分函数的修正项,可以显著提升分子对接和筛选的精度,对于小分子药物设计和筛选有着重要意义。本文通讯作者是南洋理工大学慕宇光教授和深圳先进技术研究院魏彦杰研究员,第一作者是郑良振博士(智峪生科小分子算法负责人、深圳先进院联合培养博士后)

图1

1背景介绍

评分函数(scoring function)是蛋白质-小分子对接和筛选中的关键要素。传统的评分函数,通常是基于经验函数或分子力场的,又或者是基于统计模型的。比较成功的评分函数有GlideScore[1]和AutoDock Vina score[2]。这些评分函数已被证明有助于小分子的药物筛选和设计。这些传统评分函数的主要优势包括(但不限于)以下几点:1)计算速度快,能够实现超大规模虚拟库的筛选。2)稳健性相对较好,对于不同类型的靶点的筛选都能有一定的小分子富集率。

但是,随着蛋白质-小分子结构和亲和力数据库的持续扩增,让机器学习深度学习也逐渐在评分函数设计上有了比较好的应用空间。例如,比较早期的RFscore和NNscore模型及其改进版本,以及近年来日渐增加的深度学习模型如AtomNet,Pafnucy[3],RoseNet[4]和OnionNet[5]等模型。基于蛋白质-小分子的晶体结构的数据集训练的亲和力预测模型往往并不能在筛选应用上获得较好效果,因此更多模型开始引入小分子的对接构象作为训练数据。

这些机器学习/深度学习模拟可以在更大规模数据上,学习到蛋白质-小分子相互作用的非线性关系,以及相互作用的模式和强度,使得这些数据驱动的模型有更强大的表征能力和更大的应用前景。随着以AlphaFold2为代表的蛋白质结构预测算法的成功,未来围绕蛋白质结构的小分子筛选和设计可能会从中受益,因此持续研究蛋白质-小分子在三维结构层面相互作用模式和强度也有了可期的前景。

2方法介绍

虽然已有多种基于高度精确的深度学习或机器学习的评分功能(如Gnina中的3DCNN的构象精度预测模型[6]和DeepBSP的预测模型[7]),但它们在对接和筛选方面的直接应用比较有限。传统评分函数关注晶体结构中,蛋白质-小分子的亲和力预测,而和上述的Gnina和DeepBSP模型类似,论文作者提出的OnionNet-SFCT模型关注的是小分子的对接构象和真实构象之间的偏差,并可以结合传统评分函数用于多种小分子相关应用场景。

具体来说,作者使用了PDBbind(v2018)[8]中的蛋白质-小分子复合物结构,以及基于这些蛋白质-配体复合物使用iDock生成的对接构象作为ML评分模型开发的训练、验证和测试集,同时还结合了其他分子对接和筛选的数据集如CASF-2016[9]以及DUD-E[10]和DUD-AD[11]。

图2

OnionNet-SFCT模型[12]通过显性的原子-氨基酸相互作用描述,使用基于Adaboost的随机森林模型,来拟合蛋白质-小分子的结合模式和真实状态之间的偏差(RMSD)。这种考虑蛋白质的氨基酸到小分子不同元素类型的相互作用,可以分层到不同的距离范围,从而同时增加了特征的数量和信息的丰富度。

这种特征描述的最早原型是RF-score[13]中,蛋白质不同元素类型和小分子元素类型的接触数统计量。后面演变成OnionNet中,蛋白质-小分子的不同元素类型组合的接触数在不同的距离截断范围的统计量,以及更近一步的OnionNet2[14]中,蛋白质氨基酸类型和小分子元素类型组合的接触数在不同距离截断范围的统计量。这种原子层面的统计量的主要优势是计算速度快,可解释性强,且能够抓住比较典型的蛋氨基酸-原子相互作用的局域相互作用模式(如图3)。而且还有一个非常重要的特点是,这种特征描述可以对原子坐标可导。这种可导的特征可能是将来基于神经网络的小分子构象优化的基础,有着比较重要的意义。

图3.蛋白质氨基酸和不同元素类型小分子原子的特征重要性

同时,作者发现现有模型对于近真实状态(near-native)的偏差预测不如传统算法,但是对于整体大范围的构象偏差预测则更准确。所以,该模型可以很好地和传统方法进行整合,来作为一种有益的修正(如下方程1)。

其中,P(R)是对构象预测的偏差(OnionNet-SFCT预测值),S(R)是传统评分函数的能量值(如来自AutoDockVina的能量)。这种组合的优势是,将OnionNet-SFCT预测值作为修正项可以保证在小分子构象若很大的偏差范围,可以被OnionNet-SFCT检查和预测得出,从而使得整体能量预测E(R)更合理。

3结果描述

3.1模型在分子对接上面的表现

单独使用OnionNet-SFCT评分能量,不能显著提高重对接性能,甚至还有所下降,然而如果将OnionNet-SFCT作为传统对接评分函数的能量修正项,可以在多个数据集上提升分子对接的成功率。例如,OnionNet-SFCT修正Vina之后,可以在交叉对接(cross-docking)任务上将top1构象的RMSD平均降低0.736埃,而且可以将top1构象的成功率提升10.6个百分点(图4)。同时,基于标准测试集CASF-2016,OnionNet-SFCT修正Vina之后,在对接成功率上也有很好的表现。

图4.分子对接效果的比较

3.2模型在小分子筛选上面的表现

除了对接能力,筛选能力是评分功能评估的另一个评估指标。在CASF2016标准测试中,OnionNet-SFCT+Vina在达到了15.5的最高平均富集系数(Enrichment Factor at 1% ratio),是Vina分数本身(7.7)的两倍,也远高于商业软件GOLD和薛定谔Glide(图5)。

图5.模型在CASF-2016数据集上的表现

另一个筛选相关的测试集是DUD-E。该测试集旨在公平地比较用于筛选的不同的评分函数。某些评分函数在训练的时候,会部分使用该数据集的数据,并用剩余的数据进行测试,这种类型的训练和评估将促使评分函数记住“活性”分子而忽略蛋白质本身,从而引入了潜在的隐藏偏差(Bias)。而DUD-AD测试集则和DUD-E共用靶点结构(102个),并使用其他(101个)靶点的活性分子作为该靶点的非活性分子(decoys),因此可以比较好的改善这种bias。结果表明,相对于原来的评分函数,OnionNet-SFCT修正的Vina评分函数或OnionNet-SFCT修正的Gnina评分函数对于筛选任务更为准确。相比于重对接和交叉对接任务的性能提升,在筛选的关键指标富集因子(EF1%)性能提升更为显著(图6)。

图6

3.3模型在反向筛选上的潜在应用

最后,作者用植物激素脱落酸(ABA)作为例子,来说明OnionNet-SFCT模型的潜在应用价值。在拟南芥全蛋白质组(约2.7万个蛋白质)的脱落酸反向对接任务中,OnionNet-SFCT+Vina评分方案在排名前10位的蛋白质中检测到4个已知靶点(有14个已知的ABA天然靶点),相比之下,在排名前10位的蛋白质中,没有一个已知的靶点可以仅通过Vina评分确定。虽然这是仅仅是一个demo案例,但它展示了基于结构评分用于高通量高精度反向寻靶计算的巨大潜力。

4结语

该论文提出了一个基于机器学习的评分函数修正项(OnionNet-SFCT),以提高传统评分函数的对接和筛选性能。该模型可以和多个分子对接应用程序相结合,作为一种对接结果再评分的工具,可以提高小分子构象选择的准确性和筛选能力,这表明它可以广泛用于基于结构的药物发现。在多个数据集上的结果表明,该模型是基于结构的药物发现的有用工具,有助于基于结构的药物发现精度和未来潜在的靶点寻找的效率。

全文链接

https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbac051/6548372

代码

https://www.github.com/zhenglz/OnionNet-SFCT.git

参考资料

[1]Verdonk M L,Cole J C,Hartshorn M J,etal.Improved protein–ligand docking using GOLD[J].Proteins:Structure,Function,and Bioinformatics,2003,52(4):609-623.

[2]Trott O, Olson AJ. AutoDock Vina: Improving the speed and accuracy of docking with a new scoring function, efficient optimization, and multithreading. J Comput Chem 2009;

[3]Stepniewska-Dziubinska MM, Zielenkiewicz P, Siedlecki P.Development and evaluation of a deep learning model for protein–ligand binding affinity prediction. Bioinformatics 2018;34:3666–74.

[4]Hassan-Harrirou H, Zhang C, Lemmin T. RosENet: Improving Binding Affinity Prediction by Leveraging Molecular Mechanics Energies with an Ensemble of 3D Convolutional Neural Net-works. J Chem Inf Model 2020;60:2791–802.

[5]Zheng L, Fan J, Mu Y. OnionNet: a Multiple-Layer Intermolecular Contact-Based Convolutional Neural Network for Protein–Ligand Binding Affinity Prediction. ACS Omega 2019;4:

[6]LeCun Y, Bengio Y, Laboratories TB. Convolutional Networks for Images, Speech, and Time-Series, Vol. 14.

[7]Bao J, He X, Zhang JZH. DeepBSP-a Machine Learning Method for Accurate Prediction of Protein-Ligand Docking Structures. J Chem Inf Model 2021;61:2231–40.

[8]http://www.pdbbind-cn.org/download/pdbbind_2018_intro.pdf

[9]Su M, Yang Q, Du Y, et al. Comparative Assessment of Scoring Functions: The CASF-2016 Update. J Chem Inf Model 2019;59:895–913.

[10]Mysinger MM, Carchia M, JohnJ I, et al. Directory of Useful Decoys, Enhanced (DUD-E): Better Ligands and Decoys for Better Benchmarking. J Med Chem 2012;55:6582–94.

[11]Chen L, Cruz A, Ramsey S, et al. Hidden bias in the DUD-E dataset leads to misleading performance of deep learning in structure based virtual screening. PLOS ONE 2019;14:e0220113.

[12]OnionNet-SFCT模型 :https://www .github.com/zhenglz/OnionNet-SFCT .git

[13]El-Hachem N, Haibe-Kains B, Khalil A, et al. AutoDock and AutoDockTools for Protein-Ligand Docking: Beta-Site Amyloid Precursor Protein Cleaving Enzyme 1(BACE1) as a Case Study.Neuroproteomics 2017;1598:391–403.

[14]Wang Z, Zheng L, Liu Y, et al. OnionNet-2: A Convolutional Neural Network Model for Predicting Protein-Ligand Binding Affinity based on Residue-Atom Contacting ShellsArXiv210311664 QBio. 2021.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-04-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
JCIM|MILCDock:用于药物发现中虚拟筛选的机器学习一致性对接
2022年11月7日,美国杨百翰大学的Dennis Della Corte团队在Journal of Chemical Information and Modeling上发表文章MILCDock: Machine Learning Enhanced Consensus Docking for Virtual Screening in Drug Discovery。
智药邦
2023/02/14
7360
JCIM|MILCDock:用于药物发现中虚拟筛选的机器学习一致性对接
Brief. Bioinform. | 蛋白质-小分子复合物结合强度和配体结合姿态一体预测的深度学习框架
基于结构的药物设计中一项重要的任务是预测配体在靶体口袋中的结合姿态,然而当前已报道的打分函数通常受限于精度,或是局限于单一的输出,比如仅预测构象姿势的偏差(RMSD),结合强度(pKd)或是基于残基-原子间距离分布的统计势。本文介绍的是近期发表在国际知名生物信息学期刊《Briefings in Bioinformatics》上的一篇题为《A New Paradigm for Applying Deep Learning to Protein-Ligand Interaction Prediction》的研究论文。该论文提出了一种同时预测蛋白质-配体复合物结合强度及配体结合姿态偏差RMSD的打分框架IGModel。论文的第一作者是智峪生科助理研究员王泽琛(山东大学物理学院博士在读),共同通讯作者是郑良振博士(智峪生科-深圳先进院联合实验室)和李伟峰教授(山东大学物理学院)。
DrugAI
2024/04/14
7960
Brief. Bioinform. | 蛋白质-小分子复合物结合强度和配体结合姿态一体预测的深度学习框架
JCIM|DENVIS:使用具有原子和表面蛋白口袋特征的图神经网络进行可扩展和高通量的虚拟筛选
2022年9月26日,希腊DeepLab的Krasoulis等人在Journal of Chemical Information and Modeling上发表文章。作者提出了DENVIS(DEep Neural VIrtual Screening),一种使用具有原子和表面蛋白袋特征的图神经网络进行可扩展和高通量虚拟筛选的新型算法。DENVIS使用原子和表面特征的组合进行蛋白质口袋建模,实现了具有竞争力的先进的虚拟筛选性能。
智药邦
2022/11/16
7210
JCIM|DENVIS:使用具有原子和表面蛋白口袋特征的图神经网络进行可扩展和高通量的虚拟筛选
Nat. Mach. Intell. | “数据+知识+AI” 解锁新靶标药物虚拟筛选
精准的评估蛋白质-配体相互作用对药物发现至关重要。然而,开发可靠的评估方法一直是学术界和工业界的长期挑战。近年来,人工智能技术在该领域已经取得了显著进展,以AlphaFold为代表的深度学习方法在蛋白质三维结构,蛋白质-配体复合物结构预测方面表现卓越。但是,在新靶标的药物虚拟筛选场景中,高精度的活性预测评分方法仍然非常匮乏。许多研究表明,深度学习模型倾向学习数据中的分布偏差,对分布内的数据可以给出很好的性能指标。但在实际应用中,尤其面对训练集未见的新靶标和化学多样性空间,却无法展现出良好的泛化效果。
DrugAI
2024/06/18
2830
Nat. Mach. Intell. | “数据+知识+AI” 解锁新靶标药物虚拟筛选
蛋白组学—两个蛋白质之间的分子对接
首先在https://www.uniprot.org/中搜索相关基因,如VTN,选择对应的种属,点击Entry编号,uniprot中可以直接跳转PDB数据库https://www.rcsb.org/(也可以复制编号,直接去PDB数据库中去检索),同理下载SLPI的最佳蛋白质结构。
sheldor没耳朵
2024/11/06
1.2K3
蛋白组学—两个蛋白质之间的分子对接
Drug Discov Today|配体-蛋白的分子对接中的机器学习
2021年9月21日,Drug Discovery Today杂志在线发表文章,文章概述和讨论了配体-蛋白的分子对接中机器学习(尤其是深度学习)的应用。
智药邦
2021/11/10
1.7K0
Drug Discov Today|配体-蛋白的分子对接中的机器学习
Brief Bioinform|基于深度学习和传统打分函数的配体构象优化框架
2022年12月10日,山东大学物理学院李伟峰、智峪生科郑良振、南洋理工大学生物科学学院慕宇光等人在Brief Bioinform杂志发表文章A fully differentiable ligand pose optimization framework guided by deep learning and a traditional scoring function。
智药邦
2023/02/14
6710
Brief Bioinform|基于深度学习和传统打分函数的配体构象优化框架
DrugVQA | 用视觉问答技术预测药物蛋白质相互作用
鉴定新的药物-蛋白质相互作用对于药物发现至关重要,基于机器学习的方法利用药物描述符和一维(1D)蛋白质序列已经开发了许多鉴定方法。这些方法一般都是通过将配体,蛋白质及其相互作用的信息整合到一个统一的框架中,将是否存在相互作用的预测作为二元分类的任务。
DrugAI
2021/01/29
9340
DrugVQA | 用视觉问答技术预测药物蛋白质相互作用
Bioinformatics|具有图和序列的神经网络的端到端学习的化合物与蛋白质相互作用预测
这次给大家介绍Masashi Tsubaki教授的论文“Compound-protein Interaction Prediction with End-to-end Learning of Neural Networks for Graphs and Sequences”。关于化合物与蛋白质的相互作用 (Compound-Protein Interactions ,CPIs)预测的相关问题是当今药物研发的重要课题,能更高效准确的预测 CPI,对生物科研、化学实验和日常制药都会大有益处。Masashi Tsubaki教授现有模型处理不平衡数据集(即包含少量的正样本(即相互作用)和大量的负样本(即不相互作用)的数据集)的不良性能问题。基于此问题,Masashi Tsubaki教授将GNN(Graph Neural Network,图神经网络)和CNN(Convolutional Neural Network,卷积神经网络)引入 基础分类器模型并加入注意力机制调控,提出一种具有图和序列的端到端神经网络模型,通过端到端表示学习在平衡和不平衡数据集上实现更强大的性能,在某些方面了优化CPI的预测。
智能生信
2021/02/04
1.1K0
复旦大学朱思语/漆远等:蛋白质动态结构预测模型AlphaFolding
蛋白质的功能很大程度上取决于其3D结构。19世纪中期,科学界普遍认为蛋白质结构是固定的、刚性的,类似锁与钥匙模型 (lock-and-key model),即蛋白质与配体的结合是由固定的三维结构决定的。然而,当Daniel Koshland提出酶与底物结合时会发生构象变化的观点后,传统思维开始受到挑战。
智药邦
2025/02/19
1910
复旦大学朱思语/漆远等:蛋白质动态结构预测模型AlphaFolding
J. Chem. Inf. Model. | 基于序列和基于结构的蛋白质-配体相互作用机器学习方法
开发新药既昂贵又耗时。准确预测药物和靶标之间的相互作用可能会改变药物的发现方式。基于机器学习的蛋白质-配体相互作用预测已经显示出巨大的潜力。本文重点对基于序列和基于结构的蛋白质-配体相互作用机器学习方法进行了总结。因此,本文首先概述了该领域应用的数据集,以及用于表示蛋白质和配体的各种方法。然后,利用基于序列和基于结构的分类标准对经典机器学习模型和深度学习模型进行分类和总结,用于蛋白质-配体相互作用的研究。此外,还提出了这些模型的评价方法和可解释性。此外,深入探讨了蛋白质-配体相互作用模型在药物研究中的各种应用。最后,讨论了该领域目前面临的挑战和未来的发展方向。
DrugAI
2024/03/07
9960
J. Chem. Inf. Model. | 基于序列和基于结构的蛋白质-配体相互作用机器学习方法
腾讯团队提出Interformer模型,通过相互作用感知进行蛋白质-配体对接亲和力预测
近年来,深度学习模型在蛋白质-配体对接和亲和力预测中的应用引起了越来越多的关注,这种应用对于基于结构的药物设计至关重要。然而,许多这些模型忽略了复合物中配体和蛋白质原子之间相互作用的复杂建模,从而限制了它们的泛化和可解释性的能力。
智药邦
2024/12/23
3740
腾讯团队提出Interformer模型,通过相互作用感知进行蛋白质-配体对接亲和力预测
Nat. Mach. Intell. | 多尺度拓扑Transformer用于蛋白质-配体相互作用预测
今天为大家介绍的是来自美国密歇根州立大学的Guo-Wei Wei团队的一篇论文。尽管预训练的自然语言处理(NLP)模型在各个领域取得了成功,但它们在计算生物学中的应用受到了阻碍,因为它们依赖于生物序列而忽略了重要的三维(3D)结构信息,这与NLP模型的序列架构不兼容。在此,作者提出了TopoFormer,该模型通过整合NLP模型和一种多尺度拓扑技术——持久拓扑超图拉普拉斯(PTHL)构建而成。PTHL能够系统地将复杂的3D蛋白质-配体复合物在不同的空间尺度上转换为NLP可接受的拓扑不变量和同伦形状序列,捕捉跨越不同空间尺度的基本相互作用。TopoFormer在多个基准数据集中的评分、排序、对接和筛选任务中表现出了出色的准确性和卓越的性能。这种方法可以用于将一般的高维结构数据转换为NLP兼容的序列,为更广泛的基于NLP的研究铺平了道路。
DrugAI
2024/07/30
1850
Nat. Mach. Intell. | 多尺度拓扑Transformer用于蛋白质-配体相互作用预测
利用AutoDock进行水分子参与的分子对接
水分子在配体-蛋白质相互作用中的作用至关重要,AutoDock开发小组的研究人员设计了一种新的力场,可以优化水分子参与的分子对接,使得AutoDock程序能够自动预测水分子介导的配体蛋白结合方式,该力场考虑了离散水分子对配体结合的熵和焓贡献,提高了能量估算精度和对接性能。该方法无需事先知道蛋白与水分子的水合状态,在基于结构的药物发现过程中具有较大的应用价值。本文对AutoDock的水合对接方法的精度进行了总结,并且提供了如何利用最新版AutoDock进行水分子参与的分子对接教程。
智药邦
2022/04/13
1.4K0
利用AutoDock进行水分子参与的分子对接
蛋白质-配体结合亲和力预测:是否需要3D结合姿态?
今天为大家介绍的是来自Degui Zhi团队的一篇论文。准确预测蛋白质-配体结合亲和力在药物发现中至关重要。现有方法主要是不涉及对接的,当无法获得结晶的蛋白质-配体结合构象时,这些方法并未明确考虑蛋白质与配体之间在原子级别的相互作用。作者引入了一个框架——折叠-对接-亲和力(FDA)。该框架折叠蛋白质,确定蛋白质-配体的结合构象,并从三维蛋白质-配体结合结构预测结合亲和力。实验表明,FDA在DAVIS数据集中的表现超越了现有的最先进的无对接模型,展示了明确模拟三维结合构象对提高结合亲和力预测准确性的潜力。
DrugAI
2024/06/04
2800
蛋白质-配体结合亲和力预测:是否需要3D结合姿态?
MIT 最新研究:AlphaFold 蛋白质预测能力太差,目前利用价值还很低
作者 | 李梅、黄楠 编辑 | 陈彩娴 2018 年,Deepmind 首次发布基于深度神经网络的蛋白质结构预测数据库 AlphaFold,在蛋白质预测中实现了最先进的性能;去年,AlphaFold 2 获得了 98.5% 的蛋白质预测率;前段时间,Deepmind 又重磅发布了数据集更新,称目前的 AlphaFold 已经预测了几乎所有已知的蛋白质。 如何有效识别药物作用机制在今天仍然是一个巨大挑战,计算对接的方法已被广泛用于预测药物结合靶点。有了大规模蛋白质结构预测技术,药物发现将变得更容易。所以,自
AI科技评论
2022/09/09
7220
MIT 最新研究:AlphaFold 蛋白质预测能力太差,目前利用价值还很低
J. Chem. Inf. Model. | 预测蛋白质-肽相互作用:基于深度学习技术的基准测试和与对接的比较
今天为大家介绍的是来自Michel F. Sanner团队的一篇论文。深度学习(DL)方法在预测蛋白质结构方面取得的准确性进展,以及它对结构生物学产生了深远影响。AlphaFold2是一个DL方法,已经在预测蛋白质-肽相互作用方面进行了评估,结果显示其性能显著优于RoseTTAfold和传统的对接方法PIPER-FlexPepDock。随后,新的AlphaFold2模型专门用于预测多聚体组装,此外新的从头开始折叠模型OmegaFold也已经发布。作者评估了这些新的DL折叠模型在对接蛋白质-肽相互作用时的成功率,并将其与他们的最新专注对接软件AutoDock CrankPep (ADCP) 进行了比较。评估使用相同的数据集和性能度量标准来进行。
DrugAI
2023/10/31
8920
J. Chem. Inf. Model. | 预测蛋白质-肽相互作用:基于深度学习技术的基准测试和与对接的比较
J. Med. Chem. | 一种基于图表示学习的蛋白-配体相互作用打分方法InteractionGraphNet
本文介绍来自一篇浙江大学智能创新药物研究院侯廷军教授团队, 浙江大学计算机学院吴健教授团队,中南大学曹东升团队和腾讯量子实验室联合在药物化学领域权威期刊 Journal of Medicinal Chemistry发表的一篇文章。该文章提出一种新型的基于图表示学习的蛋白-小分子相互作用的打分方法InteractionGraphNet(IGN)。在IGN中,作者基于物理原理分别设计了独立的分子内图卷积和分之间图卷积模块来先后学习蛋白-配体复合物中的分子内相互作用和分子间相互作用,并将学习到的分子间相互作用应用于下游的任务预测, 包括蛋白-配体结合亲和力预测、大规模虚拟筛选以及小分子结合构象预测。实验结果表明,IGN模型的泛化性能均优于同类ML方法和分子对接程序。此外, 作者还用大量的实验表明IGN模型的优异性能并非是来自于学习数据集中的隐藏偏差,而是真正学习了蛋白-配体相互作用的一些关键特征。
DrugAI
2021/12/16
7980
J. Med. Chem. | 一种基于图表示学习的蛋白-配体相互作用打分方法InteractionGraphNet
J. Med. Chem.|TocoDecoy:针对机器学习打分函数训练和测试的无隐藏偏差的数据集构建新方法
本文介绍一篇来自浙江大学侯廷军教授课题组、中南大学曹东升教授课题组、和腾讯量子实验室联合发表的一篇文章。该文章提出了一种用于机器学习打分函数(machine-learning scoring functions, MLSFs)训练和测试的无隐藏偏差(hidden bias)数据集构建新方法。该方法引入四种技巧来消除隐藏偏差,针对特定靶标的活性分子,基于条件分子生成和分子对接,可以基于已知的活性分子高效地生成相应的诱饵分子(假定的负样本,decoys),为MLSFs的训练和测评提供了相对无偏的数据集。
DrugAI
2022/11/28
4760
J. Med. Chem.|TocoDecoy:针对机器学习打分函数训练和测试的无隐藏偏差的数据集构建新方法
JCIM|药物发现中基于AI的蛋白质结构预测:影响和挑战
2022年6月21日,来自小分子变构药物发现公司HotSpot Therapeutics的Michael Schauperl等人在J Chem Inf Model杂志发表文章,探讨了基于AI的蛋白质结构预测方法对药物发现领域的关键贡献,以及所面临的局限性和挑战。
智药邦
2022/11/16
6660
JCIM|药物发现中基于AI的蛋白质结构预测:影响和挑战
推荐阅读
JCIM|MILCDock:用于药物发现中虚拟筛选的机器学习一致性对接
7360
Brief. Bioinform. | 蛋白质-小分子复合物结合强度和配体结合姿态一体预测的深度学习框架
7960
JCIM|DENVIS:使用具有原子和表面蛋白口袋特征的图神经网络进行可扩展和高通量的虚拟筛选
7210
Nat. Mach. Intell. | “数据+知识+AI” 解锁新靶标药物虚拟筛选
2830
蛋白组学—两个蛋白质之间的分子对接
1.2K3
Drug Discov Today|配体-蛋白的分子对接中的机器学习
1.7K0
Brief Bioinform|基于深度学习和传统打分函数的配体构象优化框架
6710
DrugVQA | 用视觉问答技术预测药物蛋白质相互作用
9340
Bioinformatics|具有图和序列的神经网络的端到端学习的化合物与蛋白质相互作用预测
1.1K0
复旦大学朱思语/漆远等:蛋白质动态结构预测模型AlphaFolding
1910
J. Chem. Inf. Model. | 基于序列和基于结构的蛋白质-配体相互作用机器学习方法
9960
腾讯团队提出Interformer模型,通过相互作用感知进行蛋白质-配体对接亲和力预测
3740
Nat. Mach. Intell. | 多尺度拓扑Transformer用于蛋白质-配体相互作用预测
1850
利用AutoDock进行水分子参与的分子对接
1.4K0
蛋白质-配体结合亲和力预测:是否需要3D结合姿态?
2800
MIT 最新研究:AlphaFold 蛋白质预测能力太差,目前利用价值还很低
7220
J. Chem. Inf. Model. | 预测蛋白质-肽相互作用:基于深度学习技术的基准测试和与对接的比较
8920
J. Med. Chem. | 一种基于图表示学习的蛋白-配体相互作用打分方法InteractionGraphNet
7980
J. Med. Chem.|TocoDecoy:针对机器学习打分函数训练和测试的无隐藏偏差的数据集构建新方法
4760
JCIM|药物发现中基于AI的蛋白质结构预测:影响和挑战
6660
相关推荐
JCIM|MILCDock:用于药物发现中虚拟筛选的机器学习一致性对接
更多 >
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文