首页
学习
活动
专区
工具
TVP
发布

DrugAI

关注人工智能与化学、生物、药学和医学的交叉领域进展,提供“原创、专业、实例”的解读分享。
专栏作者
1050
文章
644522
阅读量
112
订阅数
Nat.Mach.Intell | ImageMol: 精准预测分子性质和药物靶标的自监督学习框架
近日,湖南大学DrugAI实验室在Nature子刊《Nature Machine Intelligence》上发表名为”Accurate prediction of molecular properties and drug targets using a self-supervised image representation learning framework”的研究论文,提出了一种全新的分子表征框架——基于分子图像的自监督深度学习框架ImageMol。它通过在1000万个未标记的类药生物活性分子上进行预训练,实现了对分子性质和药物靶标的准确预测,开创了分子表征学习的新范式。
DrugAI
2022-11-28
4450
Brief. Bioinform. | CIRS:自动提取专利信息,重建近药空间
本文介绍由华东理工大学药学院上海市新药设计重点实验室/华东师范大学人工智能新药创智中心李洪林/张凯团队在Briefings in Bioinformatics上发表题为“Multi-Modal Chemical Information Reconstruction from Images and Texts for Exploring the Near-Drug Space”的文章。本文提出一种多模态化学信息重建系统CIRS,通过从化学专利的文本和图像中提取化学实体重建化学信息,以促进近药空间的探索和构建。
DrugAI
2022-11-28
3320
Pocket2Mol : 基于3D蛋白质口袋的高效分子采样
本文介绍由xingang peng等人发表于ICML上的文章:Pocket2Mol: Efficient Molecular Sampling Based on 3D Protein Pockets。作者提出了一种新的可以满足口袋施加的多个几何约束的采样方法:Pocket2Mol,这是一个由两个模块组成的 E(3)-等变生成网络,它不仅可以捕获结合口袋原子之间的空间和键合关系,还可以在不依赖 马尔科夫链蒙特卡洛方法(MCMC)的情况下从易于处理的分布中以口袋表示为条件对新候选药物进行采样。实验结果表明,从 Pocket2Mol 中取样的分子具有明显更好的结合亲和力和其他药物特性,例如药物相似性和合成可及性。
DrugAI
2022-06-10
1.1K0
ICML2022 | EQUIBIND:用于药物结合结构预测的几何深度学习方法
本文介绍一篇来自于麻省理工学院的Hannes Stärk、Octavian Ganea等人发表在ICML上的分子结构预测工作——《EquiBind: Geometric Deep Learning for Drug Binding Structure Prediction》。预测类药物分子如何和特定靶蛋白结合是药物发现中的一个核心问题。已有方法依赖于评分、排序和微调等步骤对大量候选分子进行采样,计算非常昂贵。针对该问题,作者提出一种SE(3)等变的几何深度学习模型——EQUIBIND。该模型能直接快速地预测出受体结合位置以及配体的结合姿势和朝向。此外,作者将该模型同已有的微调技巧结合取得额外突破。最后,作者提出一种新型且快速的微调模型,它对于给定的输入原子点云基于冯·米塞斯角距离全局最小值的近似形式来调整配体可旋转键的扭转角,避免以前昂贵的差分进化能源最小化策略。
DrugAI
2022-06-10
7690
Stanford | 基于蛋白-配体复合物的几何深度学习指导基于片段的配体生成
本文介绍一篇来自于斯坦福大学计算机科学系Ron O. Dror教授组的分子生成工作——《Fragment-Based Ligand Generation Guided By Geometric Deep Learning On Protein-Ligand Structure》。计算辅助新型分子设计有可能加速药物发现。然而,在药物发展中分子优化是一项耗时的工作,通常需要花费数年对分子的多种性质同时进行优化。将一个能和蛋白质口袋结合的小的、片段状初始分子扩展成更大的分子,使之与已知药物的物理化学性质相匹配,这是生物信息学中一个特定的分子优化问题。针对这一问题,作者使用数据有效的E(3)等变网络和3D原子点云表征进行建模,这种方法能结合蛋白质口袋的3D空间信息同时生成合理的分子,从而加速药物发现过程。通过对多种性质进行评估证明该框架确实能生成可行的分子。
DrugAI
2022-06-10
3430
基于3D几何的预训练分子图表示
本文介绍了唐建课题组的Shengchao Liu等人基于3d几何研究的成果:鉴于现实世界场景中 3D 信息的缺乏极大地阻碍了对分子几何图表示的学习,本文提出了一种图预训练框架Graph Multi-View Pre-training (GraphMVP)。GraphMVP通过利用 2D 拓扑结构和 3D 几何视图之间的对应性和一致性来执行自我监督学习(SSL)。该方法有效地学习了一个 2D 分子图编码器,而该编码器之前已通过更丰富和更具辨别力的 3D 几何知识进行了预训练。作者进一步提供理论见解来证明 GraphMVP 的有效性。最后,综合实验表明 GraphMVP优于现有的图 SSL 方法。
DrugAI
2022-04-19
8900
IEEE TNNLS | 利用分子几何特征进行分子生成
近日,湖南大学、厦门大学和德睿智药团队在顶级期刊《IEEE Transactions on Neural Networks and Learning Systems》(IF:10.5)上发表研究论文。IEEE TNNLS创办于1990年,属机器学习、信息科学、人工智能的交叉学科领域,是神经网络和学习系统方面的国际顶级杂志,也是中科院分区1区Top期刊。录用论文标题为《Geometry-based Molecular Generation with Deep Constrained Variational Autoencoder》,该论文致力于研究分子3D表征学习问题,利用分子的几何特征进行分子生成。
DrugAI
2022-03-25
4610
ICLR 2022 | 能量启发的分子构象优化
本文介绍了关嘉麒&Wesley Wei Qian团队发表在ICLR 2022的文章《ENERGY-INSPIRED MOLECULAR CONFORMATION OPTIMIZATION》。作者研究如何预测分子的空间原子排列或分子构象,提出了一个神经能量最小化的概念。他将预测问题归结为一个展开的优化过程,并将神经网络参数化来学习隐式构象能量场的梯度空间。假设底层势能有不同的函数表达式,作者可以重新解释并统一许多现有的模型,还可以有原则地推导出SE(3)-equivariant神经网络的新变体。
DrugAI
2022-03-25
2160
Nat. Commun. | PyUUL提供了生物结构和深度学习算法之间的接口
本文介绍一篇来自比利时Switch实验室的Joost Schymkowitz和Frederic Rousseau发表在Nature Communication上的文章《PyUUL provides an interface between biological structures and deep learning algorithms》。由于生物学结构和机器学习方法之间缺少接口,使得现代神经网络(NN)架构在结构生物信息学中很难得到应用。这阻碍了基于结构的生物信息学方法的发展,导致生物学研究出现瓶颈。作者提出了PyUUL库,它能将生物学结构转化为三维张量,从而能让先进的深度学习(DL)算法利用其工作。PyUUL将生物学大分子转换为计算机视觉领域中典型的数据结构,例如体素和点云。除此之外,PyUUL允许GPU的使用和稀疏计算。最后,作者展示了如何使用PyUUL来解决典型的生物信息学问题,例如结构识别和对接。
DrugAI
2022-03-25
2630
Nat. Commun.|使用条件生成神经网络逆向设计 3D 分子结构
本文介绍了柏林工业大学机器学习小组的Niklas W. A. Gebauer和Michael Gasteggerh等共同发表在Nature Communications的研究成果:本文提出了一个条件生成神经网络,用于具有特定化学和结构特性的 3d 分子结构的设计。这种方法与化学键合无关,能够从条件分布中对新分子进行有针对性的采样,即使在参考计算稀疏的领域也是如此。通过生成具有特定基序或组成的分子,作者发现了特别稳定的分子,并联合针对训练方案之外的多种电子特性,证明了所采用的方法在逆向设计中的实用性。
DrugAI
2022-03-25
2040
ICLR2022 | SphereNet与G-SphereNet : 3D分子图表示与分子几何生成的自回归流模型
本期介绍德州农工大学CSE系Shuiwang Ji 教授(http://people.tamu.edu/~sji/)团队被ICLR2022接收的两个工作:SphereNet与G-SphereNet。
DrugAI
2022-03-25
4470
PNAS | 利用非结构数据预测蛋白质-配体复合物的结构和亲和力
今天给大家带来的是来自斯坦福大学,计算机科学系和化学系的文章《Leveraging nonstructural data to predict structures and affinities of protein–ligand complexes》利用非结构数据预测蛋白质-配体复合物的结构和亲和力。在过去50年里,大量的工作致力于使用计算的方法预测与大分子靶标结合的小分子。此类方法对药物设计至关重要,主要分为两大类:基于物理的方法,根据给定目标的三维(3D)结构直接模拟配体与受体的相互作用;基于配体的方法,预测配体特性并给出相似配体的实验测量值。作者提出了一个统计学框架结合这两种信息,并且开发了一种方法预测与靶蛋白结合的配体的3D结构,该方法利用与目标蛋白结合没有3D结构的配体信息。这种基于物理和配体的组合建模方法提高了药物靶蛋白结合位置预测的准确性。使用这种框架,作者开发了一种候选药物的虚拟筛选方法,该方法结合基于物理和基于配体的方法。结果表明,通过机器学习方法结合不同的信息可以改善对配体性质的预测。
DrugAI
2022-01-13
7530
Nat. Mach. Intell. | 分子表征的几何深度学习
本文介绍由瑞士苏黎世联邦理工学院化学与应用生物科学系的Francesca Grisoni和Gisbert Schneider共同通讯发表在 Nature Machine Intelligence的研究成果:本文作者重点介绍了几何深度学习在药物发现、化学合成预测和量子化学等领域的应用,其包含几何深度学习的原理和相关的分子表征,例如分子图、网格、表面和字符串。作者讨论了分子科学中几何深度学习面临的挑战,并展望其未来应用。
DrugAI
2021-12-29
5730
Nat. Commun.|DeepRank:蛋白质-蛋白质界面的深度学习框架
今天给大家介绍Utrecht University的Alexandre M. J. J. Bonvin和Li C. Xue团队发表在Nature Communications上的文章《DeepRank: a deep learning framework for data mining 3D protein-protein interfaces》。文章介绍了DeepRank,一个基于3DCNN的通用深度学习框架,用于蛋白-蛋白界面(PPIs)数据集的数据挖掘。DeepRank主要有两个功能:生物和人工晶体PPIs的分类和对接模型的评估。DeepRank可以和最先进的方法竞争。
DrugAI
2021-12-22
6780
NeurIPS 2021|分子的三维构象集的扭转几何生成
今天给大家介绍的是NeurIPS 2021上一篇来自MIT的论文。在化学信息学和药物发现领域中,从分子图中预测分子的三维构象集具有关键的作用,但现有的生成模型存在严重的问题,这包括缺乏对重要分子几何元素的建模,优化阶段容易出现累积误差,需要基于经典力场或计算代价昂贵的方法进行结构微调。作者团队提出GEOMOL模型,一种端到端、非自回归和SE(3)不变的机器学习方法来生成低能分子三维构象的分布。利用消息传递神经网络(MPNN)捕捉局部和全局信息的能力,我们能预测局部原子的3D结构和扭转角,这样的局部预测即可用于计算训练损失,也可用于测试时的完整构象。作者团队设计了一个非对抗性的基于损失函数的最优传输来促进多样的构象生成。GEOMOL优于流行的开源、商业或最先进的ML模型,同时速度得到了显著提升。我们希望这种可微的三维结构生成器能对分子建模和相关应用产生重大影响。
DrugAI
2021-12-01
7070
NeurIPS 2021 | 通过动态图评分匹配预测分子构象
从 2D 分子图中预测稳定的 3D 构象一直是计算化学中的一个长期挑战。而最近,机器学习方法取得了相比传统的实验和基于物理的模拟方法更优异的成绩。这些方法主要侧重于模拟分子图上相邻原子之间的局部相互作用,而忽略了非键合原子之间的长程相互作用。然而,这些未成键的原子在 3D 空间中可能彼此接近,模拟它们的相互作用对于准确确定分子构象至关重要,尤其是对于大分子和多分子复合物。在本文中,作者提出了一种称为动态图评分匹配 (DGSM) 的分子构象预测新方法,该方法通过在训练和推理过程中根据原子之间的空间接近度动态构建原子之间的图结构来对局部和远程相互作用进行建模。具体来说,DGSM根据动态构建的图,使用评分匹配方法直接估计原子坐标对数密度的梯度场。可以以端到端的方式有效地训练整个框架。多项实验表明,DGSM 的表现远超该领域一流水平,并且能够为更广泛的化学系统生成构象,例如蛋白质和多分子复合物。
DrugAI
2021-12-01
8110
Nucleic Acids Res. | AlphaFold DB:大规模扩展蛋白质序列空间的结构覆盖范围
今天向大家介绍DeepMind团队发表在Nucleic Acids Research上的一篇Breakthrough文章“AlphaFold Protein Structure Database: massively expanding the structural coverage of protein-sequence space with high-accuracy models”。作者在文章中介绍了一种名为AlphaFold DB的蛋白质数据库(https://alphafold.ebi.ac.uk),它是一个可公开访问的高精度蛋白质结构预测数据库。在 DeepMind提出的AlphaFold v2.0模型的支持下,它使已知蛋白质序列空间的结构覆盖范围实现了前所未有的扩展。该数据库提供了可编程访问及交互式可视化功能,包括预测的原子坐标、每个残基和成对模型置信度的估计,以及预测的对齐误差。AlphaFold DB的初始版本包含21种模型生物蛋白质组中的360,000多个预测结构,很快将扩展到涵盖UniRef90数据集中的大部分代表性序列(超过1亿个)。
DrugAI
2021-12-01
9560
Nat. Commun. | msiPL:质谱数据分析的新工具
今天给大家介绍来自哈佛医学院、麻省理工学院以及东北大学(美国)团队发表在Nature Communications上的文章,文章提出一个变分自编码器的概率模型(msiPL)用于学习质谱图像的低维嵌入表示。该模型可分析不同类型质谱仪和不同组织类型的质谱图像;并在3个公开的质谱成像(MSI)数据集以及2个由该论文作者收集整理的MSI数据集上进行了实验,实验结果表明msiPL可以有效的分析这些MSI数据集。
DrugAI
2021-10-11
6420
Nat. Commun. | AGBT:将图和双向transformers融合的分子性质预测新工具
今天介绍的 是北京大学深圳研究生院与密歇根州立大学合作发表在Nature Communications的一篇文章。
DrugAI
2021-09-17
1.2K0
JCIM| 通过以蛋白质结合位点3D信息为条件的分子生成模型进行从头分子设计
今天给大家介绍广州再生医学与健康实验室发表在Journal of Chemical Information and Modeling上的一篇关于利用分子生成模型进行从头分子设计的文章。该文提出了一种新的生成模型,该模型通过将蛋白质结合口袋的3D结构信息整合到条件RNN(cRNN)模型中,以控制类药分子的生成。在该模型中,通过粗粒度策略有效表征蛋白质结合口袋,其中口袋的3D信息可以由组成结合口袋原子的的粗粒度库仑矩阵(EGCM)的排序特征值表示。该文使用EGCM方法以及DeeplyTough方法来训练cRNN模型并评估其性能。实验结果表明,基于蛋白质结合口袋信息约束下训练的模型与正常RNN模型相比,生成的化合物与原始X射线结合配体具有更高相似性且对接分数更好。本文的结果证明了受控分子生成模型在靶向分子生成和类药化学空间引导探索方面的潜在应用。
DrugAI
2021-08-24
1K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档