DrugAI-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

DrugAI

关注人工智能与化学、生物、药学和医学的交叉领域进展，提供“原创、专业、实例”的解读分享。

专栏成员

1142

文章

759307

阅读量

121

订阅数

Brief. Bioinform. | 深度学习赋能表型药物发现

深度学习测试模型数据性能

今天为大家介绍的是近期发表在Briefings in Bioinformatics的综述文章。该文章由佛罗里达大学李彦君课题组完成，题为“Morphological profiling for drug discovery in the era of deep learning”。该研究探讨了深度学习在细胞形态学分析以及表型药物发现中的创新应用。

2024-07-16

1900

使用Vabs-Net进行多层次蛋白质预训练

深度学习编码模型网络性能

今天为大家介绍的是来自Shuqi Lu团队的一篇论文。近年来，在各种下游任务中基于3D结构的预训练蛋白质模型的发展激增，这代表了预训练蛋白质语言模型的重大进步。然而，大多数现有的基于结构的预训练模型主要关注残留物水平，即α碳原子，而忽略了如侧链原子等其他原子。作者认为，在残基和原子水平上对蛋白质进行建模是很重要的，因为侧链原子对许多诸如分子对接等下游任务也至关重要。然而，作者发现在预训练中天真地结合残基和原子信息通常会失败。一个关键原因是输入中包含原子结构导致的信息泄漏，这使得残差级预训练任务变得微不足道，导致残差表示的表达不足。为了解决这个问题，作者在3D蛋白质链上引入了一个跨度掩模预训练策略，以学习残基和原子的有意义表示。这导致了一种简单而有效的方法来学习适合于各种下游任务的蛋白质表示。结合位点预测和功能预测任务的大量实验结果表明，该预训练方法明显优于其他方法。

2024-07-05

960

J. Chem. Theory Comput. | 基于Transformer的生成模型探索蛋白质-蛋白质复合物的构象系综

theory 编码模型数据深度学习

蛋白质-蛋白质相互作用(PPIs)是许多蛋白质功能的基础，了解蛋白质-蛋白质相互作用的接触和构象变化对于将蛋白质结构与生物功能联系起来至关重要。虽然难以通过实验检测，但分子动力学（MD）模拟被广泛用于研究蛋白质-蛋白质复合物的构象组合和动力学，但在采样效率和计算成本方面存在很大的局限性。近日发表在Journal of Chemical Theory and Computation的论文，“Exploring the conformational ensembles of protein-protein complex with transformer-based generative model”，根据分子动力学模拟获得的蛋白质-蛋白质复合物构象系综训练了一个基于Transformer的生成神经网络，以直接生成具有物理真实性的新蛋白质-蛋白质复合物构象。研究人员展示了如何使用基于Transformer架构的深度学习模型，通过 MD 模拟探索蛋白质-蛋白质复合物的构象系综。结果表明，学习到的潜在空间可用于生成蛋白质-蛋白质复合物的未采样构象，以获得补充原有构象的新构象，可作为分析和增强蛋白质-蛋白质复合物构象的探索工具。

2024-06-04

2180

Trends in Cell Biology | 细胞动力学研究中的机遇与挑战

模型数据深度学习 cell 对象

今天为大家介绍的是来自Viji M. Draviam团队的一篇论文。人工智能（AI）的发展促进了计算机视觉和深度学习（DL）技术在显微镜图像和影片评估中的应用增加。这种应用不仅解决了动态细胞生物过程的定量分析难题，还开始支持药物开发、精准医疗和基因组-表型组映射方面的进展。作者调查了现有的基于AI的技术和工具，以及开源数据集，特别关注于细胞和亚细胞结构及动态的分割、分类和跟踪的计算任务。作者从计算视角总结了显微镜视频分析中长期存在的挑战，并回顾了深度学习引导自动化在细胞动态研究中的新兴研究前沿和创新应用。

2024-05-22

1370

Nat. Biomed. Eng. | 利用RNA测序数据生成肿瘤的合成图像

nat 测试模型数据深度学习

今天为大家介绍的是来自Olivier Gevaert团队的一篇论文。通过合成数据训练机器学习模型可以缓解数据集成本高昂且具有挑战性时数据稀缺的问题。作者在这里展示了如何使用级联扩散模型从人类肿瘤的RNA测序数据的潜在表示中合成出现实感强的全幅图像切片。

2024-04-30

930

Chem. Sci. | 来鲁华、裴剑锋团队开发基于扩散模型的柔性分子对接方法

开发模型优化深度学习测试

基于结构的虚拟筛选（SBVS）能够从大规模化合物库中快速识别潜在的活性分子。分子对接是SBVS中最常用的技术之一，它可以用于预测配体的结合姿态，描述蛋白质-配体的结合强度，并识别关键的相互作用。传统的分子对接方法一般使用刚性的蛋白质口袋作为对接的受体，即当蛋白-配体晶体结构已知时，移除配体分子再重新对接配体回到已知蛋白质的Holo态结合口袋。然而，在现实应用场景下的分子对接任务中，如果事先不知道受体的结合构象，由配体诱导的口袋构象的变动会使得刚性对接方法给出错误的预测。尽管AlphaFold2能够较准确地预测目标蛋白质的结构，但预测的靶标蛋白结构与结合态有一定差别，导致未考虑蛋白质柔性的刚性分子对接方法无法利用预测的结构给出正确的复合物结构。而现有的柔性分子对接方法，受限于计算复杂度，仅能考虑少量的侧链构象变化。一些基于深度学习的分子对接方法，对蛋白质进行粗粒化的主链编码在一定程度上可以克服局部的侧链构象变化，但由于口袋残基侧链原子信息的缺失以及缺乏基于物理模型的配体分子建模，所生成的对接构象经常出现配体构象不合理及配体与蛋白间的碰撞等问题，也不能提供对于配体进行优化所需要的受体与配体的相互作用细节。

2024-04-28

2460

Structure | 评估AlphaFold2在肽结构预测上的表现

性能异常深度学习 structure 工作

今天为大家介绍的是来自Alican Gulsevin团队的一篇论文。近期在计算工具方面的进展极大提升了对蛋白质结构预测的准确度。计算预测方法已经被用于许多可溶性和膜蛋白的建模，但这些方法在肽结构建模上的表现尚未进行系统性研究。

2024-04-28

2250

Nat. Commun. | 基于回归的深度学习从病理切片预测分子生物标志物

深度学习 nat 测试队列模型

今天为大家介绍的是来自Jakob Nikolas Kather团队的一篇论文。深度学习（DL）能够从癌症组织病理学中预测生物标志物。目前，已有几种获得临床批准的应用采用了这项技术。然而，大多数方法预测的是分类标签，而生物标志物往往是连续的测量值。作者假设基于回归的深度学习在性能上超过了基于分类的深度学习。因此开发并评估了一种自监督的、基于注意力的、弱监督回归方法。

2024-03-18

2620

Nat. Comput.Sci. | AI助力M-OFDFT实现兼具精度与效率的电子结构方法

深度学习 nat 模型效率优化

编者按：为了使电子结构方法突破当前广泛应用的密度泛函理论（KSDFT）所能求解的分子体系规模，微软研究院科学智能中心的研究员们基于人工智能技术和无轨道密度泛函理论（OFDFT）开发了一种新的电子结构计算框架 M-OFDFT。这一框架不仅保持了与 KSDFT 相当的计算精度，而且在计算效率上实现了显著提升，并展现了优异的外推性能，为分子科学研究中诸多计算方法的基础——电子结构方法开辟了新的思路。相关研究成果已在国际知名学术期刊《自然-计算科学》（Nature Computational Science）上发表。

2024-03-18

900

Sci. Adv. | 基于非线性机械展开响应的端到端新蛋白生成使用语言扩散模型

深度学习测试模型设计数据

今天为大家介绍的是来自Markus J. Buehler团队的一篇论文。自然进化过程中，大自然展现了一系列具有卓越机械性能的蛋白质材料，这些蛋白质在机械生物学中扮演着至关重要的角色。然而，超越自然设计，发现满足特定机械性质要求的蛋白质仍然是一个挑战。在这里，作者报道了一种生成模型，该模型能够预测出为满足复杂的非线性机械性质设计目标的蛋白质设计。作者的模型利用了来自预训练蛋白质语言模型的深层蛋白质序列知识，并将机械展开响应映射出来以创建蛋白质。通过分子模拟进行直接验证，作者展示了所设计的蛋白质是全新的，并且满足了目标机械性质，包括展开能量和机械强度。

2024-03-05

1670

Adv. Sci. | 分布无关的深度学习实现准确的单细胞数据恢复和转录调控解释

模型数据数据恢复算法深度学习

本文介绍吉林大学李向涛教授课题组发表在Advanced Science的研究成果，题为“Distribution-Agnostic Deep Learning Enables Accurate Single-Cell Data Recovery and Transcriptional Regulation Interpretation”。单细胞转录组测序（scRNA-seq）是一种在单细胞水平上研究基因表达的可靠方法，但是准确的量化转录信息通常受到有限的mRNA捕获的阻碍，从而导致许多缺失的表达值。现有的插补方法依赖于严格的数据假设，限制其更广泛的应用，从而导致有偏的信号恢复。为了应对这一挑战，作者提出了一个分布无关的深度学习模型，可准确恢复缺失的基因表达。该模型基于最优传输理论，通过正则化细胞嵌入空间来应对单细胞转录组数据的复杂分布。此外，还提出了表达一致性模块引入bulk RNA-seq数据指导缺失基因恢复。

2024-02-23

2990

Nat. Mach. Intell. | 深度化学模型的神经缩放

nat 计算机视觉模型数据深度学习

今天为大家介绍的是来自Nathan C. Frey团队的一篇论文。在数据可用性和计算量方面的大规模扩展，使得深度学习在自然语言处理和计算机视觉等关键应用领域实现了重要突破。越来越多的证据表明，在科学深度学习中，规模可能是一个关键因素，但科学领域中物理先验的重要性使得规模扩展的策略和益处尚不确定。在这里，作者通过改变模型和数据集的大小（跨越多个数量级），研究了大型化学模型中的神经缩放行为，研究对象包括拥有超过十亿参数的模型，这些模型在高达一千万数据点的数据集上进行了预训练。

2024-02-23

1130

Nat.Commun. | DynamicBind:基于几何深度学习的动态复合物结构预测模型

模型软件算法深度学习 nat

基于AlphaFold2的静态蛋白结构预测方法已经接近实验精度，为结构生物领域带来了巨大的影响。然而，在药物开发中，靶蛋白的功能性运动非常关键，它会对药物的活性产生影响，而目前的算法模型无法捕捉到大分子的功能构象动态变化过程。近日，上海交通大学郑双佳课题组与星药科技研究团队，美国莱斯大学Peter G. Wolynes联合团队在《Nature Communications》发表题为“DynamicBind: predicting ligand-specific protein-ligand complex structure with a deep equivariant generative model”的研究论文。该论文提出的新方法DynamicBind可基于AF2预测的初始非结合构象，生成与对应输入药物分子相匹配的蛋白结合构象及转化过程，并在计算过程中自动寻找口袋位置，让对接中发现隐藏口袋成为可能。该研究对于蛋白质功能机制的理解以及难成药靶点的药物筛选具有重要意义，为后AlphaFold时代的药物研发提供了一种基于深度学习的，考虑蛋白动态变化的新范式。

2024-02-23

3410

Nat. Methods | 基于深度学习的RNA序列设计

模型设计深度学习 nat methods

今天为大家介绍的是来自Michiaki Hamada和Hirohide Saito团队的一篇论文。RNA工程在生物技术和医学领域有巨大潜力。尽管RNA工程非常重要，但目前仍缺乏一个多功能的自动化设计功能RNA的平台。因此，作者们提出了一种名为RfamGen的深度生成模型。这个模型通过明确结合序列对齐二级结构信息，以数据高效的方式设计RNA家族序列。RfamGen能够通过从一个语义丰富且连续的表示中采样点来生成新颖且功能性的RNA家族序列。作者们通过多种RNA家族的实验，证明了RfamGen的多功能性。

2024-01-22

3040

ACS Cent. Sci. | 基于几何深度学习的配体设计

深度学习测试模型设计优化

今天为大家介绍的是来自Ron O. Dror团队的一篇论文。药物设计中一个普遍的挑战是确定如何扩展配体以改善配体的各种属性。添加单个化学基团对于引导优化任务非常重要，而添加多个基团对于基于基团的药物设计至关重要。作者开发了一个综合框架，利用机器学习和三维蛋白质-配体结构来应对这一挑战。

2024-01-17

960

ACS Cent. Sci. | 深度学习与药物发现在健康衰老中的应用

开发优化深度学习工作工作流

骨质疏松症是一种全球性疾病，该病导致死亡率、疾病负担和医疗成本显著增加。在美国，每年因骨质疏松症导致的骨折约有150万例，引起数十万次住院治疗。在人口迅速老龄化的地区，约30%的40岁及以上女性可能受到骨质疏松症的影响。亚太地区国家寿命的延长使得骨质疏松症和其他骨病成为需重点关注的问题，以减少医疗成本并降低患者的死亡率和疾病负担。开发安全有效的治疗方法是解决这些问题的关键策略之一。为了开发治疗骨病的潜在干预措施，长期以来的一个障碍是识别出能够维持骨髓间充质干细胞（BMMSCs）干性的临床可操作药物。由于BMMSCs在骨组织再生和稳态中的作用，保持其干性一直是骨病有效治疗方法开发中的一个重点。以往的方法包括激素治疗或抑制骨吸收治疗，但这些策略并未解决干性的核心问题。其他解决干性的方法包括细胞因子治疗和基因编辑。此外，治疗骨病的安全、有效之外，其可获取性和可负担性也是需要考虑的关键属性。

2024-01-17

1270

Nat Comput Sci. | 预测特定有机分子光谱的深度学习模型

深度学习 nat 模型数据效率

今天为大家介绍的是来自Yujin Zhang，Jun Jiang，Yi Luo和Wei Hu团队的一篇论文。论文介绍了一个用于预测分子光谱的深度学习模型“DetaNet”。准确高效的分子光谱模拟对物质发现和结构鉴定至关重要。然而，传统的依赖量子化学的方法成本高，效率低。为了解决这个问题，研究者们开发了DetaNet模型，它能够以更高的效率和准确性预测分子光谱。

2024-01-03

2870

Nat. Rev. Drug Discov. | 定量构效关系(QSAR)建模和深度学习在药物发现中的应用

深度学习 nat 模型设计数据

今天为大家介绍的是来自Artem Cherkasov团队的一篇综述。定量构效关系（QSAR）建模是60年前提出的一种方法，并广泛应用于计算机辅助药物设计中。近年来，人工智能技术（尤其是深度学习）、分子数据库的迅速增长和计算能力的显著提升，共同促进了一个新领域的出现，作者称之为“深度QSAR”。自深度QSAR在小分子药物发现领域的首次应用已有十年，这篇综述描述了这一领域的关键进展，包括在分子设计中应用深度生成和强化学习方法、用于合成规划的深度学习模型，以及在基于结构的虚拟筛选中应用深度QSAR模型。文章还关注了量子计算的出现，这一技术有望进一步加速深度QSAR应用，并强调了开源和民主化资源在支持计算机辅助药物设计中的必要性。

2023-12-26

8300

Protein Science | 预测T细胞受体-表位结合特异性的可解释性深度学习模型

深度学习编码模型数据性能

近日， Protein Science期刊在线发表了上海交通大学生命科学技术学院魏冬青教授与熊毅副研究员团队题为TEPCAM: prediction of T cell receptor-epitope binding specificity via interpretable deep learning的研究论文。上海交通大学硕士研究生陈俊炜是论文的第一作者。上海交通大学熊毅副研究员和中南大学李敏教授是论文共同通讯作者。

2023-12-21

3500

Cell Reports Methods | 深度几何分子学习

深度学习 cell methods 模型数据

今天为大家介绍的是来自Jiawei Luo和Kelin Xia团队的一篇论文。分子表征学习在分子性质预测中扮演重要角色。现有的分子性质预测模型基于共价键的分子图，用以在原子层面上表示分子拓扑结构，并且完全忽略了分子内部的非共价相互作用。在这项研究中，作者提出了一种分子几何深度学习模型，旨在预测分子的性质，该模型致力于综合考虑分子的共价和非共价相互作用信息。

2023-12-19

4140

点击加载更多

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态