首页
学习
活动
专区
工具
TVP
发布

DrugAI

关注人工智能与化学、生物、药学和医学的交叉领域进展,提供“原创、专业、实例”的解读分享。
专栏作者
1050
文章
643205
阅读量
112
订阅数
J. Chem. Inf. Model. | 双重驱动的深度强化学习用于靶标特异性分子生成
今天为大家介绍的是来自 Hao Liu和 Liang Hong团队的一篇论文。基于深度学习的分子生成模型在新药设计领域引起了广泛关注。然而,大多数现有模型专注于基于配体或基于结构的策略之一,因此未能有效利用从配体和结合靶点的结构两方面获得的综合知识。在文章中,作者介绍了LS-MolGen,一种新颖的配体和结构整合型分子生成模型。该模型协同地结合了表示学习、迁移学习和强化学习。来自迁移学习的有针对性知识吸收,再加上强化学习中的高级探索策略,使LS-MolGen能够高效生成新颖且高亲和力的分子。
DrugAI
2023-11-06
3490
J. Chem. Inf. Model. | 评估图神经网络和迁移学习在口服吸收率预测中的应用
今天为大家介绍的是来自Yunpeng Lu团队的一篇论文。口服生物利用度是药物发现中的重要药代动力学属性。最近开发的计算模型涉及使用分子描述符、指纹和传统机器学习模型。然而,确定分子描述符的类型需要领域专家知识和进行特征选择所需的时间。随着图神经网络(GNN)的出现,模型可以被训练成自动提取它们认为重要的特征。作者利用了GNN的自动特征选择来预测口服生物利用度。为了增强GNN的预测性能,作者利用迁移学习预训练了一个模型来预测溶解度,并获得了最终的平均准确度为0.797,F1得分为0.840,AUC-ROC为0.867,这超过了先前在相同测试数据集上预测口服生物利用度的研究成果。
DrugAI
2023-10-09
2220
学习抗体高变异性的语言
今天为大家介绍的是来自Bryan Bryson和Bonnie Berger团队的一篇关于语言模型在抗体上应用的论文。基于机器学习的蛋白质语言模型(Protein Language Models,PLMs)在预测蛋白质结构和功能方面取得了显著的成功。然而,通用的“基础”PLMs在预测抗体方面的性能有限,这是因为抗体的高变异性区域不符合模型所依赖的进化保守原则。在此项研究中,作者提出了一种新的迁移学习框架,称为AbMAP,它通过对抗体序列输入进行精细调优,以抗体结构和结合特异性示例为监督,对基础模型进行微调。
DrugAI
2023-09-19
1190
Nature | 迁移学习为网络生物学赋能
今天为大家介绍的是来自Christina V. Theodoris和Patrick T. Ellinor团队的一篇基于迁移学习发现关键调控因子和潜在治疗靶标的论文。基因网络的映射需要大量的转录组数据,以学习基因之间的连接关系,这在数据有限的环境中,包括罕见疾病和临床无法接触的组织中,会阻碍发现。最近,迁移学习通过利用在大规模通用数据集上预训练的深度学习模型,然后对有限的特定任务数据进行微调,革新了自然语言理解和计算机视觉等领域。在这里,作者开发了一种上下文感知、基于注意力机制的深度学习模型,名为Geneformer,它在约3000万个单细胞转录组的大规模语料库上进行了预训练,以实现在网络生物学中有限数据环境下的上下文特定预测。
DrugAI
2023-09-19
3080
Nat. Commun. | 结合分子结构与生物活性的生成化学语言模型
本文介绍一项由苏黎世联邦理工学院化学与应用生物科学系和苏黎世大学儿童医院联合发表于Nature Communications的研究工作。作者开发了一个利用已知配体结构和生物活性信息的分子设计方法,在大量化合物结构中预训练了两个生成化学语言模型(CLM),通过微调将CLM生成的分子偏向于特定的化学空间。通过对生成分子及其衍生物的活性测试验证了模型的有效性。
DrugAI
2023-03-09
3790
Research | 使用无监督学习、多任务学习的分子性质预测新方法
2022年12月15日,中南大学湘雅药学院曹东升团队,国防科技大学吴诚堃团队,浙江大学侯廷军团队以及湖南大学曾湘祥教授团队合作在Research期刊上发表论文“Pushing the Boundaries of Molecular Property Prediction for Drug Discovery with Multitask Learning BERT Enhanced by SMILES Enumeration”。
DrugAI
2023-02-17
7710
Nat. Commun. | 预测肽特性的模块化深度学习框架
今天带来的是丹麦哥本哈根大学健康科学学院NNF蛋白质研究中心蛋白质组学项目的实验室的Matthias Mann课题组发表在nature communications上的AlphaPeptDeep: a modular deep learning framework to predict peptide properties for proteomics。
DrugAI
2023-02-17
4800
Nat. Commun. | 基于条件递归神经网络的生成式深度学习发现RIPK1抑制剂
本文介绍由Yueshan Li, Liting Zhang, Yifei Wang, Jun Zou共同在nature communications上发表题为“Generative deep learning enables the discovery of a potent and selective RIPK1 inhibitor”的文章。本文提出了一种基于分布式学习条件递归神经网络 (cRNN)的生成式深度学习 (GDL) 模型,用于为给定的生物靶标生成量身定制的虚拟化合物库,然后将GDL模型应用于RIPK1。
DrugAI
2022-11-28
6530
Nat. Commun. | scDEAL:通过整合bulk和单细胞RNA-seq数据预测癌症药物反应的深度迁移学习框架
本文介绍由美国俄亥俄州立大学医学院Qin Ma副教授团队和美国密苏里大学哥伦比亚分校许东教授团队联合发表在Nature Communications的研究成果。本文作者提出了scDEAL,这是一个通过整合大规模bulk细胞系数据在单细胞水平上预测癌症药物反应的深度迁移学习框架。scDEAL的亮点在于协调药物相关的bulk RNA-seq数据与scRNA-seq数据,并通过迁移学习把在bulk RNA-seq数据上训练的模型用以预测scRNA-seq中的药物反应。scDEAL的另一个特点是整合梯度特征解释来推断耐药机制的特征基因。作者在六个scRNA-seq数据集上对scDEAL进行了基准测试,并通过三个专注于药物反应标签预测、基因特征识别和伪时间分析的案例证明了模型的可解释性。作者相信scDEAL可以帮助研究细胞重编程、药物选择和再利用以提高治疗效果。
DrugAI
2022-11-28
8640
Nat. Mach. Intel. | 人工智能可以准确预测人类对新药物化合物的反应
确定一种潜在的治疗化合物到美国食品药物管理局(FDA)批准一种新药,是一个艰巨的旅程,可能需要超过十年的时间,耗资超过10亿美元。纽约市立大学研究生中心的一个研究小组已经开发出一种新型的人工智能模型,可以显著提高药物开发过程的准确性并减少时间和成本。
DrugAI
2022-11-28
3860
Chemical Research in Toxicology邀稿 | AI 遇见毒理学特刊
现代机器学习(ML)是人工智能(AI)的基础,已经严重影响了包括化学在内的所有科学领域。与传统的计算方法相比,基于深度神经网络和表征学习的新ML方法往往能提供更高的预测质量。使用可解释的人工智能方法对这种模型进行解释,使研究人员能够识别分子活性的原子和片段贡献,这种方法现在正在积极发展。基于图像和文本处理的信息提取的新方法正在兴起,未来将允许从文献中产生大量更准确的提取和全面注释的数据集。
DrugAI
2022-11-28
2190
Nat. Biotechnol. | 用机器学习预测多肽质谱库
本文介绍Max-Planck生物化学研究所计算系统生物化学研究组的Jürgen Cox近期发表在Nature Biotechnology的综述Prediction of peptide mass spectral libraries with machine learning。最近开发的机器学习方法用于识别复杂的质谱数据中的肽,是蛋白质组学的一个重大突破。长期以来的多肽识别方法,如搜索引擎和实验质谱库,正在被深度学习模型所取代,这些模型可以根据多肽的氨基酸序列来预测其碎片质谱。这些新方法,包括递归神经网络和卷积神经网络,使用预测的计算谱库而不是实验谱库,在分析蛋白质组学数据时达到更高的灵敏度或特异性。机器学习正在激发涉及大型搜索空间的应用,如免疫肽组学和蛋白质基因组学。该领域目前的挑战包括预测具有翻译后修饰的多肽和交联的多肽对的质谱。将基于机器学习的质谱预测渗透到搜索引擎中,以及针对不同肽类和测量条件的以质谱为中心的数据独立采集工作流程,将在未来几年继续推动蛋白质组学应用的灵敏度和动态范围。
DrugAI
2022-11-28
9970
J. Med. Chem. | RELATION: 一种基于靶标结构的深度学习全新药物设计模型
本文介绍一篇来自浙江大学侯廷军教授课题组、中南大学曹东升教授课题组、华东理工大学李洪林教授课题组联合发表的论文。该论文提出了一种能够在分子生成过程中考虑到蛋白-配体相互作用的深度学习生成模型RELATION,该模型适用于基于靶标结构的全新药物设计。RELATION模型同时使用百万量级的分子库以及蛋白-配体集合数据对变分自编码器进行训练,在引入双向迁移学习后,隐藏层的采样能够同时兼顾生成分子的骨架片段的新颖性以及对靶标蛋白的亲和性。RELATION模型还提供了药效团约束生成以及贝叶斯优化(BO)采样等模块,可供用户定制化生成药效团匹配度更高以及对靶标的对接打分表现更好的分子。
DrugAI
2022-11-28
5250
深度学习辅助CRISPR系统设计方法总结
CRISPR系统的关键在于能够识别可以高效切割的目标位点,以及候选gRNA在其他基因组位置几乎或没有切割的目标位点。位点导向突变的靶向效率高度依赖于sgRNA,并且沿着靶标DNA方向微小的位置变动足以以不可预知的方式改变sgRNA的功能。因此,设计有效的sgRNA用于可靠的基因敲除实验至关重要。理想的gRNA应该最大限度地提高靶上活性(诱导效率),同时最大限度地减少潜在的脱靶效应(诱导特异性)。近年来,涌现出一些辅助gRNA设计的计算工具,这些工具旨在帮助研究人员选择可用的最佳靶点。本文关注范围仅是利用深度学习方法解决该问题的计算工具。
DrugAI
2022-11-28
6990
Nat. Commun. | 蛋白质序列表示学习
今天给大家介绍的文章是哥本哈根大学计算机科学系 Wouter Boomsma 等人发表在 Nature Communications 上的文章 Learning meaningful representations of protein sequences。在本文中,作者探索了迁移学习和可解释性学习中的表示。在迁移学习中,作者证明了现在的一些实践只能产生次优的结果。在可解释性学习中,把几何信息考虑在内有助于提升可解释性,并且可以帮助模型揭示被掩盖的生物信息。
DrugAI
2022-06-10
2810
NeurIPS 2021 | Spotlight:小样本分子性质预测新方法
分子性质预测(Molecule Property Prediction)是研究者在进行新药发现研究时经常会遇到的问题。由于新药发现研究中已知药理性质的分子(有标签样本)少,小样本学习(Few-Shot Learning)的方法在分子性质预测问题中有不错的效果。在已有的小样本的分子性质预测研究中,很多工作会选择直接使用小样本学习的经典方法,但是忽视了分子性质预测这个问题的特性,比如分子之间的关系以及同种分子在不同性质上的表现。在这篇工作中,我们提出了新的分子性质预测模型PAR,在获取分子表征的过程中加入self-attention层获取分子性质信息,创新地加入了分子关系学习和参数部分更新的策略,解决了已有工作存在的问题,在多个分子性质预测的数据集中取得了很好的效果。
DrugAI
2022-03-25
3510
Nat. Methods|生物成像分析中的注意事项
深度学习算法是分析、恢复和转换生物成像数据的强大工具,但存在使用不当的可能性。本文作者讨论了研究人员在使用深度学习进行显微镜研究时需要考虑的重要概念,如何验证深度学习获得的结果以及选择合适的工具时应该考虑的内容。作者建议在出版物中报告深度学习分析的哪些方面以确保可再现性,并希望这一观点能促进相关人员的进一步讨论,以定义适当的指南来确保适当使用这种变革性技术。
DrugAI
2021-10-21
4480
Nat. Commun. | 从单细胞转录组数据中学习可解释的细胞和基因签名嵌入
本文介绍由加拿大麦吉尔大学与蒙特利尔高等商学院、北京大学、复旦大学的研究人员联合发表在Nature Communications的研究成果:本文作者提出了单细胞嵌入式主题模型scETM(single-cell Embedded Topic Model)用于解决大规模scRNA-seq数据集的整合分析。scETM利用可迁移的基于神经网络的编码器,和一个通过矩阵三角分解而具有可解释的线性解码器。scETM同时学习一个编码器网络从而推测细胞类型混合物和一组高度可解释的基因embeddings,主题embeddings和来自多个scRNA-seq数据的批次效应线性截距(linear intercepts)。scETM可扩展到超过106个细胞,并且在跨组织和跨物种零次迁移学习上有着卓越的表现。通过基因集富集分析,作者发现scETM学习的主题富集到具有生物学意义且疾病相关的通路。scETM能将已知基因结合到基因embeddings中,从而通过主题embeddings学习通路和主题的相关性。
DrugAI
2021-10-11
8020
BIB | 深度学习生物医学命名实体识别综述
今天给大家介绍我们湖南大学DrugAI课题组发表在Briefings in Bioinformatics上发表的一篇综述。这篇综述从“单一神经网络、多任务学习、迁移学习和混合模型”这4个方面,介绍了近年来深度学习如何从生物医学文献文中挖掘命名实体以及相关数据集。作者挑选了几个有代表性的方法,在6个常用的数据集上进行了实验比较。结果发现,深度学习的方法要普遍优于传统方法,并且不同的方法和数据集之间也有较大的差异。最后,作者总结了生物医学命名实体(BioNER)存在的一些挑战和未来的发展。
DrugAI
2021-08-24
6930
JMC | 药物发现中的迁移学习
药物发现工作中可用于训练计算模型的数据集通常很少。标记数据的稀疏可用性是人工智能辅助药物发现的主要障碍。解决该问题的一种方法是开发可以处理相对异构和稀缺数据的算法。迁移学习是一种机器学习方法,可以利用其他相关任务中现有的,可推广的知识来学习带有少量数据的单独任务。深度迁移学习是药物发现领域最常用的迁移学习模型。本文概述了迄今为止转移学习和药物发现的相关应用。此外,它为药物发现转移学习的未来发展提供了前景。
DrugAI
2021-02-02
8720
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档