首页
学习
活动
专区
工具
TVP
发布

DrugAI

关注人工智能与化学、生物、药学和医学的交叉领域进展,提供“原创、专业、实例”的解读分享。
专栏作者
1063
文章
656077
阅读量
114
订阅数
Nat. Commun. | 扩散模型实现基于结构的三维分子生成与先导化合物优化
今天为大家介绍的是来自Hailong Li,Ka-Chun Wong和Hengtong Zhang团队的一篇论文。基于结构的生成方法在计算机辅助药物发现中至关重要,它通过探索广阔的化学空间来设计与靶点高亲和力结合的配体。然而,传统的计算机模拟方法受限于计算效率低下,而机器学习方法则因自回归采样面临瓶颈。为了解决这些问题,作者开发了一种条件深度生成模型PMDM,用于生成符合特定靶标的三维分子。
DrugAI
2024-05-02
910
Nat. Immunol. | 一种预测可以提升免疫检查点阻断疗效的药物的方法
今天为大家介绍的是来自Lu Gan和An-Yuan Guo团队的一篇论文。联合疗法是一种有前景的治疗策略,用以提升免疫检查点阻断(ICB)的疗效;然而,预测有效的联合用药仍然充满挑战。在这里,作者开发了一种名为CM-Drug的通用数据驱动方法,用于筛选能够增强ICB治疗效果的化合物。
DrugAI
2024-05-01
970
Nat. Biomed. Eng. | 利用RNA测序数据生成肿瘤的合成图像
今天为大家介绍的是来自Olivier Gevaert团队的一篇论文。通过合成数据训练机器学习模型可以缓解数据集成本高昂且具有挑战性时数据稀缺的问题。作者在这里展示了如何使用级联扩散模型从人类肿瘤的RNA测序数据的潜在表示中合成出现实感强的全幅图像切片。
DrugAI
2024-04-30
590
Nat. Commun. | 通过机器学习预测和改善啤酒风味
今天为大家介绍的是来自Kevin J. Verstrepen团队的一篇论文。食物风味的感知依赖于许多相互作用的化学化合物和外部因素,因此理解和预测它们颇具挑战性。在这项研究中,作者结合了对250种不同啤酒的广泛化学和感官分析,训练机器学习模型,以预测啤酒的风味和消费者的喜好。
DrugAI
2024-04-29
1040
Nat. Comput. Sci. | 人类般的直觉行为和推理偏见在大型语言模型中出现,但在ChatGPT中消失了
今天为大家介绍的是来自Michal Kosinski团队的一篇论文。作者设计了一系列语义幻觉和认知反思测试,旨在诱发直觉性但错误的反应。作者将这些任务(传统上用于研究人类的推理和决策能力)应用于OpenAI的生成预训练变换器模型家族。结果显示,随着模型在规模和语言能力上的扩展,它们越来越多地显示出类似人类的直觉型思维和相关的认知错误。这一模式随着ChatGPT模型的引入而显著转变,这些模型倾向于正确响应,避免了任务中设置的陷阱。ChatGPT-3.5和4都利用输入输出上下文窗口进行思维链推理。作者的发现强调了将心理学方法应用于研究大型语言模型的价值,因为这可以揭示先前未被发现的突现特性。
DrugAI
2024-04-29
1040
Nat. Commun. | 通过单一分子基础模型实现结构和属性的双向生成
今天为大家介绍的是来自Jong Chul Ye团队的一篇论文。人工智能中基础模型的近期成功促使了大规模化学预训练模型的出现。尽管对于提供下游任务有用信息的大型分子预训练模型的兴趣日增,但在分子领域上对多模态预训练方法的尝试却很有限。为了解决这一问题,作者在此介绍了一个多模态分子预训练模型,该模型结合了结构和生化属性的模态,灵感来自于近期多模态学习技术的进展。作者提出的模型数据处理和训练目标在一个共同的嵌入空间中对齐了结构/属性特征,使得模型能够考虑分子结构和属性之间的双向信息。
DrugAI
2024-04-28
1030
Chem. Sci. | 来鲁华、裴剑锋团队开发基于扩散模型的柔性分子对接方法
基于结构的虚拟筛选(SBVS)能够从大规模化合物库中快速识别潜在的活性分子。分子对接是SBVS中最常用的技术之一,它可以用于预测配体的结合姿态,描述蛋白质-配体的结合强度,并识别关键的相互作用。传统的分子对接方法一般使用刚性的蛋白质口袋作为对接的受体,即当蛋白-配体晶体结构已知时,移除配体分子再重新对接配体回到已知蛋白质的Holo态结合口袋。然而,在现实应用场景下的分子对接任务中,如果事先不知道受体的结合构象,由配体诱导的口袋构象的变动会使得刚性对接方法给出错误的预测。尽管AlphaFold2能够较准确地预测目标蛋白质的结构,但预测的靶标蛋白结构与结合态有一定差别,导致未考虑蛋白质柔性的刚性分子对接方法无法利用预测的结构给出正确的复合物结构。而现有的柔性分子对接方法,受限于计算复杂度,仅能考虑少量的侧链构象变化。一些基于深度学习的分子对接方法,对蛋白质进行粗粒化的主链编码在一定程度上可以克服局部的侧链构象变化,但由于口袋残基侧链原子信息的缺失以及缺乏基于物理模型的配体分子建模,所生成的对接构象经常出现配体构象不合理及配体与蛋白间的碰撞等问题,也不能提供对于配体进行优化所需要的受体与配体的相互作用细节。
DrugAI
2024-04-28
1140
Nat. Commun. | 基因组语言模型预测蛋白质共同调控和功能
今天为大家介绍的是来自Peter R. Girguis团队的一篇论文。解读基因与其基因组环境之间的关系是理解和工程生物系统的基础。机器学习在从大规模蛋白质序列数据集中学习隐藏的序列-结构-功能范式关系方面显示出潜力。然而,迄今为止,利用更高阶的基因组环境信息的尝试还很有限。进化过程决定了基因在不同系统发育距离中所处的基因组环境的特异性,这些新出现的基因组模式可以用来揭示基因产物之间的功能关系。在这里,作者训练了一个基因组语言模型(gLM),通过数百万的宏基因组来学习基因之间潜在的功能和调控关系。
DrugAI
2024-04-28
1490
Nat. Methods | 一个用于预测动态环境中全新蛋白-蛋白相互作用的平台
今天为大家介绍的是来自Ileana. M. Cristea团队的一篇论文。蛋白-蛋白相互作用(PPIs)推动细胞过程和对环境的反应,反映了细胞状态。在这里,作者开发了Tapioca,一个用于研究动态环境中全局PPIs的集成机器学习框架。
DrugAI
2024-04-28
1180
Nat. Commun. | AlphaFold2进行高通量预测蛋白质构象分布
今天为大家介绍的是来自Brenda M. Rubenstein团队的一篇论文。论文提出了一种创新方法,利用AlphaFold 2这一革命性的人工智能技术预测蛋白质构象的相对分布。AlphaFold 2通过精确预测蛋白质结构,已经在生物学领域引发了革命。尽管AlphaFold 2在准确性和速度方面表现出色,但它主要用于预测蛋白质的基态构象,预测构象景观的能力有限。作者在这里展示了AlphaFold 2如何通过对多序列对齐进行子样本抽样,直接预测不同蛋白质构象的相对分布。
DrugAI
2024-04-28
1220
Structure | 评估AlphaFold2在肽结构预测上的表现
今天为大家介绍的是来自Alican Gulsevin团队的一篇论文。近期在计算工具方面的进展极大提升了对蛋白质结构预测的准确度。计算预测方法已经被用于许多可溶性和膜蛋白的建模,但这些方法在肽结构建模上的表现尚未进行系统性研究。
DrugAI
2024-04-28
1180
J. Med. Chem. | 生物属性中对分子生成模型进行基准测试
今天为大家介绍的是来自Liwei Liu,Tingjun Hou和Yu Kang团队的一篇论文。基于深度学习的分子生成模型因其生成具有新颖结构和理想理化属性的分子的能力而受到越来越多的关注。然而,这些模型的评估,特别是在生物学背景下的评估,仍然不足。为了解决现有度量标准的局限性并模拟实际应用场景,作者构建了RediscMol基准测试,它包括从5个激酶和3个GPCR数据集中提取的活性分子。作者引入了一组重新发现和相似性相关的度量标准,以评估8个代表性的生成模型的性能。基于RediscMol基准测试的发现与之前的评估结果不同。CharRNN、VAE和Reinvent在重现已知活性分子方面表现出更强的能力,而RNNAttn、TransVAE和GraphAF尽管在常用的分布学习度量标准上表现突出,但在这方面存在困难。作者的评估框架可能为在现实世界药物设计场景中推进生成模型提供宝贵的指导。
DrugAI
2024-04-28
910
Nat. Mach. Intell. | 基于癌症影像生物标志物的基础模型
今天为大家介绍的是来自Hugo J. W. L. Aerts团队的一篇论文。深度学习中的基础模型特指一个在大量数据上训练的单一大型模型,作为各种下游任务的基础。基础模型通常通过自监督学习进行训练,在减少下游应用中训练样本需求方面表现出色。这在医学领域尤为重要,因为大型标记数据集往往很稀缺。
DrugAI
2024-04-28
800
Nat. Methods | 评估GPT-4在单细胞RNA测序分析中进行细胞类型注释的应用
今天为大家介绍的是来自Wenpin Hou和 Zhicheng Ji团队的一篇论文。在这里,作者展示了大型语言模型GPT-4可以准确地利用单细胞RNA测序分析中的标记基因信息来注释细胞类型。当在数百种组织和细胞类型上进行评估时,GPT-4生成的细胞类型注释与手工注释表现出强烈的一致性。这项能力可以显著减少细胞类型注释所需的努力和专业知识。此外,作者还开发了一个用于GPT-4自动化细胞类型注释的R软件包GPTCelltype。
DrugAI
2024-04-19
1280
Cancer Res. | 蒋庆华/许召春团队建立基于外周血免疫特征的多癌种早期诊断模型
近日,哈尔滨工业大学/哈尔滨医科大学蒋庆华/许召春教授团队提出基于外周血免疫信号的癌症早期诊断新思路,研发了首个基于外周血免疫特征的多癌种早期诊断人工智能模型,相关成果以“The deep learning framework iCanTCR enables early cancer detection using the T cell receptor repertoire in peripheral blood”为题发表在美国癌症研究协会官方期刊Cancer Research上。
DrugAI
2024-04-19
1220
十年对数据集偏差的斗争:我们达到目标了吗?
今天为大家介绍的是来自Kaiming He团队的一篇论文。在这个有着大规模、多样化且希望较少偏差的数据集以及更加强大的神经网络架构的新时代,作者重新审视了十年前Torralba和Efros提出的“数据集分类”实验。
DrugAI
2024-04-19
890
视觉语言模型是偏向于纹理还是形状,我们能否对它们进行引导
今天为大家介绍的是来自Janis Keuper团队的一篇论文。在过去几年里,视觉语言模型(VLMs)极大地改变了计算机视觉模型的格局,为我们开启了一系列激动人心的新应用,从zeroshot图像分类到图像描述再到视觉问题回答。与纯视觉模型不同,它们通过语言提示提供了一种直观的方式来访问视觉内容。这类模型的广泛适用性促使我们去探究它们是否也与人类视觉一致——特别是,它们在多模态融合中是否采纳了人类的视觉偏见,或者它们仅仅继承了纯视觉模型的偏见。一个重要的视觉偏见是纹理与形状之间的偏好,或者说是局部信息对全局信息的主导性。在这篇论文中,作者研究了一系列流行的VLMs中的这种偏见。有趣的是,作者发现VLMs通常比它们的视觉编码器更倾向于形状,这表明通过文本在多模态模型中对视觉偏见进行了一定程度的调整。
DrugAI
2024-04-19
910
Nat. Commun. | 相互作用引导药物设计的三维分子生成框架
今天为大家介绍的是来自韩国科学技术院的一篇利用相互作用引导进行3D 分子生成的论文。深度生成模型具有加速药物设计的强大潜力。然而,由于数据有限,现有的生成模型常常面临泛化方面的挑战,导致设计创新性较差,并且与看不见的目标蛋白之间往往存在不利的相互作用。为了解决这些问题,作者提出了一种相互作用感知的 3D 分子生成框架,该框架能够在目标结合口袋内进行相互作用引导的药物设计。通过利用蛋白质-配体相互作用的通用模式作为先验知识,作者的模型可以利用有限的实验数据实现高度的通用性。通过分析生成的未见靶标配体的结合姿势稳定性、亲和力、几何图案、多样性和新颖性,对其性能进行了全面评估。此外,潜在突变选择性抑制剂的有效设计证明了提出的方法对基于结构的药物设计的适用性。
DrugAI
2024-04-15
1170
Brief. Bioinform. | 蛋白质-小分子复合物结合强度和配体结合姿态一体预测的深度学习框架
基于结构的药物设计中一项重要的任务是预测配体在靶体口袋中的结合姿态,然而当前已报道的打分函数通常受限于精度,或是局限于单一的输出,比如仅预测构象姿势的偏差(RMSD),结合强度(pKd)或是基于残基-原子间距离分布的统计势。本文介绍的是近期发表在国际知名生物信息学期刊《Briefings in Bioinformatics》上的一篇题为《A New Paradigm for Applying Deep Learning to Protein-Ligand Interaction Prediction》的研究论文。该论文提出了一种同时预测蛋白质-配体复合物结合强度及配体结合姿态偏差RMSD的打分框架IGModel。论文的第一作者是智峪生科助理研究员王泽琛(山东大学物理学院博士在读),共同通讯作者是郑良振博士(智峪生科-深圳先进院联合实验室)和李伟峰教授(山东大学物理学院)。
DrugAI
2024-04-14
2060
Meta-MolNet:用于小样本药物发现的跨域元学习基准
今天为大家介绍的是来自北京大学AI4S平台中心主任、信息工程学院陈语谦教授团队提出了一种基于跨域元学习的图注意网络Meta-GAT,它可以在少数样本上可靠地预测分子属性。提议的图注意力网络可以有效地捕获任何原子间的相互作用以及键的边缘信息,以此来捕获原子的局部化学环境,并学习整个分子水平的几何空间结构和连接性。Meta-GAT利用分子数据中有用的未标记信息,并进一步开发有效的学习过程来转移来自源域的元知识。具体来说,Meta-GAT 模型对不同源域的大量类似分子进行先验分析获得元知识。Meta-GAT 受益于元知识,在转移到新的化学空间时降低了样本复杂性的要求。然后Meta-GAT 通过几个样本的内部迭代快速适应目标域中新支架集合的分子。实验表明,Meta-GAT 在多个基准生物活性和生理数据集上实现了最先进的领域泛化性能,并且在低数据约束下稳健地估计了各种分子特性数据集的不确定性。这些优势表明Meta-GAT很有可能成为面向少量样本的虚拟筛选技术的可行选择。
DrugAI
2024-04-12
930
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档