发布

DrugAI

关注人工智能与化学、生物、药学和医学的交叉领域进展,提供“原创、专业、实例”的解读分享。
专栏成员
1308
文章
851976
阅读量
125
订阅数
Sci. Adv.| 基于大语言模型的抗菌肽设计
本文介绍一篇来自浙江大学侯廷军和谢昌谕团队、南部战区总医院姜志辉主任团队和碳硅智慧联合发表的一篇论文。该研究提出了一种基于大语言模型的抗菌肽(AMPs)设计方法AMP-Designer,在48天内,完成了18种抗菌肽的从头设计与湿实验的验证。体外抗菌实验结果表明,17种抗菌肽对革兰氏阴性菌展现出广谱抗菌活性,成功率高达94.4%。其中,2个优选抗菌肽不仅表现出优异的体内抗菌效果,同时兼具极低的溶血毒性、良好的人体血浆稳定性以及很低的耐药性诱导风险。这一研究成果为应对日益严峻的抗生素耐药性问题提供了新的解决方案和研究方向。
DrugAI
2025-03-07
610
Nat. Mach.Intell. | 数据驱动的联邦学习:知识蒸馏助力药物发现新突破
人工智能在科学研究中的一大挑战是如何确保获取足够的高质量数据,以构建具有影响力的模型。尽管公共数据资源丰富,但最有价值的知识往往深藏于企业的机密数据孤岛之中。尽管各行业日益开放共享非竞争性信息,这种合作仍受到数据机密性的限制。联邦学习(Federated Learning, FL)使得知识共享成为可能,同时保护数据隐私,但仍存在显著局限性。
DrugAI
2025-03-06
670
Nat. Rev. Drug Discov. | GPCR靶向药物新纪元:创新药物、新靶点与突破性适应症
G蛋白偶联受体(GPCRs)是规模最大的药物靶点家族之一,反映了其在众多病理生理过程中的关键作用。本综述分析了GPCR超家族的药物发现趋势,涵盖已获得监管批准或正在临床试验阶段的化合物、靶点及适应症。研究发现,目前已有516种获批药物针对GPCR,占所有批准药物的36%。这些药物作用于121个GPCR靶点,约占所有非感官GPCR的三分之一。此外,针对133个GPCR(其中包括30个新靶点)的337种药物正在临床试验中。其中,165种为已获批药物,正在探索新的适应症,而新型药物正越来越多地采用变构调节剂和生物制剂的形式。值得注意的是,针对GPCR的糖尿病与肥胖症药物在2023年的销售额接近300亿美元,且代谢性疾病、肿瘤学和免疫学领域的GPCR调节剂临床试验数量正在迅速增长。
DrugAI
2025-03-06
660
Nat. Commun. | 医学推理中,大语言模型普遍缺乏自我认知
今天为大家介绍的是来自比利时鲁汶大学的Maxime Griot团队的一篇论文。大语言模型在医学委员会考试中展现出媲美专家的准确性,显示出其在临床辅助决策系统方面的应用潜力。然而,在医疗决策过程中极其重要的元认知能力(metacognitive abilities) 尚未得到深入研究。为了填补这一研究空白,研究团队开发了MetaMedQA测试基准。这个基准将置信度评分和元认知任务融入医学选择题中。研究人员从多个维度对12个模型进行了评估,包括它们在不同置信度下的答题准确性、识别缺失答案的能力,以及辨认未知问题的表现。研究发现,尽管这些模型在常规医学选择题上表现优异,但所有受测模型都显示出明显的元认知能力不足。具体表现为:即使在没有正确答案选项的情况下,模型仍会自信地给出答案,无法意识到自身知识的边界。这项研究表明,目前的模型在医学推理方面存在认知偏差,即其自我评估能力与实际能力之间存在显著差异,这在临床应用中可能带来严重风险。研究结果强调,在开发基于大语言模型的临床辅助决策系统时,需要建立更完善的评估体系。这个体系必须将元认知能力作为关键评估指标,以确保系统的可靠性和安全性。
DrugAI
2025-03-04
570
Nat. Commun. | 当前小分子数据集存在显著覆盖偏差!耶拿大学团队新发现
今天为大家介绍的是来自德国耶拿大学Sebastian Böcker团队的一篇论文。小分子机器学习旨在从分子结构预测化学、生物化学或生物学特性,其应用包括毒性预测、配体结合和药代动力学。最近的一个趋势是开发避免显式领域知识的端到端模型。这些模型假设训练和评估数据中没有覆盖偏差,这意味着数据能代表真实分布。然而,这类模型很少考虑适用性范围。在这项研究中,作者调查了大规模数据集对已知生物分子结构空间的覆盖程度。为此,作者提出了一种基于求解最大公共边子图(MCES)问题的距离度量方法,该方法与化学相似性有很好的一致性。尽管这种方法在计算上很困难,但作者引入了一种结合整数线性规划和启发式边界的高效方法。研究结果表明,许多广泛使用的数据集缺乏对生物分子结构的均匀覆盖,这限制了在这些数据集上训练的模型的预测能力。作者提出了两种额外的方法来评估训练数据集是否偏离已知分子分布,这可能有助于指导未来数据集的创建以提高模型性能。
DrugAI
2025-03-03
750
Cell. Syst. | 通过机器学习预测适应性免疫受体面临数据生成挑战
今天为大家介绍的是来自瑞士的博特纳免疫工程研究所Sai T. Reddy团队的一篇论文。免疫系统中最重要的防御武器是免疫受体,其中包括B细胞受体(BCR)、它们分泌的抗体,以及T细胞受体(TCR)。这些免疫受体就像是免疫系统的“智能雷达”,能够精确识别和对抗入侵者。它们最神奇的特点是拥有一个高度灵活的识别区域,可以通过改变自身结构来识别数不胜数的不同入侵物质(抗原)。虽然AI领域的明星工具AlphaFold(一个能够预测蛋白质结构的人工智能系统)在蛋白质结构预测方面取得了突破性进展,但在预测免疫受体方面仍面临两大挑战:一是高质量的免疫受体结构数据太少,二是免疫受体与入侵物质之间的相互作用机制过于复杂。在这篇综述中,作者重点介绍了两个关键领域的最新进展:一是基于免疫受体序列信息的数据生成技术,二是基于其结构信息的数据生成方法。这些进展对于开发能够预测免疫受体识别特性的机器学习模型至关重要。同时,作者也探讨了当前面临的技术瓶颈,以及未来如何更好地利用海量多维度数据来预测和设计具有特定识别功能的抗体和T细胞受体。
DrugAI
2025-03-03
600
Drug Discov. Today | 靶向蛋白降解剂的PK/PD建模
本期分享一篇关于蛋白降解剂(TPDs)的文章,文章简要介绍了下,目前TPDs的PK/PD模型进行,里面引用了很多modeling work,可以去看下模型结构,尝试复现下,后续我也会尝试复现相关模型,并分享。欢迎大家一起讨论。
DrugAI
2025-03-03
390
Sci. Adv. | 挑战"难成药"蛋白,PepPrCLIP设计精准结合肽
今天为大家介绍的是来自美国杜克大学Pranam Chatterjee团队的一篇论文。设计结合剂以靶向难成药蛋白在药物研发中是一项重大挑战。在本研究中,作者提供了一个算法框架,用于设计短小、能与靶点结合的线性肽,仅需靶蛋白的氨基酸序列。为此,作者提出了一个通过ESM-2蛋白质语言模型的肽潜在空间高斯扰动来生成自然状态肽候选物的过程,随后通过基于对比语言-图像预训练(CLIP)的对比学习架构筛选这些新序列的靶点选择性相互作用活性。通过整合这些生成性和判别性步骤,作者创建了一个通过CLIP进行肽优先排序(PepPrCLIP)的流程,并通过实验验证了高排名、靶点特异性肽的有效性,包括作为抑制性肽和与E3泛素连接酶域的融合。PepPrCLIP衍生的构建体在体外展示了对构象多样、疾病驱动靶点的功能性强结合和降解能力。总体而言,PepPrCLIP使得调控先前无法接触的蛋白成为可能,而无需依赖稳定有序的三级结构。
DrugAI
2025-03-03
470
Nat. Mach. Intell. | 大语言模型在分子科学中知识学习偏好的定量分析
今天为大家介绍的是来自深圳鹏城实验室任智祥团队的一篇论文。深度学习技术在分子研究领域取得了重大突破,让我们能够更快更好地理解分子结构并设计新型分子。其中,大语言模型的出现开创了一个新天地,它让我们可以用处理人类语言的方式来解决分子科学问题。这些模型在理解和创造分子方面表现出色,往往比传统方法更有效。不过,研究人员发现两个关键问题亟待解决:一是如何准确评估模型对不同类型数据的处理能力,二是如何找出模型在学习过程中的特点和偏好。为此,研究团队开发了一个名为ChEBI-20-MM的综合测试系统,并通过1263次实验来深入研究这些问题。研究不仅揭示了不同数据类型之间的转化规律,还创新性地提出了一种新方法,能够清晰地展示模型是如何在特定场景下学习和运用知识的。这项研究为我们理解大语言模型的工作机制提供了新的视角,也为推动其在分子科学领域的应用铺平了道路。
DrugAI
2025-03-03
240
Nat. Med. | AI赋能药物研发:从靶标发现到临床试验的全流程革新
今天为大家介绍的是来自温州医科大学眼健康与疾病高等研究院院长张康教授联手四川大学华西医院生物治疗国家重点实验室的杨胜勇教授团队联合发表的一篇论文。药物开发是一个复杂且耗时的过程,传统上主要依靠研发人员的经验和不断试错来完成。随着人工智能(AI)技术的发展,特别是新兴的大语言模型和生成式AI的出现,这一领域正在发生革命性的变化。将AI技术引入药物开发流程后,已经显著提升了整个过程的效率和成功率。本文将全面介绍AI在整个药物研发过程中的最新应用进展,包括疾病靶点的识别、新药发现、临床前研究、临床试验以及药物上市后的安全监测等环节。同时,作者也会分析目前面临的主要挑战,为未来AI辅助药物开发指明重要的研究方向。
DrugAI
2025-02-27
1270
Nat. Commun. | 深度学习赋能RNA研究,NuFold实现精确RNA结构预测
今天为大家介绍的是来自美国普渡大学Daisuke Kihara团队的一篇论文。RNA不仅作为信使RNA在基因表达过程中发挥信息传递的重要作用,还作为非编码RNA参与各种生物学功能。理解其功能的机械机制需要三级结构信息;然而,实验测定RNA三维结构既昂贵又耗时,导致RNA序列和结构数据之间存在巨大差距。为了应对这一挑战,作者开发了NuFold,这是一种新型计算方法,利用最先进的深度学习架构来准确预测RNA三级结构。NuFold是一个端到端训练的深度神经网络,可以从输入序列预测输出结构。NuFold采用核碱基中心表示法,使核糖环构象更加灵活。基准研究表明,NuFold明显优于基于能量的方法,并且与现有最先进的基于深度学习的方法相比表现相当。NuFold在构建RNA的正确局部几何结构方面具有特殊优势。对NuFold流程中各个组件的分析表明,通过利用宏基因组序列进行多序列比对并增加recycling次数,可以提高其性能。NuFold还能够通过连接输入序列来预测RNA的多聚体复合物结构。
DrugAI
2025-02-26
1320
ICLR2025 | CBGBench: 在蛋白-分子的复合物3D空间做完形填空
基于结构的药物设计(Structure-Based Drug Design, SBDD)旨在生成能够与目标蛋白结合的潜在药物分子,并在生成式 AI 技术的推动下得到了极大加速。然而,由于多样化的实验设置、复杂的实现、难以复现的结果以及单一任务的局限性,这一领域仍缺乏系统性的理解。
DrugAI
2025-02-25
790
三篇Nature子刊谱写分子世界模型三部曲|ImageMol,VideoMol,SketchMol
随着人工智能从大语言模型(LLM)向世界模型(world model)的进一步探索,基于分子图像的“分子世界模型”,正成为革新药物研发流程的关键引擎。近几年,湖南大学DrugAI实验室提出了分子图像系列世界模型ImageMol(NMI 2022),Video Mol(NC 2024),SketchMol(NMI 2025),以新颖的分子视觉思路为药物发现带来了革命性突破。
DrugAI
2025-02-25
1440
Nat.Mach.Intell.|Delete:基于深度学习的先导化合物优化模型
本文介绍一篇来自浙江大学潘培辰、侯廷军、康玉和谢昌谕团队联合香港科技大学黄湧联合发表的一篇论文。该研究提出一种基于深度学习的先导化合物优化模型Delete(Deep Lead Optimization Enveloped in Protein Pocket),结合生成式AI与基于结构的分子设计策略,首次实现linker设计、片段替换、骨架跃迁及侧链修饰等所有先导化合物优化子任务的全流程整合。研究团队将Delete应用于非小细胞肺癌全新致癌靶点CLIP1-LTK,成功设计出纳摩尔级活性分子(IC50=1.36nM),其选择性及抗肿瘤机制已通过体内外实验验证。这项工作代表了基于蛋白质结构的生成 AI 的成功实施,提出了一个高效的先导化合物优化模型 Delete,为分子设计和药物开发领域提供一种高效、精准且可靠的优化工具。
DrugAI
2025-02-21
551
Nature | 全新设计的跨膜荧光激活蛋白
跨膜蛋白对生物膜内外的物质、能量和信息交换至关重要。尽管在 水溶性蛋白结合小分子 和 跨膜蛋白设计 上取得了一定进展,但 针对特定小分子的高亲和力、非共价结合的跨膜蛋白设计 仍然面临挑战。本研究中,研究人员通过 深度学习与能量优化方法相结合,准确设计了小分子结合跨膜蛋白。通过高质量四螺旋束 (four-helix bundle) 背骨预组织 配体结合口袋,并利用 梯度引导的幻觉 (gradient-guided hallucination) 方法生成 跨膜螺旋,成功设计了 高活性的跨膜荧光激活蛋白 (tmFAP)。这些 tmFAPs 能够特异性激活目标荧光配体 (HBC599),显示出 中纳摩尔亲和力,并且 亮度和量子产率 显著高于 增强型绿色荧光蛋白 (EGFP)。此外,这些蛋白在 细菌和真核细胞膜中 高度活跃,晶体结构和冷冻电镜 (cryo-EM) 结果与设计模型高度一致。本研究首次展示了非共价小分子结合跨膜蛋白的 de novo 精确设计,为 成像、配体感知和膜运输 等功能性跨膜蛋白的创造开辟了新路径。
DrugAI
2025-02-20
630
Nat. Comput. Sci. | 利用大型语言模型进行数据稀缺环境下的聚合物性质学习
本研究提出了一种基于大型语言模型(LLM)的方法,用于在数据稀缺环境下预测聚合物性质。由于实验数据昂贵且有限,研究人员构建了一种物理引导的训练框架,通过生成合成数据对LLM进行预训练,并在少量实验数据上进行微调。该方法以火灾燃烧实验(锥形量热计测试)为案例,展示了两阶段训练策略如何提高模型准确性。实验结果表明,相较于传统LLM,本方法在点火时间(tig)和峰值热释放率(pHRR)预测上分别提高了51.1% 和 45.8% 的准确度。
DrugAI
2025-02-19
1310
Nat. Microbiol. | 可解释的深度学习和虚拟进化识别具有抗多药耐药人类病原体活性的抗菌肽
今天介绍一篇发表在Nature Microbiology上的论文:“Explainable deep learning and virtual evolution identifies antimicrobial peptides with activity against multidrug-resistant human pathogens”。随着抗生素耐药性问题的日益严重,计算机辅助抗菌肽(AMPs)设计成为一种重要的研究方向。然而,尽管传统的机器学习模型在预测肽的抗菌活性方面表现出色,但它们通常缺乏对肽序列优化过程的可解释性,导致难以指导实际的肽设计。为了解决这一问题,本文提出了一个集成的计算框架,包括三个主要部分:AMP-CLIP(AMP CLassifier with Improved Precision)、AMP-READ(Antimicrobial Peptide Regression and Analysis for Drug Discovery)和EvoGradient(Evolutionary Gradient-based Optimization for Antimicrobial Peptides)。
DrugAI
2025-02-18
710
Nat. Commun. | 通过引入和利用转录因子结合单元(TFBU)对增强子进行建模与设计
增强子在各种生物过程中通过与转录因子(TFs)相互作用,成为基因表达的关键调控元件。尽管转录因子结合位点(TFBSs)被广泛认为是决定TF结合和增强子活性的关键因素,但其周围的上下文序列在多大程度上影响TF结合及增强子活性仍未被量化。在本研究中,研究人员提出了转录因子结合单元(TFBU)的概念,以模块化方式建模增强子,并使用深度学习模型定量分析TFBS周围的上下文序列的影响。基于该概念,研究人员开发了DeepTFBU,一个用于增强子设计的综合工具包。研究结果表明,设计TFBS的上下文序列可以显著调控增强子活性,并产生细胞类型特异性响应。此外,DeepTFBU在从头设计(de novo design)包含多个TFBS的增强子方面表现出色,同时能够灵活地解耦和优化增强子。研究人员证明了TFBU是增强子建模和设计的关键概念,而DeepTFBU则是高效的理性增强子设计工具。
DrugAI
2025-02-18
1290
Nat. Methods | Foldseek-Multimer:快速且高灵敏度的蛋白质复合物比对方法
随着计算结构预测技术的发展,目前可用的蛋白质复合物结构数量将大幅增加。要从这些数据中提取有价值的发现,必须对蛋白质复合物进行比对,但这在计算上极具挑战性。Foldseek-Multimer 通过高效聚类超位移向量,识别兼容的链对比对,从而计算复合物比对。该方法比当前金标准方法快 3–4 个数量级,同时比对质量相当,使其能够在 11 小时 内比对数十亿个复合物对。Foldseek-Multimer 是开源软件,可在 GitHub 获取,并可通过 Foldseek 搜索平台 及 BFMD 数据库使用。
DrugAI
2025-02-18
900
Nat. Mach. Intell.|从虚拟筛选角度评估AI驱动的分子对接方法
本文介绍一篇来自浙江大学侯廷军教授和康玉副教授团队联合碳硅智慧发表的论文。该论文构建了一个全面的虚拟筛选(VS)数据集VSDS-vd,并系统评估了多种AI驱动的分子对接方法和传统的基于物理原理的对接方法在VS中的表现。评估结果显示,尽管AI对接方法在生成对接构象的物理合理性方面存在不足,特别是蛋白-配体间易出现立体冲突,且现有配体后处理方法未能有效缓解这一问题,但AI对接方法在VS中仍然展现出巨大潜力。基于评估结果,作者创造性地提出了一种层级式VS策略,该策略在筛选速度和精度两方面实现了动态平衡,为大规模药物筛选应用提供了极具前景的新途径。
DrugAI
2025-02-18
1900
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档