首页
学习
活动
专区
工具
TVP
发布

DrugAI

关注人工智能与化学、生物、药学和医学的交叉领域进展,提供“原创、专业、实例”的解读分享。
专栏成员
1142
文章
758352
阅读量
121
订阅数
Nat. Commun. | 结合分子结构与生物活性的生成化学语言模型
本文介绍一项由苏黎世联邦理工学院化学与应用生物科学系和苏黎世大学儿童医院联合发表于Nature Communications的研究工作。作者开发了一个利用已知配体结构和生物活性信息的分子设计方法,在大量化合物结构中预训练了两个生成化学语言模型(CLM),通过微调将CLM生成的分子偏向于特定的化学空间。通过对生成分子及其衍生物的活性测试验证了模型的有效性。
DrugAI
2023-03-09
4200
Nat. Comput. Sci. | 使用有监督的Transformer蛋白质语言模型进行单序列蛋白质结构预测
今天给大家介绍的是南开大学王文恺博士发表在nature computational science上的文章《Single-sequence protein structure prediction using supervised transformer protein language models》。作者提出了一种单序列蛋白质结构预测算法trRosettaX-Single。具体而言,trRosettaX-Single将有监督的Transformer蛋白质语言模型中的序列嵌入整合到通过知识蒸馏增强的多尺度网络中,预测残基间二维几何结构,然后利用能量最小化重建三维结构。
DrugAI
2023-02-17
6100
Nature Methods | 蛋白质序列的深度嵌入和比对
这次为大家报道的是nature methods 上一篇题为” Deep embedding and alignment of protein sequences” 的文章,来自法国巴黎Google Research的Brain Team团队。
DrugAI
2023-02-13
5590
PubMed GPT : 用于生物医学文本的特定领域大型语言模型
“我们很高兴发布一种在PubMed上训练的新生物医学模型,这是构建可支持生物医学研究的基础模型的第一步。”——CRFM主任Percy Liang
DrugAI
2023-02-13
8160
基于结构的药物设计与几何深度学习
本文介绍一篇来自于苏黎世联邦理工大学的Gisbert Schneider等人的关于几何深度学习的综述《Structure-based Drug Design With Geometric Deep Learning》。
DrugAI
2022-11-28
1.1K0
用于药物发现的抗体表征学习
今天给大家介绍的是麻省理工学院林肯实验室、电子研究实验室等机构发表在arxiv上的预印文章《Antibody Representation Learning for Drug Discovery》。作者开发了一个抗体序列特定的预训练语言模型。发现在通用蛋白质序列数据集上对模型进行预训练可以更好的支持特征细化和学习抗体结合预测。证明语言模型能够在抗体结合预测方面学习到比传统抗体序列特征或CNN模型学习的特征都更有效的特征。分析了训练数据大小对预训练模型性能的敏感性。
DrugAI
2022-11-28
5820
Nat. Biotechnol. | 使用语言模型和深度学习的单序列蛋白质结构预测
今天带来的是美国马萨诸塞州波士顿哈佛医学院系统药理学实验室发表在nature biotechnology上的Single-sequence protein structure prediction using a language model and deep learning。
DrugAI
2022-11-28
3290
ImmunoLingo:基于语言学的抗体序列形式化方法
今天给大家介绍的是挪威奥斯陆大学语言学系、免疫学系等机构在 arxiv 上发表的预印文章《ImmunoLingo: Linguistics-based formalization of the antibody language》在文章中作者提出了抗体语言的两步语言形式化,以指导可解释抗体LM(language model)设计:(1)识别抗体序列(类似物)共享的自然语言属性。(2)基于已识别的类似物(语言模型)形式化抗体语言。将抗体序列语言的语言形式化整合到预处理抗体LM中。作者表示通过这种方式可以使模型有更好的可解释性,同时保持统计处理大型非结构化数据的能力。
DrugAI
2022-11-28
5510
ImmunoLingo:基于语言学的抗体序列形式化方法
今天给大家介绍的是挪威奥斯陆大学语言学系、免疫学系等机构在 arxiv 上发表的预印文章《ImmunoLingo: Linguistics-based formalization of the antibody language》在文章中作者提出了抗体语言的两步语言形式化,以指导可解释抗体LM(language model)设计:(1)识别抗体序列(类似物)共享的自然语言属性。(2)基于已识别的类似物(语言模型)形式化抗体语言。将抗体序列语言的语言形式化整合到预处理抗体LM中。作者表示通过这种方式可以使模型有更好的可解释性,同时保持统计处理大型非结构化数据的能力。
DrugAI
2022-11-28
5510
IBM | 基于断开提示的逆向合成语言模型
本文介绍一项IBM欧洲研究所的研究工作。作者首次将提示学习用于化合物逆向合成预测,在标注提示断开位置上进行监督学习,训练出的断开感知模型在断开预测方面性能具有一定提升。同时利用自动标注模型对断开感知模型进行扩展,提升了模型的鲁棒性,并通过实验证明了断开感知模型在酶促反应中的有效性。该模型首次使用人类设计的提示改进逆向合成,将专家知识与深度学习有效结合,在序列语言预测上比基线模型提高了39%的准确率。
DrugAI
2022-11-28
4160
用蛋白语言模型改进蛋白复合物预测
今天要为大家介绍的是清华大学唐杰教授课题组发表在 bioRxiv 上的文章 Improve the Protein Complex Prediction with Protein Language Models。本文提出了 ColAttn 方法,该方法利用蛋白质语言模型识别复合物的间相互作用,并进一步结合多序列比对方法来提升结构预测准确性。
DrugAI
2022-11-28
5270
抗体优化新方法:通过AI预测亲和力和自然度
今天给大家介绍的是由来自Absci公司的Vancouver (WA)团队发表在bioRxiv上的预印文章《Antibody optimization enabled by artificial intelligence predictions of binding affinity and naturalness》。这篇文章提出利用人工智能对抗体进行优化的基于高通量亲和数据训练的深层语境语言模型(deep contextual language models trained on high-throughput affinity data),并运用名为ACE和SPR的方法,用于生成抗体结合亲和力的相对传统方法而言更优的测量,然后基于两种不同的抗体证明了可以定量预测未知抗体序列变体的结合。
DrugAI
2022-11-28
6590
加速构建蛋白质元宇宙!分子之心借MoleculeOS引擎完成AI蛋白预测三级迭代
8月11日,“AI蛋白质预测奠基人”许锦波领衔的分子之心团队宣布,在蛋白质结构预测领域取得一项重要进展。基于AI的单序列蛋白质结构预测算法RaptorX-Single可以在不使用MSA(来自同源蛋白质的多序列比对)的情况下,从其一级序列直接预测蛋白质结构,并实现超越DeepMind AlphaFold2等方法的性能。同时,RaptorX-Single所采用的模型更轻量,参数不到Meta ESMFold 方法的三分之一。
DrugAI
2022-11-28
3910
Nat. Commun. | 用于蛋白质设计的深度无监督语言模型ProtGPT2
本文介绍一篇拜罗伊特大学2022年7月发表在nature communications的《ProtGPT2 is a deep unsupervised language model for protein design》。蛋白质设计在自然环境和生物医学中发挥着重要作用,旨在为特定用途设计全新的蛋白质。受到近期Transformer架构在文本生成领域成功的启发,作者提出ProtGPT2,一种在蛋白质空间上训练的语言模型,用于生成遵循自然序列原则的全新蛋白质序列。ProtGPT2生成的蛋白质显示出天然氨基酸倾向,而无序预测表明,88%的ProtGPT2生成的蛋白质是球状的,与自然序列一致。蛋白质数据库中的敏感序列搜索表明,ProtGPT2序列与自然序列有着远亲关系,相似网络进一步证明,ProtGPT2是对蛋白质空间中未探索区域的采样。ProtGPT2生成的序列在探索蛋白质空间的未知区域时,保留了天然蛋白质的关键特征。
DrugAI
2022-11-28
4490
Nat. Commun. | 用于蛋白质设计的深度无监督语言模型ProtGPT2
本文介绍一篇拜罗伊特大学2022年7月发表在nature communications的《ProtGPT2 is a deep unsupervised language model for protein design》。蛋白质设计在自然环境和生物医学中发挥着重要作用,旨在为特定用途设计全新的蛋白质。受到近期Transformer架构在文本生成领域成功的启发,作者提出ProtGPT2,一种在蛋白质空间上训练的语言模型,用于生成遵循自然序列原则的全新蛋白质序列。ProtGPT2生成的蛋白质显示出天然氨基酸倾向,而无序预测表明,88%的ProtGPT2生成的蛋白质是球状的,与自然序列一致。蛋白质数据库中的敏感序列搜索表明,ProtGPT2序列与自然序列有着远亲关系,相似网络进一步证明,ProtGPT2是对蛋白质空间中未探索区域的采样。ProtGPT2生成的序列在探索蛋白质空间的未知区域时,保留了天然蛋白质的关键特征。
DrugAI
2022-11-28
4490
DeepMind | 通过去噪来进行分子性质预测的预训练
今天给大家带来的是牛津大学的Sheheryar Zaidi和DeepMind公司的Michael Schaarschmidt联合发表的文章《Pre-training via Denoising for Molecular Property Prediction》。从3D结构中预测分子性质的数据有限,这对神经网络的泛化造成了挑战。作者介绍了一种预训练技术,它利用平衡状态下3D分子结构的大型数据集来为下游任务学习有意义的表示。受最近噪声正则化的启发,作者的预训练目标是基于去噪的。依赖于去噪自动编码器和分数比配之间公认的联系,作者还表明目标对应于直接从平衡结构学习分子力场——其由高斯混合近似物理状态分布产生。实验表明,使用这个预训练目标可以大大改善多个基准测试的性能,在广泛使用的QM9数据集中达到了最先进水平。最后,作者分析了不同因素对预训练的影响,并提出了实用性的见解。
DrugAI
2022-11-28
3440
Nat. Comm. | 语言模型可以学习复杂的分子分布
本文介绍由加拿大多伦多大学的Daniel Flam-Shepherd和Alán Aspuru-Guzik共同通讯发表在Nature Communications的研究成果:作者研究了语言模型学习复杂的分子分布的能力。通过编译更大、更复杂的分子分布,作者引入几个挑战性的分子生成任务评估语言模型的学习能力。结果表明,语言模型具有强大的生成能力,能够学习复杂的分子分布。语言模型可以准确生成:ZINC15数据集中惩罚 LogP得分最高分子的分布、PubChem数据集中多模态分子及最大分子的分布。
DrugAI
2022-11-28
4610
AIChE | 集成数学规划方法和深度学习模型的从头药物设计框架
本文将介绍大连理工大学都健教授团队近期在AIChE期刊上发表的论文“De novo drug design framework based on mathematical programming method and deep learning model”,其团队开发了一个深度学习模型用于识别具有高结合亲和力的靶标-配体复合物,并将其与数学规划模型进行集成,实现了高通量反向优化设计小分子药物目标,进一步以治疗心血管疾病的利伐沙班替代药设计和治疗肿瘤疾病的阿昔替尼替代药设计为例,证明了本文所提出的从头药物设计框架的通用性和有效性。
DrugAI
2022-06-10
4900
Nat. Biotechnol.|基于深度学习从人体肠道微生物群中识别抗菌肽
本文介绍了中国科学院微生物研究所王军及陈义华共同通讯发表在Nature Biotechnology的文章《Identification of antimicrobial peptides from the human gut microbiome using deep learning》。作者结合了包括LSTM、Attention和BERT在内的多种自然语言处理神经网络模型,形成了一个统一的管道,用于从人类肠道微生物组数据中识别候选抗菌肽(AMP)。在被确定为候选AMP的2349个序列中,化学合成了216个,其中显示出抗菌活性的有181个。并且,在这些多肽中,大多数与训练集中AMP的序列同源性低于40%。对11种最有效的AMP的进一步表征表明,它们对抗生素耐药的革兰氏阴性病原体具有很高的疗效,并且对细菌性肺部感染的小鼠模型显示出了细菌负荷降低10倍的效果。该研究展示了机器学习方法从宏基因组数据中挖掘功能肽并加速发现有前景的AMP候选分子以进行深入研究的潜力。
DrugAI
2022-03-25
5450
Nat. Commun.|一个将分子结构和生物医学文本桥接起来的深度学习系统,其理解力可与人类专业人员媲美
本次介绍一篇由清华大学计算机系孙茂松团队发表于nature communications,名为《A deep-learning system bridging molecule structure and biomedical text with comprehension comparable to human professionals》的论文。该论文通讯作者为计算机系党委副书记刘知远副教授与孙茂松教授,第一作者为计算机系博士生曾哲妮与姚远。该研究由国家重点研发计划与清华大学国强研究院提供支持。
DrugAI
2022-03-25
4200
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档