前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >2021年度蛋白质结构预测最佳方法

2021年度蛋白质结构预测最佳方法

作者头像
DrugAI
发布于 2022-03-25 05:38:18
发布于 2022-03-25 05:38:18
5590
举报
文章被收录于专栏:DrugAIDrugAI

数十年来,在给定氨基酸线性序列的情况下,预测蛋白质三维结构的潜力一直吸引着计算生物学家。虽然在该领域取得了相当大的进展,但还没有一种方法能够可靠地生成接近、更不用说匹配实验确定结构质量的模型。在过去的一年里,基于深度学习的方法AlphaFold2和RoseTTAfold成功地在一系列靶标上实现了这一壮举,永远改变了结构生物学领域的进程。更令人印象深刻的是,欧洲分子生物学实验室和 DeepMind 之间的合作预测了 21 种模式生物的超过 350,000 种蛋白质的结构,并存储在AlphaFold 蛋白质结构数据库——计划在 2022 年将预测扩展到数百万个结构。

一年前,在CASP14会议上,来自 DeepMind 的 AlphaFold2 的表现优于所有其他方法,而且差距很大。平均而言,AlphaFold2 正确预测的蛋白质结构比例超过了 90%。坦率地说,这种规模的业绩飞跃在接下来的十年左右是没有预料到的。因此,许多人认为蛋白质折叠问题已基本解决也就不足为奇了。

AlphaFold 的成功可归因于其神经网络架构和考虑到实验解析蛋白质的可用 3D 结构的训练程序。受 AlphaFold 方法的启发,虽然论文和相关代码尚未发布,但由 David Baker 领导的一个学术团队开发了 RoseTTAFold,它的性能几乎一样。

如果没有大量实验结构数据作为深度学习的训练数据资源,这一切都不可行。在过去的50 年中,结构生物学家已经努力解决了超过 170,000 种蛋白质的结构,并蛋白质数据库 (PDB)中公开分享了这些结构。幸运的是,在数据存储库几乎不是常态的时候公开共享数据的决定被证明是该领域的最佳投资之一。

一场新的计算竞赛已经开始。自发布以来,AlphaFold 和 RoseTTAFold 均已进一步优化以预测多蛋白复合物。其他几个预印版本文章可以扩展 AlphaFold 方法或将其应用于更具体的问题。


Nature丨AlphaFold2带着源码来了,开启AI生命科学的新时代

2021年7月15日,DeepMind团队在Nature杂志上发表了文章"Highly accurate protein structure prediction with AlphaFold",描述了AlphaFold2是一个基于神经网络的全新设计的AlphaFold版本,其预测的蛋白质结构能达到原子水平的准确度。

Nature | AlphaFold预测98.5%人类蛋白结构,科学研究新范式

2021年7月22日,DeepMind团队再次在Nature发表了文章Highly accurate protein structure prediction for the human proteome,描述了AlphaFold对人类蛋白质组(人类基因组编码的所有蛋白质的集合)的准确结构预测。由此得到的数据集涵盖了人类蛋白质组近60%氨基酸的结构位置预测,且预测结果具有可信度。预测信息将通过欧洲生物信息研究所(EMBL-EBI)托管的公用数据库免费向公众开放。

让子弹飞 | 院士深度解析Alphafold DB的未来影响

DeepMind和EMBL-EBI合作发布了数据库AlphaFold DataBase (AlphaFold DB),向社会免费提供AlphaFold结构预测结果。初始的AlphaFold DB涵盖了属于人类以及其他20个重要物种的大多数具有较大价值的蛋白质, 包含超过35万个不同的蛋白结构,并最终将增加到约1.3亿个三维结构(约为目前PDB数据库的700倍)

未来的几个月里,AlphaFold DB将扩展到涵盖所有编码蛋白质的90%。这意味着对于UniProt数据库中的每一个蛋白序列,要么有一个实验确定的结构,要么有一个AlphaFold预测的结构,或者可以使用传统的结构预测技术根据PDB或AlphaFold DB中类似序列的模型来轻易地建立结构。这一发展代表了分子生物学的一个重要变化:几乎所有已知序列的蛋白质都将有一个高质量的三维模型可用。那么,AlphaFold DB将可能有哪些重要应用呢?我们来听听英国皇家学会院士Stephen Cusack等人的看法。

Science | 面对alphafold,学术界没有躺平:RoseTTAFold挑战蛋白复合物预测

2021年7月15日,华盛顿大学蛋白设计研究所David Baker教授课题组及其他合作机构在Science上发表论文"Accurate prediction of protein structures and interactions using a three-track neural network",公布了其开源蛋白质预测工具RoseTTAFold的研究结果。

受到DeepMind团队AlphaFold2结果的启发,为了提高结构生物学研究的蛋白质结构预测准确性和推进蛋白质设计,研究人员探索了包含这五种特性的不同组合的网络架构。在没有公开的方法的情况下,研究人员尝试了多种方法来在网络的不同部分之间传递信息,成功地产生了一个“双轨”网络,其中信息沿着一维序列对齐轨迹和二维距离矩阵轨迹并行流动,其性能比 trRosetta好得多,这是次优方法在 CASP14 中的 AlphaFold2 之后。

Nat.Commun. | DeepAccNet:基于深度学习的准确性估计改善蛋白质结构优化

蛋白质设计科学家David Baker课题组发表在Nature Communications上的一项工作。这项工作中,作者提出了一个深度学习框架DeepAccNet,用于估计蛋白质模型中每个残基的准确性和残基-残基距离中的符号错误,并使用这些预测来指导Rosetta蛋白质结构优化。在Rosetta改进方案的多个阶段中,加入准确性预测,可以大大提高所得蛋白质结构模型的准确性,说明深度学习可以改善对生物分子整体能量最小值的搜索。

Nat. Commun.| CopulaNet:直接从多序列联配中学习残基间距离以“从头预测”蛋白质结构

蛋白质是具有重要功能的生物大分子,其功能主要由蛋白质的三级结构决定。蛋白质结构可通过核磁共振、X射线晶体学和低温电镜等实验技术测定,然而这些实验技术有其局限性,无法跟上蛋白质序列测定的增长速度。近几年,利用深度学习技术,蛋白质结构预测取得了重大进展,能够得到较为准确的三级结构。今天为大家介绍的这篇文章,是中科院计算所卜东波老师实验室发布的关于蛋白质结构“从头预测”算法的最新研究成果(原文见https://www.nature.com/articles/s41467-021-22869-8)。以CopulaNet为核心,卜东波老师实验室开发了新版的蛋白质结构预测软件ProFOLD,预测软件源代码见http://protein.ict.ac.cn/ProFOLD,预测服务器见http://protein.ict.ac.cn/FALCON2/,欢迎大家使用ProFOLD预测蛋白质结构。

Nat.Commun. | 用DiffNets探究蛋白质生化性质的结构决定因素

美国密苏里州圣路易斯市华盛顿大学生命系统科学与工程中心和该校医学院病理与免疫学系合作的文章“Deep learning the structural determinants of protein biochemical properties by comparing structural ensembles with DiffNets”。该论文使用DiffNet模型比较蛋白质的结构集合,从而学习蛋白质的生化性质的结构决定因素。

了解与比较蛋白质及其不同变种的生化特性,如活性和稳定性的结构决定因素,是生物学和医学的一大挑战。计算机模拟蛋白质的生化特性的关键一步是,用降维算法简化变种的复杂结构集;而常见的降维算法依赖于“哪个结构特征重要”的误导性假设,例如强调大的几何变化比小的几何变化更重要。本文用自监督自编码器DiffNet来避免这种假设,并学习低维表示,自动识别相关特征。例如,DiffNets自动识别微小的结构特征,预测β-内酰胺酶变种的相对稳定性和肌球蛋白异构体的占空比(一种结构决定因素)。

Nat. Commun. | 基于结构和GCN的蛋白质功能预测

来自计算生物学中心,Flatiron研究所的研究人员发表在nature communications上的Structure-based protein function prediction using graph convolutional networks。文章提出一个通过利用从蛋白质语言模型和蛋白质结构中提取的序列特征来预测蛋白质功能的图形卷积网络的模型(DeepFRI)。该模型的性能优于当前领先的方法,可以扩展序列数据存储库的规模和使用同源模型增强实验结构的训练集,能够显著扩大可预测函数的数量。同时DeepFRI具有显著的去噪能力,当实验结构被蛋白质模型所取代时,其性能仅有小幅下降。类激活图允许以前所未有的分辨率进行功能预测,并且允许在残基水平上进行特定位点的注释。方法通过注释来自PDB和SWISS-MODEL的结构,展示了方法的实用性和高性能。

参考资料

Method of the Year 2021: Protein structure prediction. Nat Methods 19, 1 (2022).

https://doi.org/10.1038/s41592-021-01380-4

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-02-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Nature|AlphaFold和AI蛋白质折叠革命的下一步是什么
2022年4月13日,Nature杂志发表文章,多位科学家就AlphaFold和AI蛋白质折叠的现状和未来阐述了自己的观点。
智药邦
2022/06/08
3460
Nature|AlphaFold和AI蛋白质折叠革命的下一步是什么
AI预测蛋白质结构登上Science、Nature年度技术突破,AI for Science潜力无穷
如果要给 AI 领域的 2021 评个最具突破奖,你会选择谁?《science》和《nature》给出的答案都是「蛋白质结构预测」。
机器之心
2021/12/22
3780
AI预测蛋白质结构登上Science、Nature年度技术突破,AI for Science潜力无穷
AI解决生物学50年来重大难题:破解蛋白质折叠,颠覆结构生物学
CASP14 组织者、年近七旬的 UC Davis 科学家 Andriy Kryshtafovych 在大会上感叹道,I wasn't sure that I would live long enough to see this(我活久见了)。
科研菌
2020/12/08
8810
AI解决生物学50年来重大难题:破解蛋白质折叠,颠覆结构生物学
RaptorX、AlphaFold、DeepAccNet、ESMFold…你都掌握了吗?一文总结生物制药必备经典模型(一)
本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务,并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。
机器之心
2023/08/07
1K0
RaptorX、AlphaFold、DeepAccNet、ESMFold…你都掌握了吗?一文总结生物制药必备经典模型(一)
AlphaFold再登Nature封面!解锁98.5%人类蛋白质组,重要性堪比人类基因组
同样在这周Nature期刊上,还有一篇题为《蛋白质结构预测的革命性变化》的社论文章,说明了AlphaFold的重要意义。
新智元
2021/09/17
1.6K0
Nat Methods特刊|2021年度方法:蛋白质结构预测
2022年1月11日,Nature Methods 发表文章,将蛋白质结构预测命名为2021年度方法,并推出特刊。
智药邦
2022/03/04
4320
Nat Methods特刊|2021年度方法:蛋白质结构预测
成功预测98.5%人类蛋白质结构再登Nature,从头说说AlphaFold2的雄心壮志
7月22日,DeepMind创始人哈撒比斯在官网上发布了一篇名为《把AlphaFold的力量交到全世界的手中》的文章。
大数据文摘
2021/07/29
7500
一天之内,两大AI预测蛋白结构算法开源,分别登上Nature、Science
机器之心报道 机器之心编辑部 这是科学激动人心的新一步。我们将直播解读这两研究,详见文后。 使用 氨基酸 序列预测蛋白质形状的 AphaFold2,终于开源了。 众所周知,蛋白质是生命活动的基本组件,它们可以单独存在,也会协同工作。为了发挥作用,这些长链氨基酸扭曲、折叠并交织成复杂的形状,这些形状可能很难,甚至根本不可能破译。 科学家们一直在梦想通过基因序列简单地预测蛋白质形状——如果能够成功,这将开启一个洞察生命运作机理的新世界。然而近五十年来,人们的进展缓慢。 7 月 15 日,《自然》杂志一篇论文被接
机器之心
2023/03/29
4260
一天之内,两大AI预测蛋白结构算法开源,分别登上Nature、Science
基于人工智能(AI)的蛋白结构预测工具合集
蛋白质折叠涉及重新排列空间中的线性氨基酸序列,使其处于低能状态。仅基于氨基酸序列预测正确的三维结构非常困难,其原因在于肽键的自由组合会产生大量的可能性:即使对于一个小的蛋白质进行结构域顺序抽样,耗费的时间都将超过宇宙的年龄,因此计算预测是为了规避顺序抽样问题。在过去的40年里,计算预测一直在稳步改进,通过X 射线晶体学、核磁共振波谱和低温电子显微镜(cryo-EM)等实验确定蛋白质结构序列的同源性。自1994年起,每两年通过将计算预测方法应用于最新解析的蛋白质结构评估其性能。三年前,AlphaFold的首次实施已经是将人工智能应用于解析蛋白质结构的革命性进步。2020年,重新设计的AlphaFold近乎完美地精确预测出了蛋白质三维结构,其预测水准与实验室水平相差无几,一举破解了困扰学界长达五十年之久的“蛋白质折叠”难题。DeepMind团队提出了一种计算方法名为AlphaFold 2,即使在不知道相似结构的情况下,也可以以原子精度定期预测蛋白质结构。2021年7月15日,DeepMind团队在Nature杂志上发表了文章"Highly accurate protein structure prediction with AlphaFold",描述了AlphaFold2是一个基于神经网络的全新设计的AlphaFold版本,其预测的蛋白质结构能达到原子水平的准确度。2021年7月15日,华盛顿大学蛋白设计研究所David Baker教授课题组及其他合作机构在Science上发表论文"Accurate prediction of protein structures and interactions using a three-track neural network",公布了其开源蛋白质预测工具RoseTTAFold的研究结果。
DrugAI
2022/11/28
8660
基于人工智能(AI)的蛋白结构预测工具合集
DeepMind AI解决生物学50年来重大挑战,破解蛋白质分子折叠问题
11 月 30 日,一条重磅消息引发了科技界所有人的关注:谷歌旗下人工智能技术公司 DeepMind 提出的深度学习算法「Alphafold」,在国际蛋白质结构预测竞赛(CASP)上击败了其余的参赛选手,其能够精准地给予氨基酸序列,预测蛋白质3D结果。破解了出现五十年之久的蛋白质分子折叠问题。
生信交流平台
2022/09/21
5910
DeepMind AI解决生物学50年来重大挑战,破解蛋白质分子折叠问题
DeepMind 再创里程碑,公开35万种蛋白质预测结构,“这”五位国内专家怎么看?
蛋白质对于生命至关重要,几乎所有疾病,包括癌症、痴呆症都与蛋白质的结构和功能息息相关。数以亿计的蛋白质结构含有丰富的生物信息,既可以用于生物过程推理,也可以用于药物开发或药物干预。然而,经过几十年的努力,科学家们只预测了人类蛋白质序列中17%的氨基酸残基。
AI科技评论
2021/07/27
5570
DeepMind 再创里程碑,公开35万种蛋白质预测结构,“这”五位国内专家怎么看?
AlphaFold 2不再一家独大!DeepMind和华盛顿大学团队同日抢发Nature和Science
去年年底,谷歌 AI 团队 DeepMind 的第二代 AlphaFold 算法在生物界引起了极大的轰动,它能准确地预测蛋白质的结构,以至于许多人宣布这个长达数十年的问题“已被解决”。
AI科技评论
2021/07/27
8030
AlphaFold 2不再一家独大!DeepMind和华盛顿大学团队同日抢发Nature和Science
Nat. Comput. Sci. | 使用有监督的Transformer蛋白质语言模型进行单序列蛋白质结构预测
今天给大家介绍的是南开大学王文恺博士发表在nature computational science上的文章《Single-sequence protein structure prediction using supervised transformer protein language models》。作者提出了一种单序列蛋白质结构预测算法trRosettaX-Single。具体而言,trRosettaX-Single将有监督的Transformer蛋白质语言模型中的序列嵌入整合到通过知识蒸馏增强的多尺度网络中,预测残基间二维几何结构,然后利用能量最小化重建三维结构。
DrugAI
2023/02/17
6870
Nat. Comput. Sci. | 使用有监督的Transformer蛋白质语言模型进行单序列蛋白质结构预测
巨大冲击!AlphaFold2再登Nature,从业者都懵了:人类98.5%的蛋白质,全都被预测了一遍
梦晨 边策 明敏 发自 凹非寺 量子位 报道 | 公众号 QbitAI 98.5%的人类蛋白质结构被AlphaFold2预测出来了! 而且还做成了数据集,全部免费开放! 在开源AlphaFold2仅一周后,DeepMind震撼发布AlphaFold数据集,再次引爆科研圈! 数据集中预测的所有氨基酸残基中,有58%达到可信水平,其中更有35.7%达到高置信度。 而在这之前科学家们数十年的努力,只覆盖了人类蛋白质序列中17%的氨基酸残基。 除了人类蛋白质组,数据集中还包括大肠杆菌、果蝇、小鼠等20个具有科研常
量子位
2023/03/10
3760
巨大冲击!AlphaFold2再登Nature,从业者都懵了:人类98.5%的蛋白质,全都被预测了一遍
复旦大学朱思语/漆远等:蛋白质动态结构预测模型AlphaFolding
蛋白质的功能很大程度上取决于其3D结构。19世纪中期,科学界普遍认为蛋白质结构是固定的、刚性的,类似锁与钥匙模型 (lock-and-key model),即蛋白质与配体的结合是由固定的三维结构决定的。然而,当Daniel Koshland提出酶与底物结合时会发生构象变化的观点后,传统思维开始受到挑战。
智药邦
2025/02/19
1910
复旦大学朱思语/漆远等:蛋白质动态结构预测模型AlphaFolding
入选ICML!麻省理工团队基于AlphaFold实现新突破,揭示蛋白质动态多样性
麻省理工学院的研究团队重新利用 AlphaFold 和 ESMFold 等高精度的单态预测器,并在自定义流匹配 (Flow Matching) 框架下对其进行微调,以获得序列条件的蛋白质结构生成模型,称为 AlphaFLOW 和 ESMFLOW。
HyperAI超神经
2024/07/30
1700
入选ICML!麻省理工团队基于AlphaFold实现新突破,揭示蛋白质动态多样性
Science | 面对alphafold,学术界没有躺平:RoseTTAFold挑战蛋白复合物预测
2021年7月15日,华盛顿大学蛋白设计研究所David Baker教授课题组及其他合作机构在Science上发表论文"Accurate prediction of protein structures and interactions using a three-track neural network",公布了其开源蛋白质预测工具RoseTTAFold的研究结果。
DrugAI
2021/07/28
1K0
两大顶级AI算法一起开源!Nature、Science齐发Alphafold2相关重磅,双厨狂喜~
喜大普奔!今天一波Nature、Science齐发文,可把学术圈的嗑盐人们高兴坏了。
量子位
2021/07/19
8401
两大顶级AI算法一起开源!Nature、Science齐发Alphafold2相关重磅,双厨狂喜~
再看DeepMind的AI蛋白质结构预测突破:生物计算时代正在到来
2020年11月30日,DeepMind宣布了一项重要突破:他们最新版本的AI系统AlphaFold,被CASP的组织者认定为是生物学50年来重大挑战“蛋白质折叠问题”的解决方案。
智药邦
2021/06/03
1K0
再看DeepMind的AI蛋白质结构预测突破:生物计算时代正在到来
AlphaFold预测出2亿种蛋白质结构,打开整个蛋白质宇宙
2022年7月28日,DeepMind官方网站发布AlphaFold最新进展:AlphaFold已经确定了地球上几乎所有已知生物体中大约2亿种蛋白质的结构。
智药邦
2022/11/16
5470
AlphaFold预测出2亿种蛋白质结构,打开整个蛋白质宇宙
推荐阅读
Nature|AlphaFold和AI蛋白质折叠革命的下一步是什么
3460
AI预测蛋白质结构登上Science、Nature年度技术突破,AI for Science潜力无穷
3780
AI解决生物学50年来重大难题:破解蛋白质折叠,颠覆结构生物学
8810
RaptorX、AlphaFold、DeepAccNet、ESMFold…你都掌握了吗?一文总结生物制药必备经典模型(一)
1K0
AlphaFold再登Nature封面!解锁98.5%人类蛋白质组,重要性堪比人类基因组
1.6K0
Nat Methods特刊|2021年度方法:蛋白质结构预测
4320
成功预测98.5%人类蛋白质结构再登Nature,从头说说AlphaFold2的雄心壮志
7500
一天之内,两大AI预测蛋白结构算法开源,分别登上Nature、Science
4260
基于人工智能(AI)的蛋白结构预测工具合集
8660
DeepMind AI解决生物学50年来重大挑战,破解蛋白质分子折叠问题
5910
DeepMind 再创里程碑,公开35万种蛋白质预测结构,“这”五位国内专家怎么看?
5570
AlphaFold 2不再一家独大!DeepMind和华盛顿大学团队同日抢发Nature和Science
8030
Nat. Comput. Sci. | 使用有监督的Transformer蛋白质语言模型进行单序列蛋白质结构预测
6870
巨大冲击!AlphaFold2再登Nature,从业者都懵了:人类98.5%的蛋白质,全都被预测了一遍
3760
复旦大学朱思语/漆远等:蛋白质动态结构预测模型AlphaFolding
1910
入选ICML!麻省理工团队基于AlphaFold实现新突破,揭示蛋白质动态多样性
1700
Science | 面对alphafold,学术界没有躺平:RoseTTAFold挑战蛋白复合物预测
1K0
两大顶级AI算法一起开源!Nature、Science齐发Alphafold2相关重磅,双厨狂喜~
8401
再看DeepMind的AI蛋白质结构预测突破:生物计算时代正在到来
1K0
AlphaFold预测出2亿种蛋白质结构,打开整个蛋白质宇宙
5470
相关推荐
Nature|AlphaFold和AI蛋白质折叠革命的下一步是什么
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文