展开

关键词

DeepMind研制出可准确预测蛋白质结构的AlphaFold

谷歌旗下公司DeepMind最新研制出的人工高智能AlphaFold在蛋白质结构预测技术评估试验CASP(Critical Assessment of Structure Prediction)以58% 12月2日,谷歌旗下的人工智能公司DeepMind在第13届结构预测评估竞赛(CASP)中获得了最高荣誉。这项两年一度的竞赛旨在预测蛋白质的三维结构。 CASP的首席组织者、美国Rockville市马里兰大学的计算生物学家John Moult表示,AlphaFold赢得了很多次,在最困难的43次测试中,其平均准确率比其他组高15%。 华盛顿大学西雅图分校的CASP组织者、参与者和计算建模专家David Baker指出:DeepMind的科学家是在其他人开创的两种算法策略的基础上开展工作的。 洛杉矶马里兰大学的另一位CASP组织者和计算生物学家John Moult补充道:“给予他们信任,他们刚刚起步。”

31810

JMC | 人工智能在药物合成中的当前和未来作用(3)

与使用计学习的方法相比,使用专家编码规则的CASP方法对数据可用性更不敏感,因为人类可以促进将少量反应先例推广到更广泛的规则。 对于自动合成,如果CASP推荐了公司内部经常使用的简单而坚固的化学方法,则可以避免化学家必须设计或执行简单化学方法的负担。 为研究人员提供通用的测试集以对其进行基准测试是一项艰巨的任务。随着领域的发展,提供给测试集的分子将不得不进化,因为随着时间的流逝,它们将被包含在数据库中进行训练。 由于某些在其算法中纳入了专家编码的规则,因此基准化后合成软件也变得很复杂。这意味着这些编码规则与测试集之间可能存在重叠,而纯数据驱动的方法则在训练数据和测试数据之间有明确的区别。 例如,条件推荐通常集中于以已知或可能唯一的组合来预测已知试剂。催化反应的数据非常有限,因为经证明成功的独特催化剂配体通常较少。为了应对药物发现中存在的许多低数据环境,必须改进机器学习模型。

21360
  • 广告
    关闭

    90+款云产品免费体验

    提供包括云服务器,云数据库在内的90+款云计算产品。打造一站式的云产品试用服务,助力开发者和企业零门槛上云。

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    AI解决生物学50年来重大难题:破解蛋白质折叠,颠覆结构生物学

    在刚刚公布的第 14 届 CASP 评估结果中,DeepMind 的最新 AlphaFold 在所有预测目标中的中位 GDT 达到 92.4,意味其平均误差大概为 1.6 埃(Angstrom),相当于一个原子的宽度 DeepMind 团队在公开数据上训练这一,这些数据来自蛋白质结构数据库(PDB)和包含未知结构蛋白质序列的大型数据库,共包括约 170,000 个蛋白质结构。 该使用约 128 个 TPUv3 内核(相当于 100-200 个 GPU)运行数周,与现今机器学习领域出现的大型 SOTA 模型相比,该所用算力相对较少。 此外,DeepMind 团队透露,他们准备在适当的时候将这一 AlphaFold 新相关论文提交至同行评审期刊。?AlphaFold 主要神经网络模型架构概览。 对于所有致力于科学领域中计算和机器学习方法的人而言,像 AlphaFold 这样的彰显了 AI 作为基础探索辅助工具的惊人潜力。

    28010

    再看DeepMind的AI蛋白质结构预测突破:生物计算时代正在到来

    01轰动的新闻2020年11月30日,DeepMind宣布了一项重要突破:他们最新版本的AIAlphaFold,被CASP的组织者认定为是生物学50年来重大挑战“蛋白质折叠问题”的解决方案。 在CASP14发布的评审结果中,作为CASP14的参加者之一,DeepMind最新的AlphaFold在所有目标中获得了92.4 GDT的平均分。 在最新版本的AlphaFold中,DeepMind创建了一个基于注意力的神经网络,经过端到端的训练,来解释蛋白质空间图的结构,同时做出推理。 该使用了可公开获得的数据进行训练,数据由来自蛋白质数据库的约170,000种蛋白质结构,以及尚未确定结构的蛋白质组成。该测试数据与2018年使用的测试数据非常相似。 他说:“机器学习中总会出现错误”。

    30720

    DeepMind攻破生物学领域50年难题:蛋白质结构预测准确性可达92.4分

    我们的人工智能AlphaFold的最新版本已经被两年一度的蛋白质结构预测临界评估(CASP)组织会认可为这一重大挑战的解决方案,是一项重大的科学进展。 在今天发布的第14次CASP评估的结果中,我们最新的AlphaFold在所有目标中实现了92.4的GDT总分。 与我们的CASP13 AlphaFold一样,我们正在准备一篇关于该的论文,以便在适当的时候提交给同行评审的期刊。? 除了撰写同行评议的论文外,我们还在探索如何以可伸缩的方式提供对更广泛的访问。 对于我们所有致力于科学计算和机器学习方法的人来说,AlphaFold这样的展示了人工智能作为帮助基础发现的工具的潜力。

    18420

    JMC | 人工智能在药物合成中的当前和未来作用(2)

    Section 1: CASP如何帮助药物化学发现; Section 2: 如何在制药和化学工业中使用CASP;Section 3:如何使CASP更好。 ? 这些内部化学物质可能无法在公共或公开数据集中得到很好的体现对大多数CASP进行了培训。 这样的一个例子是在诺华基于表面活性剂的技术中的应用,该技术试图用绿色的胶束-水表面活性剂代替不希望的溶剂。 自动化的其他选项包括使用环流的闭环DMTA循环,自动化实验室和超高通量实验。?一些制药公司目前正在将逆合成设计软件集成到闭环自动化中。 探索与路线推荐相关的文献先例的方法;3)用户可以定义自己想要打破的纽带以进行指导搜索; 4)路线以可购买的起始原料;5)官能团不相容和不稳定的化合物被鉴定,并提出了保护基团策略以绕过这些复杂性,6)实施了评分对路线进行排名

    19940

    DeepMind的蛋白质折叠AI解决了50年来的生物学重大挑战

    DeepMind名为AlphaFold的在2018年CASP13上的表现让该领域的许多科学家大吃一惊,长期以来,该领域一直是小型学术团体的堡垒,但其方法与其他应用AI的团队大致相似。 Jumper说,他们还设置了一个更困难的任务:网络不是预测氨基酸之间的关,而是预测目标蛋白质序列的最终结构。这是一个复杂程度相当高的。 惊人的准确性CASP历时数月,目标蛋白或被称为域的蛋白部分(共约100个)定期发布,各团队有几周时间提交预测结构。 Moult说:与上届CASP相比,今年各团队预测的结构更加准确,但大部分的进展可以归功于AlphaFold。 纽约市哥伦比亚大学的计算生物学家、CASP参赛者Mohammed AlQuraishi渴望挖掘AlphaFold在比赛中的表现细节,并在12月1日DeepMind团队展示其方法时,了解更多关于的工作原理

    16650

    JMC | 人工智能在药物合成中的当前和未来作用(1)

    Section 1: CASP如何帮助药物化学发现; Section 2: 如何在制药和化学工业中使用CASP;Section 3:如何使CASP更好。? 图2中,专注于计算机辅助合成设计(CASP)的三个主要任务:逆合成设计、反应条件推荐和正向反应预测。 ?基于ML的CASP的逆合设计1. 由于合成资源(SA)的原因,特定列的先导化合物可能比其他先导化合物更可取,因为财务资源和时间限制限制了可以并行使用或设计的化合物的数量。 启发式方法旨在从分子结构中捕获SA的广泛趋势,并且传上一直使用专家定义的分子属性功能。 建议和评估反应条件计划反向合成路线仅是整个CASP的一个方面。为了建议化学家可以进入实验室,我们必须提出一套能够实现所需转化的反应条件。

    19470

    阿尔法狗再下一城 | 蛋白结构预测AlphaFold大胜传人类模型

    计,截至2010年,只有0.6%的已知蛋白序列被解析出了相应的结构。 我也是这次写这篇新闻稿才知道,Chris当年也是CASP竞赛第一届的获奖者之一。? 这些评分的结果和传的Rossetta的评分一起被用来训练这两个模块中的参数,从而自动训练出一个模拟退火的目标函数。? 这种几乎完全放弃传意义上biophysics手动选取feature的方法,仿佛让人们看到了当年AlphaGo高处不胜寒的影子。 S补充道,“DeepMind尝试过抛弃这种评分,但是最终也没有完全做到,这充分说明这种传方法长期积累下来的估值函数也起到了相当于重要的作用。”实际上,AI在生物学的整合并非个例。

    47710

    Science | 蛋白质结构预测: now easier, faster

    ,谷歌旗下的英国人工智能公司 DeepMind 在两年一度的竞赛中以其结构预测赢得了该领域的盛赞(Science,2020 年 12 月 4 日,第1144页),该竞赛称为蛋白质结构预测的关键评估 (CASP Moult说,DeepMind 的AlphaFold2做了非常了不起的事情 ,预测具有原子精度的蛋白质结构。? DeepMind 在 CASP 上的 30 分钟演讲足以激发 Baek 开发自己的方法。与 AlphaFold2 一样,它利用人工智能在大量示例数据库中识别模式的能力,在学习时生成更明智和准确的迭代。 然而,DeepMind 发言人写道,其最新算法的速度是 2020 年在 CASP 上使用的算法的 16 倍以上。 参考资料Pennisi, Elizabeth.

    19570

    Nat. Mach. Intell. | 快速的蛋白质结构从头预测

    一般来说,Contact Map可以作为能量项整合到传的蛋白质结构预测算法中,或者通过Contact Map构建距离约束矩阵并通过分子动力学模拟预测结构。 在最新的CASP13竞赛中,传的Contact辅助结构预测方法受到了AlphaFold的挑战。 图3 增强模型的性能AmoebaContact在验证集和PSICOV150测试集之间表现出相差无几的性能,但是在三个CASP测试集中显示出较低的f1分数,如表1所示。 3.3 GDFold进行结构建模本文地比较了AmoebaContact和GDFold与RaptorX-Contact对所有测试集蛋白的Contact和预测结构,如图4所示。 因此,通过更的模型增强和集成平均有望进一步提高AmoebaContact的性能。

    17850

    谷歌提前开源AlphaFold 2!Nature、Science同时公开两大蛋白质结构预测工具

    为解决这一困难,DeepMind利用人工智能,开发了一个能够预测蛋白质结构的:AlphaFold。 )所长、CASP评估员Andrei Lupas的高度评价:「AlphaFold惊人的精确模型帮助我们解决一直困扰科学界的蛋白质结构问题,重新启动了学界的研究。」? AlphaFold 2:原子级精度 DeepMind的AlphaFold 2模型在2020年的蛋白质结构预测比赛(CASP)取得了出色的成绩。比赛的评分中位数达到了92.4 GDT。 2020年,DeepMind在CASP 14大会上介绍了它在该蛋白质结构预测上的显著进展。 在这个架构中,信息在一维(氨基酸序列)、二维(距离)和三维(坐标)之间来回流动,从而能够集中推理出蛋白质化学部分与折叠结构之间的关。?

    17230

    AlphaFold抗疫,DeepMind公布六种新冠病毒蛋白质结构预测结果

    例如,构成我们免疫的抗体蛋白是「Y」形的。通过与病毒和细菌结合,抗体蛋白能够检测并标记致病微生物并进行消灭。为了检测病毒,开发疫苗,科学家必须首先理解病毒的机制,尤其是蛋白质结构。 然而,用传方法预测病毒蛋白质结构往往要花费数月时间,而且也不一定能获得满意的结果。对于来势汹汹的新冠病毒疫情,几个月的时间还是太长了。 深度学习的应用可以加快这一过程,其中最具代表性的要数 DeepMind 2018 年底推出的 AlphaFold 。AlphaFold 为何被寄予厚望? 在参加一年两次的蛋白质折叠奥运会 CASP 上,Alpafold 在预测蛋白质结构的物理性质上达到了高度的准确性,然后基于这些预测可以使用两种不同的方法预测构建完整的蛋白质结构。 DeepMind 表示,这一结构预测仍在开发过程中。可以确定的是,最新比之前的 CASP 13 更准确。

    29710

    机器学习遇见生物学:详解蛋白质折叠预测中的算法

    例如,构成我们免疫的抗体蛋白为「Y 形」,类似于独特的钩子,通过锁定病毒和细菌,这种蛋白能够检测并标记致病微生物以对这些病毒进行消灭。 AlphaFold 其实是深度学习方法与传方法的结合,具体来说就是 CNN+Rosette,本文主要介绍深度学习相关的部分(CNN),对传方法(Rosette,也是一个很优秀的算法,在 AlphaFold 在 AlphaFold 中,他们一共设计了三个不同的方法:首先是最传的方法,跟从前的专家极其相似——先从一维的氨基酸序列生成一个二维的接触距离矩阵(contact matrix)以记录两个氨基酸之间的距离 这个方法就是简单的从头预测(ab initio)方法的框架,在每一步都有一个评分,从而保留好结果,删除差结果——没有深度学习的时候也是这么做的。 但是 CASP 中,前 5 名都使用了深度学习技术,其他一些使用了深度学习技术的队伍也取得了不错的成绩。因此,综合 CASP 以及 TAPE 的结果来看,机器学习和自学习都是蛋白质预测未来的大方向。

    49810

    哈佛医学院研究员解读DeepMind大突破AlphaFold:有进步,但未解决根本问题

    作为业内人士,哈佛医学院生物学研究员Mohammed AlQuraishi对其进行了解读。他博士毕业于斯坦福大学,参加了CASP13,是AlphaFold大放异彩的见证者。? AlphaFold有进步,但没有解决根本问题从AlphaFold给CASP成绩带来的提升来看,的确是取得了进步。但这个进步,是学术研究的自然增长,还是AlphaFold依靠自身能力带来的呢? 上图中,呈现了每届CASP第一名和第二名的成绩,虚线代表着CASP13预期成绩,是根据CASP10到12的平均改善率预测的。 在CASP 10之前,整个增长曲线10年来基本上是平缓的。 CASP 12带来的提升,是这些方法最终被证明了。即使没有AlphaFold,CASP13的成绩,也会因为在协同进化方法中广泛应用深度学习,出现进一步的提升。

    28420

    QUARK的增强版C-QUARK问世,有效提升蛋白质结构从头预测精度

    该方法在第13次CASP赛事(蛋白质结构预测领域的奥利匹克竞赛)中FM(无模板)蛋白质结构建模盲测中相比其他基于接触图的非同源蛋白质建模方法更具有显著优势,证明了C-QUARK即使在同源序列少或接触预测精度不高时也可以实现蛋白质三维结构的有效预测 十年前,包括Rosetta和QUARK在内的几个先进pipelines在CASP(critical assessment of protein structure prediction)实验中开创性地为长度超过 为了地探索接触图预测的能力,特别是那些精度较低的接触图预测,以改进从头折叠,该研究将接触约束与基于QUARK的折叠模拟结合了起来。 该pipeline 在CASP目标和单独的大规模测试数据集上进行了严格的基准测试,结果显示,与QUARK以及其他先进的结构建模方法相比,C-QUARK在建模长距离和非同源目标方面显示出显著优势。 根据64个CASP13目标的实验结构,C-QUARK的平均GDT_TS(CASP评估员使用的标准分数)高于所有其他p值

    13540

    业界 | DeepMind 团队 CASP 夺冠:用 AlphaFold 预测蛋白质结构

    我们的,AlphaFold,在过去的两年里我们一直在努力研究它,它建立在多年前使用大量基因组数据预测蛋白质结构的研究基础之上。 例如,构成我们免疫的抗体蛋白是「Y 形」,类似于独特的钩状物。通过锁定病毒和细菌,抗体蛋白能够检测并标记致病微生物以便消灭它们。类似地,胶原蛋白呈绳索状,它在软骨、韧带、骨骼和皮肤之间传递张力。 今年我们向 CASP 提交了 AlphaFold,这是近几年我们 DeepMind 对这个问题的研究成果。 我们首次涉足蛋白质折叠的成功,展示了机器学习如何能整合各种信息来源,以帮助科学家快速地找到解决复杂问题的创造性解决方案。 正如我们已经看到人工智能如何通过像 AlphaGo 和 AlphaZero 这样的帮助人们掌握复杂的游戏,我们也同样希望有一天,人工智能的突破也能帮助我们掌握基本的科学问题。

    29840

    DeepMind 团队 CASP 夺冠:用 AlphaFold 预测蛋白质结构

    我们的,AlphaFold,在过去的两年里我们一直在努力研究它,它建立在多年前使用大量基因组数据预测蛋白质结构的研究基础之上。 例如,构成我们免疫的抗体蛋白是「Y 形」,类似于独特的钩状物。通过锁定病毒和细菌,抗体蛋白能够检测并标记致病微生物以便消灭它们。类似地,胶原蛋白呈绳索状,它在软骨、韧带、骨骼和皮肤之间传递张力。 今年我们向 CASP 提交了 AlphaFold,这是近几年我们 DeepMind 对这个问题的研究成果。 我们首次涉足蛋白质折叠的成功,展示了机器学习如何能整合各种信息来源,以帮助科学家快速地找到解决复杂问题的创造性解决方案。 正如我们已经看到人工智能如何通过像 AlphaGo 和 AlphaZero 这样的帮助人们掌握复杂的游戏,我们也同样希望有一天,人工智能的突破也能帮助我们掌握基本的科学问题。

    38520

    8张RTX3090,效果媲美AlphaFold2,国产蛋白结构预测平台TRFold排名全球第二

    在新型冠状病毒疫情爆发的初期,CASP 组织者曾发起了一次针对难以实验解析的 COVID-19 蛋白质结构预测,天壤提交的 nsp6-D2 预测结果入选 CASP 官方评选的六个「最具可信度模型」。 图示:天壤提交的 nsp6-D2 预测结果入选 CASP 官方评选的六个「最具可信度模型」。 「我们长期以来面临的都是此类复杂的决策问题,在技术层面已经有了深厚的积累,蛋白质折叠预测虽然是生物学课题,但也属于这个领域,并且体现了AI在基础科学中的巨大潜能,这也是每个立志于基础研发的 AI 从业者的价值取向 对于天壤来说,目前的单个蛋白质折叠预测只是一个起点,更加精准的侧链优化、蛋白质的动态分析、蛋白质与其配体(如小分子、DNA、RNA、多肽、蛋白质等)的相互作用等一列的问题还没有解决,他们接下来的工作重点 © THE END 转载请联本公众号获得授权

    9640

    Chem Sci | 用机器学习策略对逆合成途径进行评估和聚类

    摘要随着数据科学和机器学习在计算机辅助合成规划(CASP)方面的发展,现代CASP程序已经可以快速识别出给定目标分子的数千种潜在合成路线。 然而,除了使用一些简单的启发式方法之外,整体评估机制的缺乏使得地确定合成路径的优先级具有挑战性。 1.研究背景计算机辅助合成规划(Computer-aided synthesis planning, CASP),最初由Corey提出,最近随着数据科学和机器学习的实施被广泛研究和改进。 CASP的目的是将目标分子一步一步地分解成商业上可用的化合物或容易合成的简单前体。但是现在CASP项目提出的大量合成途径遇到了两个挑战:(1)逆合成途径的优先策略。

    8820

    扫码关注云+社区

    领取腾讯云代金券