专栏首页FindKey准备好迎接蛋白设计的时代了吗?--AlphaFold2已开源

准备好迎接蛋白设计的时代了吗?--AlphaFold2已开源

Hi,还记得去年的那个分数达到92分的蛋白质预测工具AlphaFold2吗?就是引发了“结构生物学”大讨论的那货。

今天AlphaFold2已经开源了,同时开源的还有Baker组一直紧跟的RoseTTaFold,如果说上一次是引发了大讨论,这一次开源就是引发了业界的大狂欢,准备好盛装入席了吗。

一睹为快:

我们直接放上两组的Github链接:

  1. AlphaFold2:https://github.com/deepmind/alphafold
  2. RoseTTaFold:https://github.com/RosettaCommons/RoseTTAFold

当然为了大家方便使用:

我同时在国内的Gitee上进行了备份:

  1. AlphaFold2:https://gitee.com/zerodesigner/alphafold
  2. RoseTTaFold:https://gitee.com/zerodesigner/RoseTTAFold

为了方便理解AlphaFold2的作用,在此还是需要一些科普。

正如我们高中生物所学习的,蛋白质是生命的物质基础。由此而诞生的结构生物学则让人类可以从最微观的地方来解释疾病的发生,生理反应等等,从而研制出相对应的药物,改造抗体等等。这只是其相关应用以及前景的冰山一角。

而如何准确的预测蛋白质的结构却始终是一个难题,你可以想象我们如何从

>4WSB_1|Chain A|Polymerase PA|Influenza A virus (1129347)
GSHHHHHHHHGSGSMENFVRTNFNPMILERAEKTMKEYGENPQNEGNKFAAISTHMEVCFMYSDFHFIDLEGNTIVKENDDDNAMLKHRFEIIEGQERNIAWTIVNSICNMTENSKPRFLPDLYDYKTNKFIEIGVTRRKVEDYYYEKASKLKGENVYIHIFSFDGEEMATDDEYILDEESRARIKTRLFVLRQELATAGLWDSFRQSEKGEETLEEEFSYPPTFQRLANQSLPPSFKDYHQFKAYVSSFKANGNIEAKLGAMSEKVNAQIESFDPRTIRELELPEGKFCTQRSKFLLMDAMKLSVLNPAHEGEGIPMKDAKACLDTFWGWKKATIIKKHEKGVNTNYLMIWEQLLESIKEMEGKFLNLKKTNHLKWGLGEGQAPEKMDFEDCKEVPDLFQYKSEPPEKRKLASWIQSEFNKASELTNSNWIEFDELGNDVAPIEHIASRRRNFFTAEVSQCRASEYIMKAVYINTALLNSSCTAMEEYQVIPIITKCRDTSGQRRTNLYGFIIKGRSHLRNDTDVVNFISLEFSLTDPRNEIHKWEKYCVLEIGDMEIRTSISTIMKPVYLYVRTNGTSKIKMKWGMEMRRCLLQSLQQVESMIEAESAVKEKDMTEPFFRNRENDWPIGESPQGIEKGTIGKVCRVLLAKSVFNSIYASAQLEGFSAESRKLLLLIQAFRDNLDPGTFDLKGLYEAIEECIINDP

这一维序列中预测出其三维结构。也就是准确的预测出下面这个结构。(这个蛋白序列是我随便找的,不过意思应该是清楚的。)

而AlphaFold很好的解决了这个问题,你可以想象,在不久的未来,科学家可以借助其来设计各种的多肽,抗体(所预测的结构和实验真实结构相差无几),由此完成医药领域的进一步升级。AlphaFold所采用是深度学习。(原理只是这一句有兴趣可以看原文)

所以,说了这么多。来看看源码实现:

有句名言,计算条件达不到的,对你而言其是不存在的。

  • 第一步Docker,很方便,只不过需要权限的某些同学可能要哭晕在厕所了。
  • 第二步数据库:UniRef90,BFD,PDB70,PDB。简单来说,你需要一张2.2T的硬盘来存储这些数据。
  • 第三步跑AlphaFold:12 vCPUs, 85 GB of RAM, 100 GB boot disk,A100 GPU。简单来说,多买几张显卡和硬盘吧,别又涨了。

后记:

1. 准备好迎接蛋白设计的时代的到来

2. 去升级你的计算装备

3. 或许高通量的实验设备也会兴起

参考文献:

1. https://www.nature.com/articles/d41586-021-01968-y

2. Jumper, J. *et al.* *Nature* https://doi.org/10.1038/s41586-021-03819-2 (2021).

3. Baek, M. *et al.* *Science* https://doi.org/10.1126/science.abj8754 (2021).

本文分享自微信公众号 - FindKey(DrugNote),作者:ZeroDesigner

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-07-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 准备好迎接蛋白设计的时代了吗?--AlphaFold2的两种使用方式

    AF2已经出了一段时间,上次试了试RoseTTAFold,这次试试AlphaFold2.

    FindKey
  • 准备好迎接蛋白设计的时代了吗?--RoseTTAFold实操

    作为学术界的fast follow,RoseTTAfold以其占用的资源有限以及预测蛋白复合物而占据了一定的优势。

    FindKey
  • (下篇)五大顶级学者的AlphaFold2论道:破译结构、开源代码后的产研「大变局」

    备受期待的AlphaFold2数据库,是会成为专家们打开蛋白质功能奥秘的金钥匙,还是一场美丽的“科技泡沫”?

    AI科技评论
  • 五大顶级学者的AlphaFold 2论道:破译结构、开源代码后的产研「大变局」

    后AlphaFold2时代,蛋白质结构领域是否会出现学术研究的“军备竞赛”?代码开源,是否为各大药企和AI制药企业创造了一次最佳的超车机会?一系列的问题,从这篇...

    AI科技评论
  • Nature|人工智能助力蛋白质折叠预测

    2021年11月23日,Nature杂志发表文章Artificial intelligence powers protein-folding predictio...

    智药邦
  • 北鲲云超算平台在AlphaFold2对蛋白质研究中有何作用?

    受人工智能和深度学习技术发展较快等因素影响,结构生物学数据的研究也开始迎来了崭新的阶段,针对蛋白质结构的预测也出现了一些新的方法,并获得了突破性进展。目前,最为...

    北鲲云
  • DeepMind 再创里程碑,公开35万种蛋白质预测结构,“这”五位国内专家怎么看?

    蛋白质对于生命至关重要,几乎所有疾病,包括癌症、痴呆症都与蛋白质的结构和功能息息相关。数以亿计的蛋白质结构含有丰富的生物信息,既可以用于生物过程推理,也可以用于...

    AI科技评论
  • AlphaFold 2不再一家独大!DeepMind和华盛顿大学团队同日抢发Nature和Science

    去年年底,谷歌 AI 团队 DeepMind 的第二代 AlphaFold 算法在生物界引起了极大的轰动,它能准确地预测蛋白质的结构,以至于许多人宣布这个长达数...

    AI科技评论
  • 两大顶级AI算法一起开源!Nature、Science齐发Alphafold2相关重磅,双厨狂喜~

    喜大普奔!今天一波Nature、Science齐发文,可把学术圈的嗑盐人们高兴坏了。

    量子位
  • Science | 面对alphafold,学术界没有躺平:RoseTTAFold挑战蛋白复合物预测

    2021年7月15日,华盛顿大学蛋白设计研究所David Baker教授课题组及其他合作机构在Science上发表论文"Accurate prediction ...

    DrugAI
  • 准备好迎接AV1的黄金时代了吗?

    今天,我将演示SVT-AV1如何以相同码率更快地提供更高质量的内容。结合dav1d的快速AV1解码, AV1编解码器即将为全面推广做好准备。

    LiveVideoStack
  • Nature丨AlphaFold2带着源码来了,开启AI生命科学的新时代

    2021年7月15日,DeepMind团队在Nature杂志上发表了文章"Highly accurate protein structure predictio...

    DrugAI
  • 成功预测98.5%人类蛋白质结构再登Nature,从头说说AlphaFold2的雄心壮志

    7月22日,DeepMind创始人哈撒比斯在官网上发布了一篇名为《把AlphaFold的力量交到全世界的手中》的文章。

    大数据文摘
  • AlphaFold再登Nature封面!解锁98.5%人类蛋白质组,重要性堪比人类基因组

    同样在这周Nature期刊上,还有一篇题为《蛋白质结构预测的革命性变化》的社论文章,说明了AlphaFold的重要意义。

    新智元
  • 预测结果与实验数据基本一致,AlphaFold2应用于研究蛋白活化以及相互作用

    用于蛋白质结构预测的基于神经网络的模型最近已达到接近实验的准确性,并且正在迅速成为生物学家武器库中的强大工具。正如使用 RoseTTAFold 或 AlphaF...

    机器之心
  • Science | 蛋白质结构预测: now easier, faster

    蛋白质是生命的基础,可以单独或一起工作以构建、管理、提供燃料、保护并最终破坏细胞。为了发挥作用,这些长链氨基酸扭曲、折叠并交织成复杂的形状,这些形状可能很慢,甚...

    DrugAI
  • Nat. Commun.| CopulaNet:直接从多序列联配中学习残基间距离以“从头预测”蛋白质结构

    蛋白质是具有重要功能的生物大分子,其功能主要由蛋白质的三级结构决定。蛋白质结构可通过核磁共振、X射线晶体学和低温电镜等实验技术测定,然而这些实验技术有其局限性,...

    DrugAI
  • Nature | AlphaFold预测98.5%人类蛋白结构,科学研究新范式

    2021年7月15日,DeepMind团队在Nature杂志上发表了文章"Highly accurate protein structure predictio...

    DrugAI
  • 2020年人工智能领域突破性工作

    总结一下个人认为2020年人工智能领域称得上突破的一些工作,涉及到DETR、ViT、BYOL、NeRF、GPT-3和AlphaFold2六个王炸。

    黄博的机器学习圈子

扫码关注云+社区

领取腾讯云代金券