专栏首页FindKey准备好迎接蛋白设计的时代了吗?--AlphaFold2的两种使用方式

准备好迎接蛋白设计的时代了吗?--AlphaFold2的两种使用方式

前言:

AF2已经出了一段时间,上次试了试RoseTTAFold,这次试试AlphaFold2.

方式:

1 躺平式(Colab版)

简称白嫖Geogle,直接使用colab进行使用

Colab提供了一张GPU V100 以供挥霍

直接点击进入 此网站 https://colab.research.google.com/drive/1PePaHHp1J-L1rufW4_r7v7VpZjYVUbTH

熟悉Jupyter的应该都知道怎么操作,不知道的百度下

另外下面这种操作方式,不使用MSA信息,适用于蛋白质从头设计。

第一步:colab提供了一张GPU或者TPU以供调用,选择GPU就好

第二步:

点击方格左侧的▶️使其运行,或者直接shift+enter

注意:

在这个地方,将query_sequence改为你自己的序列

第三步:

predict_structure 在预测结构,而下方的excute则是运行时间,案例这个跑了大约2min左右,约68个氨基酸

第四步查看结构,以及下载

在左方的none中点击并下载

2 直立式(本地版)

第一步直接git clone

 git clone git@github.com:ZeroDesigner/easy_af2.git

第二步 使用conda创造环境

 conda env create -f easy_af2.yaml
 conda activate alphafold

第三步下载数据

alphafold 提供了一个自动化下载脚本

 cd scripts
 nohup sh download_all_data.sh ./ &

这一步时间很长,直接nohup挂到后台

所用空间

 $DOWNLOAD_DIR/                             # Total: ~ 2.2 TB (download: 428 GB)
     bfd/                                   # ~ 1.8 TB (download: 271.6 GB)
         # 6 files.
     mgnify/                                # ~ 64 GB (download: 32.9 GB)
         mgy_clusters.fa
     params/                                # ~ 3.5 GB (download: 3.5 GB)
         # 5 CASP14 models,
         # 5 pTM models,
         # LICENSE,
         # = 11 files.
     pdb70/                                 # ~ 56 GB (download: 19.5 GB)
         # 9 files.
     pdb_mmcif/                             # ~ 206 GB (download: 46 GB)
         mmcif_files/
             # About 180,000 .cif files.
         obsolete.dat
     uniclust30/                            # ~ 87 GB (download: 24.9 GB)
         uniclust30_2018_08/
             # 13 files.
     uniref90/                              # ~ 59 GB (download: 29.7 GB)
         uniref90.fasta

第四步 运行alphafold

 bash run_alphafold.sh -d ./scripts -o ./output/ -m model_1 -f ./example/query.fasta -t 2020-05-14

推荐配置:

  1. GPU:一张A100 显卡 5w-7w(目前还没有在这么强大的显卡上跑过),
  2. 存储空间:50T ,5k-1w左右
  3. CPU:Intel® Xeon® Gold 6338 Processor (48M Cache, 2.00 GHz) 32 cores 8k左右

价格都差不多,当然你还需要人力来配置,人工费用另算。或者直接买超算的GPU核时。

后记

还有很多不同的玩法

具体参看:

  1. https://github.com/sokrypton/ColabFold
  2. https://github.com/deepmind/alphafold/issues/24

Gitee国内地址

https://gitee.com/zerodesigner/easy_af2

参考:

  1. AlphaFold2:https://github.com/deepmind/alphafold
  2. Colab上的AF2:https://github.com/sokrypton/ColabFold
  3. 非docker下的AF2:https://github.com/deepmind/alphafold/issues/24
  4. 硬盘价格:https://www.jd.com/jiage/67036b20876f0c79715.html
  5. A100 价格:https://www.smzdm.com/p/36608092/

本文分享自微信公众号 - FindKey(DrugNote),作者:ZeroDesigner

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-07-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 准备好迎接蛋白设计的时代了吗?--AlphaFold2已开源

    Hi,还记得去年的那个分数达到92分的蛋白质预测工具AlphaFold2吗?就是引发了“结构生物学”大讨论的那货。

    FindKey
  • 准备好迎接蛋白设计的时代了吗?--RoseTTAFold实操

    作为学术界的fast follow,RoseTTAfold以其占用的资源有限以及预测蛋白复合物而占据了一定的优势。

    FindKey
  • (下篇)五大顶级学者的AlphaFold2论道:破译结构、开源代码后的产研「大变局」

    备受期待的AlphaFold2数据库,是会成为专家们打开蛋白质功能奥秘的金钥匙,还是一场美丽的“科技泡沫”?

    AI科技评论
  • 五大顶级学者的AlphaFold 2论道:破译结构、开源代码后的产研「大变局」

    后AlphaFold2时代,蛋白质结构领域是否会出现学术研究的“军备竞赛”?代码开源,是否为各大药企和AI制药企业创造了一次最佳的超车机会?一系列的问题,从这篇...

    AI科技评论
  • 北鲲云超算平台在AlphaFold2对蛋白质研究中有何作用?

    受人工智能和深度学习技术发展较快等因素影响,结构生物学数据的研究也开始迎来了崭新的阶段,针对蛋白质结构的预测也出现了一些新的方法,并获得了突破性进展。目前,最为...

    北鲲云
  • AlphaFold 2不再一家独大!DeepMind和华盛顿大学团队同日抢发Nature和Science

    去年年底,谷歌 AI 团队 DeepMind 的第二代 AlphaFold 算法在生物界引起了极大的轰动,它能准确地预测蛋白质的结构,以至于许多人宣布这个长达数...

    AI科技评论
  • DeepMind 再创里程碑,公开35万种蛋白质预测结构,“这”五位国内专家怎么看?

    蛋白质对于生命至关重要,几乎所有疾病,包括癌症、痴呆症都与蛋白质的结构和功能息息相关。数以亿计的蛋白质结构含有丰富的生物信息,既可以用于生物过程推理,也可以用于...

    AI科技评论
  • 两大顶级AI算法一起开源!Nature、Science齐发Alphafold2相关重磅,双厨狂喜~

    喜大普奔!今天一波Nature、Science齐发文,可把学术圈的嗑盐人们高兴坏了。

    量子位
  • Science | 面对alphafold,学术界没有躺平:RoseTTAFold挑战蛋白复合物预测

    2021年7月15日,华盛顿大学蛋白设计研究所David Baker教授课题组及其他合作机构在Science上发表论文"Accurate prediction ...

    DrugAI
  • 成功预测98.5%人类蛋白质结构再登Nature,从头说说AlphaFold2的雄心壮志

    7月22日,DeepMind创始人哈撒比斯在官网上发布了一篇名为《把AlphaFold的力量交到全世界的手中》的文章。

    大数据文摘
  • Nature丨AlphaFold2带着源码来了,开启AI生命科学的新时代

    2021年7月15日,DeepMind团队在Nature杂志上发表了文章"Highly accurate protein structure predictio...

    DrugAI
  • Science | 蛋白质结构预测: now easier, faster

    蛋白质是生命的基础,可以单独或一起工作以构建、管理、提供燃料、保护并最终破坏细胞。为了发挥作用,这些长链氨基酸扭曲、折叠并交织成复杂的形状,这些形状可能很慢,甚...

    DrugAI
  • 预测结果与实验数据基本一致,AlphaFold2应用于研究蛋白活化以及相互作用

    用于蛋白质结构预测的基于神经网络的模型最近已达到接近实验的准确性,并且正在迅速成为生物学家武器库中的强大工具。正如使用 RoseTTAFold 或 AlphaF...

    机器之心
  • AlphaFold再登Nature封面!解锁98.5%人类蛋白质组,重要性堪比人类基因组

    同样在这周Nature期刊上,还有一篇题为《蛋白质结构预测的革命性变化》的社论文章,说明了AlphaFold的重要意义。

    新智元
  • Nat. Commun.| CopulaNet:直接从多序列联配中学习残基间距离以“从头预测”蛋白质结构

    蛋白质是具有重要功能的生物大分子,其功能主要由蛋白质的三级结构决定。蛋白质结构可通过核磁共振、X射线晶体学和低温电镜等实验技术测定,然而这些实验技术有其局限性,...

    DrugAI
  • 2020年人工智能领域突破性工作

    总结一下个人认为2020年人工智能领域称得上突破的一些工作,涉及到DETR、ViT、BYOL、NeRF、GPT-3和AlphaFold2六个王炸。

    黄博的机器学习圈子
  • Nature | AlphaFold预测98.5%人类蛋白结构,科学研究新范式

    2021年7月15日,DeepMind团队在Nature杂志上发表了文章"Highly accurate protein structure predictio...

    DrugAI
  • DeepMind开源的AlphaFold怎么用?打开Colab就能在线用

    前段时间,《自然》杂志刊登了 DeepMind 的两篇论文,介绍了该公司在蛋白质结构预测方向的最新进展。研究表明,DeepMind 的 AlphaFold 所预...

    机器之心
  • 基于Alphafold2进行蛋白设计

    参考文献: Using AlphaFold for Rapid and Accurate Fixed Backbone Protein Design

    DrugAI

扫码关注云+社区

领取腾讯云代金券