专栏首页FindKey准备好迎接蛋白设计的时代了吗?--RoseTTAFold实操

准备好迎接蛋白设计的时代了吗?--RoseTTAFold实操

作为学术界的fast follow,RoseTTAfold以其占用的资源有限以及预测蛋白复合物而占据了一定的优势。

当然其安装也不需要docker,为一些非root用户提供了方便之处,而且说不定CASP15就进化完全体了。

顺便提一句AlphaFold2的A100好像4万 - 7万。

步骤以及相关的坑:

1. 下载RosettaFold

 git clone https://github.com/RosettaCommons/RoseTTAFold.git
 cd RoseTTAFold

2. 下载各种文件

 # 权重文件
 wget https://files.ipd.uw.edu/pub/RoseTTAFold/weights.tar.gz
 tar xfz weights.tar.gz
 # 下载序列以及相关的结构文件
 # uniref30 [46G]
 wget http://wwwuser.gwdg.de/~compbiol/uniclust/2020_06/UniRef30_2020_06_hhsuite.tar.gz
 mkdir -p UniRef30_2020_06
 tar xfz UniRef30_2020_06_hhsuite.tar.gz -C ./UniRef30_2020_06

 # BFD [272G] 这个alphafold也有用
 wget https://bfd.mmseqs.com/bfd_metaclust_clu_complete_id30_c90_final_seq.sorted_opt.tar.gz
 mkdir -p bfd
 tar xfz bfd_metaclust_clu_complete_id30_c90_final_seq.sorted_opt.tar.gz -C ./bfd

 # 结构模版 [over 100G]
 wget https://files.ipd.uw.edu/pub/RoseTTAFold/pdb100_2021Mar03.tar.gz
 tar xfz pdb100_2021Mar03.tar.gz
 # for CASP14 benchmarks, we used this one: https://files.ipd.uw.edu/pub/RoseTTAFold/pdb100_2020Mar11.tar.gz

3. 使用conda安装相关的环境

 # create conda environment for RoseTTAFold
 #   NVIDIA driver == cuda11,进行如下操作
 conda env create -f RoseTTAFold-linux.yml
 #   NVIDIA driver == cuda10 ,进行如下操作
 conda env create -f RoseTTAFold-linux-cu101.yml
 # 如果你使用pyrosetta进行如下操作
 conda env create -f folding-linux.yml

4. 直接运行

正如你所看到到直接运行即可,把一切交给计算机

 ../run_e2e_ver.sh input.fa .

5. 结果

输出文件夹:

结果蛋白:

后记

  1. RoseTTAfold 有两种模式,他也可以预测复合物结构,但是我目前没跑,过段时间看看
  2. 你可以使用run_e2e_ver.sh 也可以使用run_pyrosetta_ver.sh,如果你选择后者,那么请注意
    • 获取Pyrosetta相关软件下载license,并将其安装在conda的folding环境中
    • 运行install_dependencies.sh,为Pyrosetta安装相关的第三方软件
  3. GPU还是CPU ?,well,如果你想运行CPU,请按照我的提示进行操作
    • RoseTTAFold/network/predict_e2e.py 找到这个文件
    • 找到这一句 def __init__(self, model_dir=None, device="cuda:0"): ,并将其替换为def __init__(self, model_dir=None,device="cpu"):

4. 运行中遇见了segmentation fault?

  • 首先,使用conda卸载掉RoseTTAFold中的hhsuite
  • 然后重新下载一个并将其放到环境变量中
wget https://github.com/soedinglab/hh-suite/releases/download/v3.2.0/hhsuite-3.2.0-AVX2-Linux.tar.gz --no-check-certificate
tar xvfz hhsuite-3.2.0-AVX2-Linux.tar.gz

相关链接:

  1. github:https://github.com/RosettaCommons/RoseTTAFold
  2. gitee:https://gitee.com/zerodesigner/RoseTTAFold
  3. pyrosetta:https://www.pyrosetta.org/
  4. Conda:https://docs.conda.io/en/latest/miniconda.html
  5. Hhsuite:https://github.com/RosettaCommons/RoseTTAFold/issues/2
  6. RosettaFold: M Baek, et al., Accurate prediction of protein structures and interactions using a 3-track network, bioRxiv (2021)

本文分享自微信公众号 - FindKey(DrugNote),作者:ZeroDesigner

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-07-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 准备好迎接蛋白设计的时代了吗?--AlphaFold2已开源

    Hi,还记得去年的那个分数达到92分的蛋白质预测工具AlphaFold2吗?就是引发了“结构生物学”大讨论的那货。

    FindKey
  • 准备好迎接蛋白设计的时代了吗?--AlphaFold2的两种使用方式

    AF2已经出了一段时间,上次试了试RoseTTAFold,这次试试AlphaFold2.

    FindKey
  • 谷歌提前开源AlphaFold 2!Nature、Science同时公开两大蛋白质结构预测工具

    nature和Science两本杂志一直相爱相杀,总是喜欢争着发表科学领域中的重大发现、重要突破,抢夺大师文章的发表版权。

    昱良
  • AlphaFold 2不再一家独大!DeepMind和华盛顿大学团队同日抢发Nature和Science

    去年年底,谷歌 AI 团队 DeepMind 的第二代 AlphaFold 算法在生物界引起了极大的轰动,它能准确地预测蛋白质的结构,以至于许多人宣布这个长达数...

    AI科技评论
  • 准备好迎接AV1的黄金时代了吗?

    今天,我将演示SVT-AV1如何以相同码率更快地提供更高质量的内容。结合dav1d的快速AV1解码, AV1编解码器即将为全面推广做好准备。

    LiveVideoStack
  • Science | 面对alphafold,学术界没有躺平:RoseTTAFold挑战蛋白复合物预测

    2021年7月15日,华盛顿大学蛋白设计研究所David Baker教授课题组及其他合作机构在Science上发表论文"Accurate prediction ...

    DrugAI
  • AlphaFold和RoseTTAFold双剑合璧,成功预测蛋白质复合体结构,北大校友领衔登上Science

    AlphaFold和RoseTTAFold等AI的横空出世,可以说打开了蛋白质预测新世界的大门。

    量子位
  • Nature|人工智能助力蛋白质折叠预测

    2021年11月23日,Nature杂志发表文章Artificial intelligence powers protein-folding predictio...

    智药邦
  • DeepMind 再创里程碑,公开35万种蛋白质预测结构,“这”五位国内专家怎么看?

    蛋白质对于生命至关重要,几乎所有疾病,包括癌症、痴呆症都与蛋白质的结构和功能息息相关。数以亿计的蛋白质结构含有丰富的生物信息,既可以用于生物过程推理,也可以用于...

    AI科技评论
  • 两大顶级AI算法一起开源!Nature、Science齐发Alphafold2相关重磅,双厨狂喜~

    喜大普奔!今天一波Nature、Science齐发文,可把学术圈的嗑盐人们高兴坏了。

    量子位
  • Nat Rev Drug Discov|AlphaFold对药物发现意味着什么?

    2021年9月14日,Nature Reviews Drug Discovery杂志发表文章,多位专家探讨了AlphaFold对于药物发现的意义。

    智药邦
  • Science重磅:AlphaFold2从830万蛋白质中挑出了700种「复合物」

    一年前,软件程序首次成功地模拟了单个蛋白质的3D形状,其精度与几十年前的实验技术测出的一样准确。几个月前,研究人员使用AI程序编程了一个近乎完整的人类蛋白质结构...

    新智元
  • 北鲲云超算平台在AlphaFold2对蛋白质研究中有何作用?

    受人工智能和深度学习技术发展较快等因素影响,结构生物学数据的研究也开始迎来了崭新的阶段,针对蛋白质结构的预测也出现了一些新的方法,并获得了突破性进展。目前,最为...

    北鲲云
  • AlphaFold再登Nature封面!解锁98.5%人类蛋白质组,重要性堪比人类基因组

    同样在这周Nature期刊上,还有一篇题为《蛋白质结构预测的革命性变化》的社论文章,说明了AlphaFold的重要意义。

    新智元
  • Science | 蛋白质结构预测: now easier, faster

    蛋白质是生命的基础,可以单独或一起工作以构建、管理、提供燃料、保护并最终破坏细胞。为了发挥作用,这些长链氨基酸扭曲、折叠并交织成复杂的形状,这些形状可能很慢,甚...

    DrugAI
  • 预测结果与实验数据基本一致,AlphaFold2应用于研究蛋白活化以及相互作用

    用于蛋白质结构预测的基于神经网络的模型最近已达到接近实验的准确性,并且正在迅速成为生物学家武器库中的强大工具。正如使用 RoseTTAFold 或 AlphaF...

    机器之心
  • VibrantFold实现 1分钟精准预测抗体结构,精度媲美Alphafold2

    2020 年底,AlphaFold2的出现破解了困扰学界长达五十年之久的“蛋白质折叠”难题,基于氨基酸序列近乎完美地精确预测出了蛋白质三维结构,这项生命科学领域...

    DrugAI
  • 悲剧 or 春天?AlphaFold究竟给结构生物学家带来了什么?

    AlphaFold 在 2020 年的蛋白质折叠挑战赛中表现非常出色,也吸引了很多注意力。最近,研究团队又宣布即将公开他们所预测的 35 万种蛋白质的结构,而且...

    机器之心
  • Science|AI揭示了蛋白质复合物的结构

    2021年11月11日,Science杂志发表文章,对AI在预测蛋白质复合物结构方面的新进展进行了介绍和分析。

    智药邦

扫码关注云+社区

领取腾讯云代金券