AF2已经出了一段时间,上次试了试RoseTTAFold,这次试试AlphaFold2.
简称白嫖Geogle,直接使用colab进行使用
Colab提供了一张GPU V100 以供挥霍
直接点击进入 此网站 https://colab.research.google.com/drive/1PePaHHp1J-L1rufW4_r7v7VpZjYVUbTH
熟悉Jupyter的应该都知道怎么操作,不知道的百度下
另外下面这种操作方式,不使用MSA信息,适用于蛋白质从头设计。
第一步:colab提供了一张GPU或者TPU以供调用,选择GPU就好
第二步:
点击方格左侧的▶️使其运行,或者直接shift+enter
注意:
在这个地方,将query_sequence改为你自己的序列
第三步:
predict_structure 在预测结构,而下方的excute则是运行时间,案例这个跑了大约2min左右,约68个氨基酸
第四步查看结构,以及下载
在左方的none中点击并下载
第一步直接git clone
git clone git@github.com:ZeroDesigner/easy_af2.git
第二步 使用conda创造环境
conda env create -f easy_af2.yaml
conda activate alphafold
第三步下载数据
alphafold 提供了一个自动化下载脚本
cd scripts
nohup sh download_all_data.sh ./ &
这一步时间很长,直接nohup挂到后台
所用空间
$DOWNLOAD_DIR/ # Total: ~ 2.2 TB (download: 428 GB)
bfd/ # ~ 1.8 TB (download: 271.6 GB)
# 6 files.
mgnify/ # ~ 64 GB (download: 32.9 GB)
mgy_clusters.fa
params/ # ~ 3.5 GB (download: 3.5 GB)
# 5 CASP14 models,
# 5 pTM models,
# LICENSE,
# = 11 files.
pdb70/ # ~ 56 GB (download: 19.5 GB)
# 9 files.
pdb_mmcif/ # ~ 206 GB (download: 46 GB)
mmcif_files/
# About 180,000 .cif files.
obsolete.dat
uniclust30/ # ~ 87 GB (download: 24.9 GB)
uniclust30_2018_08/
# 13 files.
uniref90/ # ~ 59 GB (download: 29.7 GB)
uniref90.fasta
第四步 运行alphafold
bash run_alphafold.sh -d ./scripts -o ./output/ -m model_1 -f ./example/query.fasta -t 2020-05-14
价格都差不多,当然你还需要人力来配置,人工费用另算。或者直接买超算的GPU核时。
还有很多不同的玩法
具体参看:
Gitee国内地址
https://gitee.com/zerodesigner/easy_af2