Hi,还记得去年的那个分数达到92分的蛋白质预测工具AlphaFold2吗?就是引发了“结构生物学”大讨论的那货。
今天AlphaFold2已经开源了,同时开源的还有Baker组一直紧跟的RoseTTaFold,如果说上一次是引发了大讨论,这一次开源就是引发了业界的大狂欢,准备好盛装入席了吗。
一睹为快:
我们直接放上两组的Github链接:
当然为了大家方便使用:
我同时在国内的Gitee上进行了备份:
为了方便理解AlphaFold2的作用,在此还是需要一些科普。
正如我们高中生物所学习的,蛋白质是生命的物质基础。由此而诞生的结构生物学则让人类可以从最微观的地方来解释疾病的发生,生理反应等等,从而研制出相对应的药物,改造抗体等等。这只是其相关应用以及前景的冰山一角。
而如何准确的预测蛋白质的结构却始终是一个难题,你可以想象我们如何从
>4WSB_1|Chain A|Polymerase PA|Influenza A virus (1129347)
GSHHHHHHHHGSGSMENFVRTNFNPMILERAEKTMKEYGENPQNEGNKFAAISTHMEVCFMYSDFHFIDLEGNTIVKENDDDNAMLKHRFEIIEGQERNIAWTIVNSICNMTENSKPRFLPDLYDYKTNKFIEIGVTRRKVEDYYYEKASKLKGENVYIHIFSFDGEEMATDDEYILDEESRARIKTRLFVLRQELATAGLWDSFRQSEKGEETLEEEFSYPPTFQRLANQSLPPSFKDYHQFKAYVSSFKANGNIEAKLGAMSEKVNAQIESFDPRTIRELELPEGKFCTQRSKFLLMDAMKLSVLNPAHEGEGIPMKDAKACLDTFWGWKKATIIKKHEKGVNTNYLMIWEQLLESIKEMEGKFLNLKKTNHLKWGLGEGQAPEKMDFEDCKEVPDLFQYKSEPPEKRKLASWIQSEFNKASELTNSNWIEFDELGNDVAPIEHIASRRRNFFTAEVSQCRASEYIMKAVYINTALLNSSCTAMEEYQVIPIITKCRDTSGQRRTNLYGFIIKGRSHLRNDTDVVNFISLEFSLTDPRNEIHKWEKYCVLEIGDMEIRTSISTIMKPVYLYVRTNGTSKIKMKWGMEMRRCLLQSLQQVESMIEAESAVKEKDMTEPFFRNRENDWPIGESPQGIEKGTIGKVCRVLLAKSVFNSIYASAQLEGFSAESRKLLLLIQAFRDNLDPGTFDLKGLYEAIEECIINDP
这一维序列中预测出其三维结构。也就是准确的预测出下面这个结构。(这个蛋白序列是我随便找的,不过意思应该是清楚的。)
而AlphaFold很好的解决了这个问题,你可以想象,在不久的未来,科学家可以借助其来设计各种的多肽,抗体(所预测的结构和实验真实结构相差无几),由此完成医药领域的进一步升级。AlphaFold所采用是深度学习。(原理只是这一句有兴趣可以看原文)
所以,说了这么多。来看看源码实现:
有句名言,计算条件达不到的,对你而言其是不存在的。
后记:
1. 准备好迎接蛋白设计的时代的到来
2. 去升级你的计算装备
3. 或许高通量的实验设备也会兴起
参考文献:
1. https://www.nature.com/articles/d41586-021-01968-y
2. Jumper, J. *et al.* *Nature* https://doi.org/10.1038/s41586-021-03819-2 (2021).
3. Baek, M. *et al.* *Science* https://doi.org/10.1126/science.abj8754 (2021).