AlphaFold又搞事情了,看看你是不是已经失业了。
人类基因组拥有大约20000种蛋白质。但只有大约三分之一有实验确定的三维结构。而且很多结构只是部分已知。
现在,AlphaFold已经预测了几乎整个人类蛋白质组的结构。此外,该工具还预测了各种其他生物体的几乎完整的蛋白质组,从小鼠(mice),玉米(corn)到疟原虫( malaria parasite )。
其数据库由EMBL-EBI所维护,其地址为:https://alphafold.ebi.ac.uk/
目前有35万多个蛋白质结构,准确性各不相同。研究人员说,将在今年年底增长到1.3亿个结构,这将可能彻底改变生命科学(旧时代与新时代的交响曲)。
伦敦大学学院的计算生物学家Christine Orengo说:“从我的角度来看,这完全是一场变革,所有这些蛋白质的形状都能让你洞察它们的作用机制。”DeepMind的联合创始人兼首席执行官Demis Hassabis表示:"这是迄今为止人工智能系统对提升科学知识做出的最大贡献,我不认为这样说有什么过分。"但研究人员强调,这只是一个开始,而不是结束。他们希望验证这些预测,更重要的是,将它们应用到以前所未曾想象的实验中。这是惊人的一步。
AlphaFold预测的结构覆盖了98.5%的已知人类蛋白质和,除此之外,AlphaFold还对其预测的可信度进行了测量。”我们想给实验学家和生物学家一个真正明确的信号,告诉他们应该依赖哪一部分的预测,”Kathryn Tunyasuvunakool说,他是DeepMind的科学工程师,也是一篇描述人类蛋白质组预测的自然论文的第一作者。
DeepMind团队 预测了UniProt人类参考蛋白质组的结构(每个基因一个代表性序列),长度上限为2700个残基。最终的数据集覆盖了98.5%的人类蛋白质,并进行了全链预测。