专栏首页镁客网蛋白质的新“折叠”!DeepMind重磅推出家族新成员AlphaFold

蛋白质的新“折叠”!DeepMind重磅推出家族新成员AlphaFold

通过阿尔法折叠,提前十年检测老年痴呆就容易多了。

策划&撰写:Lynn

人工智能领域第一大家族,来自DeepMind的Alpha家族最喜欢做的事情就是出其不意。

它们所有的小确幸都是,意料之中、精彩尤甚。

比如之前一战成名的AlphaGo、后续傲娇的AlphaZero,以及这两天刚刚加入家族战队的AlphaFold,中文封号为,阿尔法折叠。

生物医学领域,一向都是冷静与热情并存,而这位AI新宠儿AlphaFold的性格虽然还不明朗,但至少目前看来,势必会引发生物医学领域新一轮的研究加速。

“小奇妙”阿尔法折叠

据DeepMind介绍,阿尔法折叠这项成果的重大意义就在于,你给它一段基因序列(生物学上称其为蛋白质一级结构),在电脑上跑一下,就可以成功对这种蛋白质建模。

看似简单,但意义非凡。

在过去五十年,和阿尔法折叠起到相同功能的技术有冷冻电子显微镜、核磁共振或X射线晶体学等实验技术。单看仪器,它们就需要高昂的价格,但最重要的是,其实验成本也很高,需要专人做大量的实验,器材损耗不说,实验用料就要花费数万美元。

花钱不说,最主要的是,整个过程太慢,需要耗费研究者几年甚至数十年的光阴。

有了阿尔法折叠就不一样了,生物学家再也不用在实验器材面前耗费数十年的光阴,只需要简单录入数据就好。

当然,阿尔法折叠的好处不仅这么点,最终它还是惠及到我们普罗大众的身上。

以老年痴呆症(学名为阿尔茨海默氏症)为例,它在人体的潜伏期长达十几年之久,且病因复杂,以目前的医学技术,临床上甚至很难在发病前几年检测出这一疾病。

在生物学研究上,科学家普遍认为蛋白质的变化是引发老年痴呆的病因。换句话说,老年痴呆患者的某一部分蛋白质长得一定和正常人不一样。但是由于我们的研究速度太慢,所以生物学家不知道身体中所有的蛋白质形态,因此检测哪一部分不一样就难如登天。

想象一下,通过阿尔法折叠,提前十年检测老年痴呆就容易多了,只要通过电脑看下蛋白质长得是否有差异就可以了。

人工智能对蛋白质结构的“深度宠爱”

这一次,让阿尔法折叠一战成名的还是一项比赛。

在1994年,为了促进研究和衡量最新方法在提高预测准确性方面的进展,蛋白质结构预测技术关键评估社区范围实验(CASP)的双年度全球竞赛被设立。演变至今,其比赛结果已经成为行业标准。

虽然没有AlphaGo当年成名那么壮观,但作为阿尔法家族的一员,阿尔法折叠一出手就是不凡。在今年的CASP比赛上,它不出所料的成功拿到了第一。

据DeepMind官网上的介绍,基于深度神经网络,他们设计了两种方法以用来构建完整而精确的蛋白质结构。

首先,他们先采集氨基酸对之间的距离和连接这些氨基酸的化学键之间的角度数据,接着将这些数据设计成用以评估蛋白质结构准确度的分析工具。

使用这一分析工具,研究团队想出第一种方法,就是在现有蛋白质数据库里找到最匹配的蛋白质,如果找不到,他们就基于最接近的搜索结构上,用新的基因片段不断替换,以创造出匹配要求的新结构。

而这第二种方法要更简单一些。据他们介绍,研究人员主要用的就是梯度下降 -a数学技术,它的精度相较于第一种会更高一些。相较于第一种方式,这种技术一步就可以预测整个蛋白质链,而不用经历组装的过程,整个过程更简单。

DeepMind没有公布更多细节,但经过这样“简单”的设计,奇迹就这样发生了。

最后,科普来了

在人体内,蛋白质是一种神奇的存在。

众所周知,蛋白质是构成人体结构的主要成分,其含量仅次于水,约占一个人体重的五分之一。我们身体所要执行的几乎所有功能,包括肌肉的收缩与拉伸、身体对光线的感知和食物的转化,都需要蛋白质在其中起关键作用。

而科学家指出,蛋白质的结构很大程度上决定了一种蛋白质的特性,因此研究蛋白质3D结构的重要性就显而易见了。在我们的身体里,这样的案例比比皆是,如构成我们免疫系统的抗体蛋白质是“Y形”的;胶原蛋白的形状像绳索;用于基因编辑的CRISPR和Cas9,它们则像剪刀一样。

但是纯粹从基因序列只能够找出蛋白质的三维形状是一项复杂的任务,按照传统的研究方法,科学家需要从一级结构、二级结构来一层层研究,花费几十年甚至千百年才能够完全建立蛋白质的形态模型。

而阿尔法折叠的出现,让生物学家省去了不少功夫。

在DeepMind官网上,他们是这么介绍这一重大成果的面世的:“我们很高兴与大家分享DeepMind在展示人工智能研究如何推动和加速新科学发现方面的第一个重要里程碑。DeepMind汇集了来自结构生物学、物理学和机器学习领域的专家们,通过跨学科方式将尖端技术运用其中,设计出了仅根据其基因序列就可以预测蛋白质3D结构的AlphaFold。”

相关信息参见DeepMind官网

本文分享自微信公众号 - 镁客网(im2maker)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-12-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 多线程:为什么在while循环中加入System.out.println,线程可以停止

    这个我们都知道,由于 stopReqested 的更新值在主内存中,而线程栈中的值不是最新的,所以会一直循环,线程并不能停止。加上 Volatile 关键字后,...

    用户1655470
  • 200行代码,一行行教你自制微信机器人

    1) 用一个windows客户端工具运营公众号,真的很局限。虽然工具的功能很强大,能自动添加好友,自动拉好友入群,关键字回复等等,但是有一个绕不开的点,它是一款...

    用户1634449
  • 一些常用的算法技巧总结

    数组的下标是一个隐含的很有用的数组,特别是在统计一些数字,或者判断一些整型数是否出现过的时候。例如,给你一串字母,让你判断这些字母出现的次数时,我们就可以把这些...

    帅地
  • Diss所有深度生成模型,DeepMind说它们真的不知道到底不知道什么

    深度学习在应用层面获得了巨大成功,这些实际应用一般都希望利用判别模型构建条件分布 p(y|x),其中 y 是标签、x 是特征。但这些判别模型无法处理从其他分布中...

    机器之心
  • 理解BitMap算法的原理

    位图:一种常用的数据结构,代表了有限域中的稠集(dense set),每一个元素至少出现一次,没有其他的数据和元素相关联。在索引,数据压缩,海量数据处理等方面有...

    我是攻城师
  • 一张图解释负载均衡

    首先当大量用户访问时候,先请求到nignx服务器,因为nignx对于高并发支持较好,所以由nignx服务器将访问需求分配给不同的apache服务器,apache...

    smy
  • 『高级篇』docker之Mesos集群架构图(23)

    IT故事会
  • TFS2018环境搭建一硬件要求

    TFS可以安装在Windows Server和Windows PC操作系统中,但是TFS2018和2018只支持64位操作系统中,早期的版本没有操作系统的位数限...

    郑小超.
  • 迷人又诡异的辛普森悖论:同一个数据集是如何证明两个完全相反的观点的?

    在辛普森悖论中,餐馆可以同时比竞争对手更好或更差,锻炼可以降低和增加疾病的风险,同样的数据集能够用于证明两个完全相反的论点。

    大数据文摘
  • python基础类型(一):字符串和列表

    注意到最后三个的单双引号是嵌套使用的,但是最后一个的使用方法是错误的,因为当我们混合使用两种引号时必须有一种用来划分字符串的边界,即在两边的引号不能出现在字符串...

    渔父歌

扫码关注云+社区

领取腾讯云代金券