AI+基因测序,谷歌不久前免费开放最尖端的深度学习技术让编辑基因?

2017年12月4号谷歌大脑开源了将两大风口尖端科技融合的DeepVariant平台,这代表什么意义?

首先我们回顾下什么是DeepVariant技术?

新一代测序技术(NGS)是一种快速发展的技术,可以通过调用数十亿个短小,错误的序列读数来调用个体中存在的遗传变异来确定个体基因组的序列。尽管经过了十多年的努力和数千名专职研究人员的努力,用于变异调用的手工制作和参数化统计模型仍然会产生数千个错误,并且在每个基因组中都会遗漏变体。DeepVariant使用深卷积神经网络可以通过学习“读”(read)堆积图像和实况基因型调用之间的统计关系推断下一代基因测序读取数据中的遗传变异。这种被称为DeepVariant的方法比现有的工具更胜一筹,甚至在FDA管理的变异呼叫挑战中赢得SNP的“最高性能”奖。这种基因组构建学习的模型甚至在其他物种中也可以从大量的人类基础真实数据中受益。不同于之前存在的工具只能在特定技术上表现良好,DeepVariant可以从各种测序技术和实验设计中,从大范围的深层全基因组中学习调用变体。DeepVariant代表了从专家驱动的统计建模演进到计算机软件解释生物仪器数据的自动化深度学习方法的重要一大步。

其实有很多报导夸大也误导了大众,我们综合一些在基因工程、基因编辑二、三十年以上的专家的意见:

1. Google的DeepVariant开源程序不会组装基因组或编辑基因。DeepVariant是个识别小突变的程序,主要是单个字母的变化(称为SNPs)。(它也可以发现稍大的变化。)这被称为变异调用或SNP调用,已经存在了十多年。很多程序都可以做到这一点,其中大部分程序都做得很好,精度也超过99.9%。

2. DeepVariant比传统方法更精确吗?

大约一年前,谷歌团队在bioRxiv上发布了一个声明,声明明他们的方法比之前由同一作者Mark DePristo在麻省理工学院开发的GATK方法更准确(在有限的数据集上)。GATK非常好,使用非常广泛,但还有很多其他新的方法要快得多,有时候也更准确。谷歌团队基本上忽略了所有其他的变体调用程序,所以我们其实是不清楚到底DeepVariant是否比其它的新技术更精确。

10多年来,专家一直在对SNP和Indel在下一代基因测序数据中的问题进行改进。通过深思熟虑的深度学习框架,DeepVariant的作者们在短短几年的时间内就已经超越了传统方法的准确性。虽然DeepVariant不一定就是个重大的技术突破,在执行时计算速度也比其它方法慢,然而DeepVariant的真正威力在于它不能准确地调用变体,它真正的能力就是它证明在类似的考量和运气的情况下,我们可以在生物信息学界刚刚开始关注的领域迅速实现几十年的类似进展。

人工智能家一AI加:我们只和你分享实际有用的人工智能技能与智识

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20171215G0ZPWC00?refer=cp_1026

扫码关注云+社区