AI+基因测序,谷歌不久前免费开放最尖端的深度学习技术让编辑基因?

2017年12月4号谷歌大脑开源了将两大风口尖端科技融合的DeepVariant平台,这代表什么意义?

首先我们回顾下什么是DeepVariant技术?

新一代测序技术(NGS)是一种快速发展的技术,可以通过调用数十亿个短小,错误的序列读数来调用个体中存在的遗传变异来确定个体基因组的序列。尽管经过了十多年的努力和数千名专职研究人员的努力,用于变异调用的手工制作和参数化统计模型仍然会产生数千个错误,并且在每个基因组中都会遗漏变体。DeepVariant使用深卷积神经网络可以通过学习“读”(read)堆积图像和实况基因型调用之间的统计关系推断下一代基因测序读取数据中的遗传变异。这种被称为DeepVariant的方法比现有的工具更胜一筹,甚至在FDA管理的变异呼叫挑战中赢得SNP的“最高性能”奖。这种基因组构建学习的模型甚至在其他物种中也可以从大量的人类基础真实数据中受益。不同于之前存在的工具只能在特定技术上表现良好,DeepVariant可以从各种测序技术和实验设计中,从大范围的深层全基因组中学习调用变体。DeepVariant代表了从专家驱动的统计建模演进到计算机软件解释生物仪器数据的自动化深度学习方法的重要一大步。

其实有很多报导夸大也误导了大众,我们综合一些在基因工程、基因编辑二、三十年以上的专家的意见:

1. Google的DeepVariant开源程序不会组装基因组或编辑基因。DeepVariant是个识别小突变的程序,主要是单个字母的变化(称为SNPs)。(它也可以发现稍大的变化。)这被称为变异调用或SNP调用,已经存在了十多年。很多程序都可以做到这一点,其中大部分程序都做得很好,精度也超过99.9%。

2. DeepVariant比传统方法更精确吗?

大约一年前,谷歌团队在bioRxiv上发布了一个声明,声明明他们的方法比之前由同一作者Mark DePristo在麻省理工学院开发的GATK方法更准确(在有限的数据集上)。GATK非常好,使用非常广泛,但还有很多其他新的方法要快得多,有时候也更准确。谷歌团队基本上忽略了所有其他的变体调用程序,所以我们其实是不清楚到底DeepVariant是否比其它的新技术更精确。

10多年来,专家一直在对SNP和Indel在下一代基因测序数据中的问题进行改进。通过深思熟虑的深度学习框架,DeepVariant的作者们在短短几年的时间内就已经超越了传统方法的准确性。虽然DeepVariant不一定就是个重大的技术突破,在执行时计算速度也比其它方法慢,然而DeepVariant的真正威力在于它不能准确地调用变体,它真正的能力就是它证明在类似的考量和运气的情况下,我们可以在生物信息学界刚刚开始关注的领域迅速实现几十年的类似进展。

人工智能家一AI加:我们只和你分享实际有用的人工智能技能与智识

本文来自企鹅号 - 人工智能家一人人需要AI加媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏生信宝典

生信老司机以中心法则为主线讲解组学技术的应用和生信分析心得 - 限时免费

海哥,中国科学院遗传与发育生物学研究所,生物信息学博士。在生信宝典出品过多部“傻瓜式”教程。

10330
来自专栏生信技能树

WGCNA分析+公共数据库挖掘你感兴趣的癌症

原文链接: Application of weighted gene co-expression network analysis to identify ke...

42930
来自专栏思影科技

面向工作记忆过程的双向额顶振荡系统

最近,来自加利福利亚大学Helen Wills神经科学研究所的学者通过研究表明在工作记忆过程中,前额叶皮质区与大脑后皮质区之间具有一套完整的平行双向神经振荡系统...

30050
来自专栏机器之心

在癌症治疗这件事上,要不要相信人工智能?

机器之心原创 作者:虞喵喵 随深度学习技术的应用与成熟,人工智能也在不断拓展疆界。跨越传统的语音、图像、数据挖掘等强相关领域,人工智能正不断与物流、教育、金融等...

375100
来自专栏生信技能树

CRISPR相关公司的股价大跌背后的故事

被称为基因魔剪的CRISPR-Cas9(Clustered Regularly Interspaced Short Palindromic Repeats)技...

20810
来自专栏AI科技评论

学界 | 斯坦福大学新 AI 算法,凭照片辨别出你是不是“Gay”

“有的细节,人无法辨认,不等于机器也不行;比如通过脸部的细微特征来判断这个人的性取向。” 斯坦福研究员 Michal Kosinski 如是说。AI科技评论获得...

30380
来自专栏生信宝典

2018国内基因编辑技术走势

3月30~31日,由北京大学天然药物及仿生药物国家重点实验室主办的2018基因编辑学术研讨会将在京举行。届时众多一线科研工作者将聚集于此共襄学术盛宴。 201...

59940
来自专栏量子位

AI模拟人脑新突破:新型人造突触研究已公布

安妮 编译自 PHYS.org 量子位出品 | 公众号 QbitAI 人工智能发展面临的重要挑战之一是理解人类大脑,并弄清如何去模仿它。 近日,一篇刊登在《AC...

35570
来自专栏生信宝典

转录组分析的正确姿势

38240
来自专栏ATYUN订阅号

机器学习工具可以发现肿瘤中的突变,比现有模型更准确

癌症肿瘤不断生长和进化,它们的DNA也是如此。究竟DNA如何变化是重要的信息,因为它会影响医生的治疗决策。

15740

扫码关注云+社区

领取腾讯云代金券