专栏首页科研猫单细胞测序系列(1)--单细胞全基因组测序

单细胞测序系列(1)--单细胞全基因组测序

2009年,北京大学博士毕业的汤富酬在剑桥大学Gurdon研究所攻读博士后。他拿到一个崭新的课题,但该课题风险很大,并不被人所看好。不过汤富酬仅仅用了半年的时间,就攻克难关并研究出了一套新的技术:高灵敏度mRNA单细胞测序技术,自己的科学生涯一炮而响,也为整个科研界打开了单细胞测序的大门。

仅2018年,他的研究团队就发表了11篇单细胞测序方向文章,获得了单细胞测序领域的接连重要成果。他众多学术成果中,有40余篇论文发表在Cell, Nature, Science, Cell Stem Cell, Nature Genetics, Nature Cell Biology, Cell Research, Genome Research等期刊上。单细胞测序领域的时代前沿性,以及持续的发展力可见一斑。

细胞是生命的单位,然而大多数的人类基因组、癌症或其它研究仍然是通过从多个细胞中 抽提DNA 来进行测序,这忽略了细胞间的差异对于调控基因表达、细胞行为的影响,实验结果往往表示的是细胞群体中信号表达的均值,或者只代表其中在数量上占优势的细胞信息,单个细胞独有的细胞特性往往被忽略。

传统高通量测序方法,难以应用在对自然界中难以培养的微生物的研究、罕见循环肿瘤细胞的转录组分析、人胚胎发生最早期的分化特征研究、肿瘤的非均质性和微进化研究等领域。

单细胞测序以单个细胞为单位,通过全基因组或转录组扩增,进行高通量测序,能够揭示单个细胞的基因结构和基因表达状态,反映细胞间的异质性,在肿瘤、发育生物学、微生物学、神经科学等领域发挥重要作用,正成为生命科学研究的焦点。

2009 年,第一例单细胞RNA测序被发明,汤富酬等(2009)通过改进先前用于微阵列分析的转录组扩增方法,分析了来自小鼠四细胞胚胎阶段的单个卵裂球的转录组。2011 年,第一例单细胞DNA测序被发明,Navin 等(2011)基于流式细胞仪的FACS法,根据肿瘤细胞的DNA含量进行筛选,对来自两位乳腺癌病例的200 个癌细胞分别进行单细胞基因组测序,证实其中一种异质性肿瘤由三种亚群,而另一种只有一群遗传上相同的细胞构成。

2013 年,《Science》杂志将单细胞测序列为年度最值得关注的六大领域榜首,《Nature Methods》将该技术评为 2013 年年度最重要的方法学进展。

2015年以来随着10X Genomics、Drop-seq、Micro-well、Split-seq等技术的出现,彻底降低了单细胞测序的成本门槛。自此单细胞测序技术被广泛应用于基础科研和临床研究,相应成果也备受CNS青睐,文章如雨后春笋般频频出现在高分杂志。

今天,我们就来说说单细胞测序的整套流程,以单细胞基因组测序为例,主要包括四个步骤:

单细胞分离→全基因组扩增→高通量测序→数据分析。

1

单细胞分离技术

单细胞测序的第一步是将目的细胞的从样本中分离出。一些单细胞分离方法已经被开发出来,目前主要的技术包括连续稀释法、显微操作法、荧光激活细胞分选、微流控技术和激光捕获显微切割。(轻点图片,查看高清大图)

荧光激活细胞分选技术借助流式细胞仪,用激光束激发单行流动的与荧光素标记抗体相结合的细胞,根据激发的荧光信号对细胞进行分选,是现在最常用的单细胞分离技术。显微操作技术是利用显微操作仪,直接实现单个细胞的分离, 是一种强大灵活的获取单个细胞的技术。梯度稀释法是通过将细胞进行梯度稀释,最终得到单个细胞。

2

单细胞全基因组扩增

单细胞全基因组扩增(whole genome amplification,WGA)其原理是通过将单个细胞溶解得到微量基因组DNA进行高效地扩增,获得高覆盖度的单细胞基因组的技术。

由于单细胞中DNA的含量非常小(约6pg/细胞),达不到测序仪的检测要求,故在测序前,必须先对单细胞中的DNA进行扩增富集。现有的全基因组扩增方法按原理可分为三类:基于PCR的WGA方法、多重链置换扩增(MDA)、多次退火环状循环扩增技术(MALBAC)。

1) 基于PCR的WGA方法

基于PCR的WGA方法有很多种,如LM-PCR(连接反应介导的 PCR 技术)、PEP-PCR(扩增前引物延伸反应技术)、DOP-PCR(简并寡核苷酸引物PCR 技术)等。目前常用的是DOP-PCR和D-DOP-PCR,两者都是通过加入随机引物与模板结合的方式来达到扩增整个基因组的目的,不同之处主要在于后者所用的DNA聚合酶具有链置换功能。此类方法常见的商业试剂盒为:GenomePlex Single Cell Whole Genome Amplification Kit (Sigma-Aldrich, USA)和PicoPLEX WGA Kit (Rubicon Genomics, USA)。

这些技术,是早期常用的经典技术,在PCR过程中,DNA 片段的大小、DNA 的二级结构、GC含量等会影响聚合酶的扩增效率甚至导致酶滑链或者从模板上脱离,不能完整地覆盖基因组,并且会往序列中引入很多错误和非特异性扩增产物,存在扩增偏倚。不同基因组位置的扩增效率和错误,对下一步的分析也是一种挑战。

2)多重链置换扩增(MDA)

MDA 技术是在恒温下利用具有强模板结合力的 phi29DNA 聚合酶和六聚物进行链置换扩增反应。MDA是目前公认的较好的单细胞基因组扩增技术,样本无需纯化,操作简单,它能对全基因组进行高保真的均匀扩增,扩增出10~100kb大小的片段,能提供大量均一完整的全基因组序列。

但MDA的缺点是,显著的非特异扩增,往往空白对照样品也总是“无中生有”地产生大量的DNA,另外就是仍然存在序列偏差。尽管各种改进的策略正在逐步减少这些缺陷,高覆盖率、高保真性及高特异性的扩增仍然是亟待解决的问题。

3)多次退火环状循环扩增技术(MALBAC)

结合 MDA 扩增技术和 PCR 扩增技术的优势,通过利用特殊设计的引物,巧妙地使扩增子的结尾通过互补而成环,进而在一定程度上防止了基因组 DNA 的指数性扩增,明显降低了扩增偏倚性,并显著提高覆盖度,使得单细胞中93%的基因组能够被测序。

这种方法使得检测单细胞中较小的DNA序列变异变得更容易,因此能够发现个别细胞之间的遗传差异。这样的差异可以帮助解释癌症恶化的机制,生殖细胞形成机制,甚至是个别神经元的差异机制。

3

单细胞全基因组测序

全基因组测序是筛查单细胞SNP(单核苷酸多态性)及CNV(拷贝数变异)的有效手段。目前为止,大规模平行测序技术主要在2大平台上进行检测:Illumina公司的HiSeq/MiSeq平台以及Thermo Fisher Scientific公司的Ion Torrent测序平台。

Illumina的HiSeq平台因测序覆盖度更广及价格较为低廉而被更广泛地使用。而Ion Torrent平台则更倾向于基因区段的靶向测序,临床上较多用于突变等检测。另外,不同类型变异的检测所要求的测序深度不同;如单细胞拷贝数变异分析所要求的测序深度较浅,可低至0.1~2.0 ×,而单细胞单核苷酸变异的测序深度则较大,为30.0~50.0×。

Ion torrent和Illumina都是采用边合成边测序(SBS)的测序原理,不同之处在于Ion torrent是以dNTP水解时释放H+所导致的局部酸碱度变化为检测信号,而Illumina是以dNTP携带的荧光信号为检测信号。

在基因组中,外显子虽然只占其全长的1%,却包含了约85%疾病相关的变异位点,因此,外显子组测序也十分重要。外显子组测序只对外显子进行富集、扩增,所以其相比全基因组测序能更加高效、更利于编码序列的读取。目前,几种可用于单细胞外显子建库的方法包括NimbleGen’s SeqCap、Agilent SureSelect、Illumina TruSeq及Nextera Exome。可能听说过Agilent外显子捕获的人会比较多,不过据我的经验,RocheNimbleGen和TruSeq也是效率很高的哦,Nextera则需要的样本量更少,操作时间更短。

4

数据分析

在获得单细胞基因组测序之后,首先我们需要监控read的质量剔除低质量的reads,然后进行基因组的map 工作等,通过矫正由于 GC 含量引起的误差之后,我们可以多种算法去寻找基因组当中的SNV和CNV信息。软件有很多,不一一赘述,在这里向大家推荐 一款最全为的软件,GATK 工具包,这个工具包包含了处理NGS和virant calling的完整流程。

目前常见的变异类型为单核苷酸多态性(single nucleotide polymorphism, SNP)、插入缺失标记(insertion-deletion, InDel)和拷贝数变异(copy number variation, CNV)。

1) SNP、InDel

SNP和InDel是基因组上单个点或若干个(通常不大于30个)点上碱基的改变,在肿瘤、胚胎植入前遗传学诊断(PGD)等领域较常见。目前大多数检测效果较好的分析软件都是先利用Genome Analysis Toolkit(GATK)初步检测SNP或INDEL,再根据不同项目需求对检测到的SNP和INDEL进行筛选,最后通过公共数据库或本地数据库对SNP和INDEL进行注释。

2) CNV

CNV是一种基因组结构变异(SV),是由基因组发生重排而导致的基因组大片段(一般长度在1 kb 以上)拷贝数增加或者减少。CNV检测目前在肿瘤发生及演化、神经元异质性研究、胚胎植入前筛查(PGS)等领域应用广泛,但其检测方法有很多,原理和流程也不尽相同。以目前热门的PGS产品为例,CNV的检测流程主要包括:将每条染色体分割为20kb连续的窗口→统计待测样本序列中比对到各窗口中的唯一比对片段数→数据标准化→计算检测指标→寻找断点→筛选拷贝数变异。

后续有更多单细胞系列教程、视频及代码分享,敬请期待。

本文分享自微信公众号 - 科研猫(DoctorTommy),作者:明美酱

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-03-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 二代测序的基因组数据分析入门(illumina测序原理篇)

    本着“三百六十行,行行转生信”的崇高宗旨,基础科研、生物学出身的小编在今年成功进入生信圈,入坑的时候才发现贵圈真的是太乱了,不仅要敲的了代码,跑的了数据,而且跨...

    用户6317549
  • 大咖聊“生信”—生物信息入门必备

    这几年生物信息学(Bioinformatics,下文简称生信)的迅猛发展席卷科研领域,越来越多的科研工作者认识到生物信息的重要性,部分实验室甚至开出高价招聘专职...

    用户6317549
  • ”基因大神“乔治·丘奇开发基因配对交友App,优生主义在抬头?

    丘奇不仅是学术大牛,也是商届精英。他创办了几十家科技公司,今天提到的基因理想配对软件就是他其中一家公司正在开发的应用程序。该软件的注册前提是需要先获得用户的全基...

    用户6317549
  • 单细胞技术—基因测序新方向

    大数据文摘
  • 转录组分析的正确姿势(第三版)

    转录组分析是目前应用最广的高通量测序分析技术之一。常见设计是不同样品之间比较,寻找差异基因、标志基因、协同变化基因、差异剪接和新转录本,并进行结果可视化、功能注...

    生信宝典
  • 转录组分析的正确知识都了解了吗?

    转录组分析是目前应用最广的高通量测序分析技术之一。常见设计是不同样品之间比较,寻找差异基因、标志基因、协同变化基因、差异剪接和新转录本,并进行结果可视化、功能注...

    生信宝典
  • Control-Freec:检测拷贝数变异的神器

    Control-Freec 既可以检测拷贝数变异CNV,还可以分析杂合性缺失LOH。官网如下

    生信修炼手册
  • 北大课题组改进ECC测序法,利用信息冗余大幅增加测序精度 | 黑科技

    镁客网
  • Illumina测序仪比较和各种测序应用模式图,助力了解高通量测序

    Illumina做为全球最大的二代测序仪生产商,成立于1998年,起家是芯片技术,2006年收购Solexa,开启了二代测序的霸主地位,占有至少七成的二代测序市...

    生信宝典
  • 靶向测序的CNV分析简介

    相比全基因组,全外显子组只针对外显子区域进行测序,更加的经济高效。全外显子利用特定的芯片捕获外显子区域进行测序,在这个思想的基础上进一步延伸,如果只关注与疾病或...

    生信修炼手册

扫码关注云+社区

领取腾讯云代金券