背景
病毒属于无细胞生物,无法独立生存,都是营寄生生活,寄生在宿主细胞内。新冠病毒感染之后,病毒寄生在人体细胞内。目前的技术条件下无法对病毒进行分离培养。由于新冠病毒为单链 RNA 病毒,在提取过程中得到是 RNA 产物,最终得到的 RNA 样本其实属于一个混合样本,是宿主与病毒的混合样本。由于人基因组大小约为 30 亿个碱基对,而新冠病毒基因组大小约为 3 万个碱基,二者长度相差 10 万倍,因此,提取到的染色体中人基因组占据绝大部分。因此对于新冠病毒染色体提取过程中最重要的步骤就是如何对病毒进行富集,目前只能通过 PCR 扩增富集的方法,或者是宏基因组的方法将混合物直接进行测序,在 NCBI 下载新冠病毒测序数据的时候描述部分会有 metagenomics 或者 Amplicon ,分别表示利用宏基因组测序还是 PCR 扩增。下面我们分别进行介绍。
一、宏基因组测序
宏基因测序是将提取得到的新冠病毒混合物直接进行测序,无需进行 PCR 扩增,这种方法的好处是无需 PCR 扩增,操作方便,节约时间,同时不存在扩增偏向性,也没有读长限制,可以得到更长的片段。但缺点也比较明显,由于样品是混合物,其中绝大部分都是人基因组序列,病毒只占很少的部分,需要测序较多的数据,增加支出。并且因为测序数据量大,对计算资源也有更高的要求,分析难度也增大。
目前各大测序仪厂商都已经给出了各自平台专门的标准操作流程,从拿到样品到最终产出测序数据完整规范,可以自行阅读。
illumina 新冠病毒测序 SOP:
https://github.com/CDCgov/SARS-CoV-2_Sequencing/blob/master/protocols/ILMN-Nextera_Flex_Enrichment/ngs-enrichment-coronavirus-app-note-FINAL.pdf
nanopore 新冠病毒测序 SOP(需注册登录):
https://community.nanoporetech.com/docs/prepare/sars_cov_2
二、多重 PCR 扩增法
PCR 扩增可以有效富集病毒序列。从混合样品中快速富集出新冠病毒序列,而无需对人基因组进行测序,经济实惠,快速高效。来自 ARTIC Network(https://artic.network/)的科学家开发出了一种多重 PCR 的扩增方法,使用 98 对引物,可以扩增出新冠病毒的全基因组序列。由于新冠病毒基因组长度接近于 30K,每一对引物的长度大概 400 多 bp,刚好可以覆盖全基因组。
由于之前已经有了全基因组序列,就可以根据已有的全基因组序列( MN908947.3)设计引物。实验结果表明,在 qPCR Ct<25 的情况下(Ct 值越多说明其实丰度越大),可以得到很好的扩增效果,偏差在可接受范围之内,证明此种方法,可以用于病毒的全基因组扩增。测序数据结果表明第 18 和第 76 对引物没有扩增出来,这两对引物的目标序列是基因组上的 ORF1a 上的 nsp3 和 S 蛋白,还是比较重要的区域,如果无法扩增出来也就根本测序不到。
不同版本引物比较
于是 ARTIC Network 又更新了引物,推出了 V2 版的引物,但是很快有用户报道这版引物也会出现扩增偏差,于是目前又推出了第三版引物,这次可以得到很好的扩增效果。通过可视化可以看到,在达到 100,000 条数据,测序深度达到 50X 数据的时候,可以覆盖新冠病毒全基因组序列,目前普遍使用的都是 V3 版引物。
三个版本引物扩增效率比较
V3 版引物下载链接地址:https://github.com/artic-network/artic-ncov2019/blob/master/primer_schemes/nCoV-2019/V3/nCoV-2019.tsv
文章地址:https://www.biorxiv.org/content/10.1101/2020.03.10.985150v4
操作流程:https://www.protocols.io/view/ncov-2019-sequencing-protocol-v3-locost-bh42j8ye
三、不同测序平台比较
无论是提取的宏基因组样品还是 PCR 扩增产物,都可以选择不同的测序平台来进行测序。目前市场上主要的测序平台包括一代的 sanger 测序,二代的 illumina 测序,BGI 测序,IonTorrent 测序,三代的纳米孔测序,pacbio 测序等。每个平台各有优势。
更多内容可以查看各个平台的相关介绍,一些平台有单独的新冠病毒专题。
illumina:https://www.illumina.com.cn/company/supporting-covid-19-efforts.html
BGIseq:https://www.genomics.cn/sequecplatform.html
nanopore:https://nanoporetech.com/covid-19
pacbio:www.pacb.com