生信技能树学习笔记
关于转录组的综述
• A comprehensive evaluation of normalization methods for illuminating high-thoughput RNA sequencing data analysis
• Methods to study splicing from high-throughput RNA sequencing data
• A survey of best practices for RNA-seq data analysis
• hppRNA-a snakelike-based handy parameter-free pipeline for RNA-seq analysis of numerous samples
• Gaining comprehensive biological insight into the transcriptome by performing a broad-spectrum RNA-seq analysis
• RNA sequencing: the teenage years
转录组分析的一般流程
转录组分析的几种策略
A和b是有参考序列的c是没有参考序列的物种,a是以基因组为参考序列,b是以转录组为参考序列。分析过程中用到的软件不同。
测序原理
1.中心法则
2.转录组是指所有RNA的转录本,可以是单个细胞也可以是一群细胞。RNA分为编码和非编码RNA,非编码RNA又可以分为
RNA根据质量(A)和数目(B)排序,如下
主要在于建库方式有所不同,提取RNA对象不同
• mRNA:RNA-Seq,普通转录组测序
• lncRNA:lncRNA-Seq,一般采用链特异性测序
• miRNA:miRNA-Seq,小RNA测序
• circRNA: cirRNA-seq,一般有两种,消化性线性RNA建库或者去rRNA建库。
普通转录组测序流程
1.RNA样品检测
高质量的RNA是整个项目成功的基础。我们使用以下方法对样品进行检测,检测结果达到要求后方可进行建库:
(1) Nanodrop检测RNA的纯度(OD260/280)、浓度、核酸吸收峰是否正常;
(2) Agilent 2100精确检测RNA的完整性,检测指标包括:RIN值(>8.0)、28S/18S、图谱基线有无上抬、5S峰。
对于降解样本难以获取完整的转录本信息,影响数据质量及完整性。
当RNA总量较低时,会导致建库成功率低,或数据dup率高等问题。
2100峰图:如下是两个RNA样品2100检测结果示例。
2. 样品检测合格后,进行文库构建,主要流程如下:
(1) 磁珠(上面带TTTTT..结构)富集真核生物mRNA(有polyA尾)(此步骤对RNA的完整性要求比较高,一般RIN值要大于8);
(2) mRNA进行随机打断;
(3) 以mRNA为模板,合成第一条cDNA链和第二条cDNA链
(4) 进行末端修复、加A尾并连接测序接头,然后进行片段大小选择;
(5) 最后通过PCR富集得到cDNA文库。
文库:连接好接头的cDNA,叫做文库,英文为library
Y字接头:自身不配对,可以有效避免接头在连接的过程中自连接,用途是与flowcell上的接头进行连接
插入的cDNA序列是各种各样的
index:一段特定的序列,标记不同来源的样本6-8个碱基
read2测序引物结合位点:在Index序列的旁边GAT
文库构建完成后,对文库质量进行检测,检测结果达到要求后方可进行上机测序,检测方法如下:
(1) 使用Qubit2.0进行初步定量,使用Agilent 2100对文库的插入片段(insert size)进行检测,insert size符合预期后才可进行下一步实验。
(2) Q-PCR方法对文库的有效浓度进行准确定量(文库有效浓度>2nM),完成库检。
库检合格后,不同文库按照目标下机数据量进行pooling,用Illumina Novaseq平台进行测序。主要有以下四个步骤:
SBS(Sequencing-By-Synthesis):
通过单分子阵列实现在小型芯片(Flowcell)上进行桥式PCR反应。通过可逆阻断技术实现每次只合成一个碱基,再利用四种带有不同荧光标记的碱基,通过荧光激发/捕获,读取碱基信息
基于可逆终止的、荧光标记dNTP,边合成边测序
芯片:
8条通道:内表面做了专门得化学修饰,布满了短的oligo 序列(P7/P5接头)2中DNA引物,种在玻璃表面,通过共价键连接。
液流孔:
每个lane的两端,液流流进、流出的地方
Flowcell中的每条Lane的每个面各被扫描三个道,每个道被称为一个swath。
把文库种到芯片上去,然后扩增,文库两头的DNA序列与芯片上的引物互补,互补杂交杂交完后,加入dNTP和聚合酶,合成双链,加入NaOH碱溶液,双链解开,加入中性液体,环境变成中性。
问:为什么进行桥式PCR?
扩增,增加荧光强度
问:为什么测序两次?
从两端测,合称为一条链,如图所示: