欢迎关注”生信修炼手册”!
在最初的环状RNA研究中,认为环状RNA都是由exon通过反向剪切构成的,称之为exonic circRNA,只有这样的环状RNA能够由PCR反应验证出来的。
CIRI是一款环状RNA检测软件,通过该软件的预测结果,学者第一次用实验验证出了intronic circRNA和intergenic circRNA。该软件操作简便,准确度高,是非常流行的一款环状RNA检测软件。
该软件至少需要两个输入文件,基因组的fasta序列和测序数据比对产生的sam文件,需要注意的是,输入的sam文件必须是由bwa-mem算法比对产生的 。分析的pipeline示意如下
对于输入的sam文件,需要经过两次扫描,在第一次扫描时,根据双端数据的比对情况筛选候选的环状RNA,这一步通过判断SAM文件中CIGAR那一列的值来实现,本质上是检测覆盖环状RNA连接点处的junction reads,根据测序读长和连接点处包含的基因组区域的特征,分成以下3种模型
图A表示junction read只覆盖了起始外显子和终止外显子的部分序列,这两部分reads在基因组上的比对位置是相反的,绝大部分的环状RNA都符合这种模型。
图B表示junction read除了覆盖了起始外显子和终止外显子的两部分序列外,还覆盖了中间的一个外显子的部分序列,这种情况下reads可以分成3个部分比对到基因组上。
图C表示junction read除了覆盖了整个环状RNA外,还重复又读了一部分序列,这个只有当环状RNA的序列长度小于测序读长时才可能出现。
该软件将以上3种模型定义为paired chiastic clipping signals,简称PCC信号,如果一条reads比对情况符合以上任意一种,就认为该reads是一条环状RNA的junction reads。
为了提高准确性,识别到junciton reads之后,还会结合双端序列比对的质量paired end mapping即PEM和GT-AG保守的剪切位点进行过滤,示意图如下
只保留比对质量较高,且头尾符合AG-GT剪切信号的junciton reads进入下游分析,在第二次扫描SAM文件的过程中,通过动态规划算法给出最终的环状RNA预测结果,如果提供了GTF文件,还会对环状RNA进行注释。
该软件的使用步骤如下
代码如下
bwa mem \
-T 19 \
-t 5 hg19_index \
R1.fastq.gz R2.fastq.gz \
> align.sam
CIRI2.pl \
-T 20 \
-F hg19.fa \
-A hg19.gtf \
-I align.sam \
-O circRNA.xls
输出结果如下所示
在后续验证时,可以挑选表达量较高的来验证,在软件对应的文章中,挑选了junction reads数大于5的环状RNA来进行验证。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!