做过全转录组的童鞋们都知道全转录组是1个样本构建2种文库,得到4种RNA(mRNA、lncRNA cicrRNA 、smallRNA)。然而拿到数据时候,我们是不是有种很懵的感觉,不禁感叹数据量如此大,该怎么形成一个完整的调控网络?那不妨看看全转录组联合分析,小编带你感受全转录组联合分析的美!来,一张导图带你快速一览全局。
策略一
差异RNA在全基因组范围内分布
拿到数据后为了快速的了解差异的mRNA、差异miRNA、差异lncRNA或者是差异circRNA分布情况,一般可以先做饼状图,差异基因分布柱状图,或者是来一张酷炫的圈图,对数据整体情况进行查看。饼状图往往是看在项目中整体检测到的基因或者是差异基因(注意这里的基因可以mRNA、miRNA、lncRNA、circRNA中的任意一种的占比情况;差异基因基因分布柱状图则主要展示不同类型的RNA在不同染色体表达量的分布情况。圈图则主要是从全基因组范围窥探不同类型的RNA表达量的情况,从多角度看数据的差异有助于发现差异调控机制。
Fig1 A:差异RNA显著性circos图。
B:差异表达的RNA数目分布。C:RNA在不同染色体的表达分布
策略二
差异gene相关靶向RNA分析
非编码RNA作用的靶基因是分析中不可缺少的一部分。比如说lncRAN作用的靶基因分析,miRNA作用的靶基因,circRNA作用的靶基因分析。找到每种非编码RNA对应靶基因后,则可以通过韦恩图寻找关键的基因,快速缩小验证的范围。
Fig 2 韦恩图
策略三
共表达分析
当然除了上述的韦恩图外,也可以通过共表达的方式来确定不同类型的RNA之间的联系。具有相同表达模式的基因更趋向于拥有相同的功能。当样品数量大于等于5时,可以采用皮尔森相关性分析,分别对差异RNA之间构建mRNA-lncRNA, miRNA-circRNA共表达网络,筛选条件是共表达的RNA对之间相关性的绝对值大于0.9, 显著性p值小于0.01。数据展示形式可以是表格,也可用是相关性网络图(与Fig3类似)。
策略四
竞争性内源RNA(ceRNA)网络分析
竞争性内源RNA(ceRNA)是近几年来的研究热点,是一种全新的转录调控模式。根据竞ceRNA作用机制,主要是通过以下3个条件筛选获取候选的ceRNA关系对:
1) ceRNA之间相同的miRNA数目应大于5;
2) 超几何检验p值小于 0.01,校正后的FDR值小于 0.01;
3) 当样品数量大于等于5时,可以考虑ceRNA的表达水平,将共表达分析的结果考虑进来,即得到ceRNA之间两两均共表达的ceRNA共表达网络。
基于ceRNA网络,对每个差异组合提取差异的关系对,绘制成相关性网络图。如下:
Fig 3 差异lncRNA-miRNA-mRNA关系对示意图。lncRNA、miRNA、mRNA分别用圆、菱形、箭头表示,上下调分别用红色和绿色表示
策略五
关键基因通路整合分析
Fig 4 KEGG整合通路网络
所有的分析最终还是要回归到功能或者是通路,因此最终还需对关键RNA中的基因进行通路富集分析。目前采用的方法:1、采用随机游走中的经典算法PageRank来获取网络中所有节点的打分(即重要性)。选择网络中打分排布在前0.1 的点,即关键RNA,作为重点的研究对象;2、对关键RNA中的基因进行通路富集分析,选择最显著富集的前5个通路。提取这5个通路中基因与基因之间的关系整合成网络,并将关键基因map到通路中,当然如果有感兴趣的目标基因,也可以根据目标基因作图。