lncRNA项目的实战-第四步

文章来源：企鹅号 - 生信菜鸟团

响应生信技能树的号召：lncRNA数据分析传送门, 一起来一个lncRNA数据分析实战，你现在看到的是jimmy的笔记，首发于简书：https://www.jianshu.com/p/fa69ed7c0387

step4: 得到表达矩阵的流程

这一步仅限于有服务器的朋友，没什么好说的了，在转录组，表观组我们都已经详细讲解了。（如果是初学者，请花37天左右的时间来理解并且重复这个流程）

SRA—>FASTQ—>BAM—>COUNTS这几个步骤而已，中间穿插一些质控的手段，每个步骤选择好合适的软件即可。可以参考：一个植物转录组项目的实战 http://www.bio-info-trainee.com/2809.html

索引建立后文件如下：

接着做出如下所示的配置文本文件：

前提是自己用和做好质量控制，然后可以调用去除接头以及低质量测序数据，得到，然后就可以批量运行程序啦！！！上面的配置文件指定的是质控之后的数据哦。

质控我已经讲的够多了，就不赘述，这个公共数据一定是需要经验丰富的质控。因为原始数据实在是太差了，下面可以看到过滤后的数据量只有原始数据的一半左右了。

下面就做比对和定量，我这里还是示范很久以前的脚本咯，因为现在的脚本非常复杂，初学者可能不太好理解，所以就来一些简单点的。

上述代码运行结束后得到的文件如下：

后续分析，请大家持续关注

相关快讯