响应生信技能树的号召:lncRNA数据分析传送门, 一起来一个lncRNA数据分析实战,你现在看到的是jimmy的笔记,首发于简书:https://www.jianshu.com/p/fa69ed7c0387
step4: 得到表达矩阵的流程
这一步仅限于有服务器的朋友,没什么好说的了,在转录组,表观组我们都已经详细讲解了。(如果是初学者,请花37天左右的时间来理解并且重复这个流程)
SRA—>FASTQ—>BAM—>COUNTS这几个步骤而已,中间穿插一些质控的手段,每个步骤选择好合适的软件即可。可以参考:一个植物转录组项目的实战 http://www.bio-info-trainee.com/2809.html
索引建立后文件如下:
接着做出如下所示的配置文本文件:
前提是自己用和做好质量控制,然后可以调用去除接头以及低质量测序数据,得到,然后就可以批量运行程序啦!!!上面的配置文件指定的是质控之后的数据哦。
质控我已经讲的够多了,就不赘述,这个公共数据一定是需要经验丰富的质控。因为原始数据实在是太差了,下面可以看到过滤后的数据量只有原始数据的一半左右了。
下面就做比对和定量,我这里还是示范很久以前的脚本咯,因为现在的脚本非常复杂,初学者可能不太好理解,所以就来一些简单点的。
上述代码运行结束后得到的文件如下:
后续分析,请大家持续关注
~
领取专属 10元无门槛券
私享最新 技术干货