最近跟着师兄师姐做rnaseq的数据分析,计算测序得到的count数在shell下一行代码就搞定了,但是接下来怎么进行基因的差异分析呢?常用的方法是R语言的deseq2包。
大致是两种思路,第一种是先将count数的数据整理到一个表中,在R中导入data,修理成deseq2需要的形式,构建dds对象使用DESeqDataSetFromMatrix函数,网上有官方详细教程,非常清楚。
第二种我觉得网上的教程不是很清楚。得到包含count数的文件夹后,不用汇总到一个表,另外准备一个包含文件名的表格,构建dds对象时候使用DESeqDataSetFromHTSeqCount函数进行。下面我给一个我自己的案例。
setwd ("D:/me/rnaseq/rnaseqnew")##设置工作路径,不是必须的。
library(tidyverse)##加载一个整理数据的包。
library(DESeq2)##加载DESeq2的包。
dir = "D:/me/rnaseq/rnaseqnew/count"##设置含有count文件的文件夹的路径。
mydata
mydata
dds
dds2
res
datares
write.table(datares,file = "by.tsv",sep = "\t",row.names = F)##保存文件,然后就可以根据log2foldchage或者p value进行差异分析啦。
我爱编程。
领取专属 10元无门槛券
私享最新 技术干货