首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

从htseq-count得到count数后如何进行差异分析

最近跟着师兄师姐做rnaseq的数据分析,计算测序得到的count数在shell下一行代码就搞定了,但是接下来怎么进行基因的差异分析呢?常用的方法是R语言的deseq2包。

大致是两种思路,第一种是先将count数的数据整理到一个表中,在R中导入data,修理成deseq2需要的形式,构建dds对象使用DESeqDataSetFromMatrix函数,网上有官方详细教程,非常清楚。

第二种我觉得网上的教程不是很清楚。得到包含count数的文件夹后,不用汇总到一个表,另外准备一个包含文件名的表格,构建dds对象时候使用DESeqDataSetFromHTSeqCount函数进行。下面我给一个我自己的案例。

setwd ("D:/me/rnaseq/rnaseqnew")##设置工作路径,不是必须的。

library(tidyverse)##加载一个整理数据的包。

library(DESeq2)##加载DESeq2的包。

dir = "D:/me/rnaseq/rnaseqnew/count"##设置含有count文件的文件夹的路径。

mydata

mydata

dds

dds2

res

datares

write.table(datares,file = "by.tsv",sep = "\t",row.names = F)##保存文件,然后就可以根据log2foldchage或者p value进行差异分析啦。

我爱编程。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180104G06MHN00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券