专栏首页生信小驿站R语言之可视化(33)绘制差异基因分析统计图

R语言之可视化(33)绘制差异基因分析统计图

  • 读取各个数据集的差异分析结果。
GSE1 <- read.csv('diffSig.csv', header = T, row.names = 1)

GSE1 $Gene <- rownames(GSE1 )

GSE1 $GSE <- 'GSE1 '

colnames(GSE1 )

GSE1  <- subset(GSE1  select = c("Gene",    "GSE", "logFC") )

head(GSE1 )
  • 将读取的差异分析结果合并,并将其分为上调和下调两个数据集
# --------------------------------------------------------

# --------------------------------------------------------


data <- rbind(dt1, dt2, dt3....)

table(data$GSE)


data1 <- subset(data, data$logFC > 0)

data2 <- subset(data, data$logFC < 0)


data1$logFC <-NULL
data2$logFC <-NULL

dt1 <- as.data.frame(table(data1$GSE))

dt1$sig <- 'Up-regulation'

dt2 <- as.data.frame(table(data2$GSE))

dt2$Freq <- -(dt2$Freq)

dt2$sig <- 'Down-regulation'
  • 绘图
p <- ggplot() + 
  geom_bar(data = dt1, aes(x=Var1, y=Freq, fill=sig),stat = "identity",position = 'dodge') +
  geom_text(data = dt1, aes(x=Var1,  y=Freq, label=Freq, vjust=-0.25))+
 geom_bar(data = dt2, aes(x=Var1, y=Freq, fill=sig),stat = "identity",position = 'dodge') +
  geom_text(data = dt2, aes(x=Var1,  y=Freq, label=Freq, vjust=-0.25))+
  scale_fill_manual(values=c("#0072B5","#BC3C28"))+
  theme(axis.text.x = element_text(angle = 45, hjust = 0.5, vjust=0.5))+xlab('')+ylab('')

pdf(file = "deg_show.pdf",width=6,height=6)
p
dev.off()

基于此,就可以得到一张专门展示多个数据集差异分析结果统计的图,红色为每个数据集上调的基因数目。绿色为下调的基因数目。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 文献翻译:Statistical Approaches for Gene Selection, Hub Gene Identification and Module Interaction in...

    信息基因的选择是基因表达研究中的重要问题。基因表达数据的小样本量和大量基因特性使选择过程复杂化。此外,所选择的信息基因可以作为基因共表达网络分析的重要输入。此外...

    用户1359560
  • 一文重复一篇四分SCI------基于TCGA和geo的circRNA研究(1)

    1976年首次发现的具有完全闭环结构的RNA。然而,由于传统RNA检测方法的局限性,这些没有poly-A尾巴的转录本长期被忽视。近年来,随着高通量测序技术的发展...

    用户1359560
  • TMB成为癌症免疫治疗最大助力

    2018年,随着O药和K药相继在中国获批上市,中国的资本和药企对靶向PD-1/PD-L1的免疫治疗的热情达到了巅峰,大量的药企在开展相关的临床研究,一度出现没有...

    用户1359560
  • Python3实现快速排序、归并排序、堆

    py3study
  • 免疫相关基因数量到底是多少个

    其实还有另外一个策略,有点类似于人工选择啦,通常是可以往热点靠,比如肿瘤免疫,相当于你不需要全部的两万多个基因的表达量矩阵进行后续分析,仅仅是拿着几千个免疫相关...

    生信技能树
  • 算法原理不理解可以,但是请清楚一下概念

    所以最近又有学徒咨询这个细节了,她的疑问是,为什么ssGSEA得分,跟其基因集里面的每个基因的表达量,并不是完全相关的,我这次写了一个例子来讲解。

    生信技能树
  • 《GEO数据挖掘课程》配套练习题

    我把3年前的收费视频课程:3年前的GEO数据挖掘课程你可以听3小时或者3天甚至3个月,免费到B站:

    生信技能树
  • 【SLAM】开源 | 解决动态变化的室内环境中的SLAM问题——lifelong SLAM,提高位姿估计的鲁棒性和精度

    在动态环境中,服务机器人具有一定的自主运行能力。机器人自主最基本的问题之一是SLAM,目前大多数SLAM都是通过短周期记录的数据序列来进行评估的。然而在实际应用...

    CNNer
  • DRY原则的一个简单实践

    我们之前就发过一篇相关的文章:https://www.cnblogs.com/powertoolsteam/p/12758496.html 其中也提到了包括DR...

    葡萄城控件
  • 漫谈 SLAM 技术(下)

    本文对 SLAM 技术及其发展进行简要介绍,分析视觉 SLAM 系统的关键问题以及在实际应用中的难点,并对 SLAM 的未来进行展望。

    DancingWind

扫码关注云+社区

领取腾讯云代金券