前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >惊!画出来的火山图居然缺半边?

惊!画出来的火山图居然缺半边?

作者头像
生信技能树
发布2019-12-11 10:36:45
1.5K0
发布2019-12-11 10:36:45
举报
文章被收录于专栏:生信技能树生信技能树

最近刷文献,发现一个很有趣的火山图,文献是发表在 October 7, 2019的PNAS的:Immune effector monocyte–neutrophil cooperation induced by the primary tumor prevents metastatic progression of breast cancer

是可以展现指定基因集的火山图

这篇文章的测序数据是公布的:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE137300 表达矩阵及差异分析结果,都可以直接下载。

可以看到测序策略是:

代码语言:javascript
复制
GSM4074939    mRNA_Neutrophils_TN1 [tag_191]
GSM4074940    mRNA_Neutrophils_TN1 [tag_482]
GSM4074941    mRNA_Neutrophils_TN2 [tag_367]
GSM4074942    mRNA_Neutrophils_TN2 [tag_706]
GSM4074943    mRNA_Neutrophils_TN2 [tag_1341]
GSM4074944    mRNA_Monocytes_CCR2+_TN1 [tag_191]
GSM4074945    mRNA_Monocytes_CCR2+_TN1 [tag_482]
GSM4074946    mRNA_Monocytes_CCR2+_TN2 [tag_367]
GSM4074947    mRNA_Monocytes_CCR2+_TN2 [tag_706_]
GSM4074948    mRNA_Monocytes_CCR2+_TN2 [tag_1341]

其中:

  • the highly metastatic tumors HCl-001 (TN1)
  • low metastatic tumors HCl-002 (TN2).

也就是说两种tumor,然后两种细胞,这样的4个分组,但是里面的火山图(不要问我是如何看出来这是一个火山图的)如下:

image-20191205084736675

可以看到,是缺半边的,如果你仔细看文章,其实是因为作者使用这样的图是为了选择性的展示数据来说明他自己的生物学故事,他们这个图展现的仅仅是 immune effector genes (GO:0002252) 的基因。

并不是全部的基因。

通常我们的火山图左右两边的点数量差不多,就是说上下调基因数量。

看起来比较正常的火山图是

随便搜索一下很多关于火山图的介绍,我这里就不赘述了。

volcano

也有一些时候全部基因的火山图也不正常

如下,我在安排学徒完成11个GSE数据集的时候,发现其中一个(GSE21785)的火山图看起来略微有点诡异!

volcano

检查代码的时候发现,其表达量分布具有分组差异。

image-20191205104926769

但是如果你从作者上传的芯片原始数据(GSE21785)开始,就会发现,是下面的分布:

image-20191205104718657

原始数据的处理,大家参考:你要挖的公共数据集作者上传了错误的表达矩阵肿么办(如何让高手心甘情愿的帮你呢?) 里面的代码:

代码语言:javascript
复制
# BiocManager::install(c( 'oligo' ),ask = F,update = F)
library(oligo) 
# BiocManager::install(c( 'pd.hg.u133.plus.2' ),ask = F,update = F)
library(pd.hg.u133.plus.2)

dir='~/Downloads/GSE84571_RAW/'
  od=getwd()
  setwd(dir)
  celFiles <- list.celfiles(listGzipped = T)
  celFiles
  affyRaw <- read.celfiles( celFiles )
  setwd(od)
  eset <- rma(affyRaw)
  eset
  # http://math.usu.edu/jrstevens/stat5570/1.4.Preprocess_4up.pdf
  save(eset,celFiles,file = f)
  # write.exprs(eset,file="data.txt")

得到的eset这个对象,与我们之前一直讲解的GEOquery包下载是一样的, 所以后续代码不需要变化。

这些数据集你也尝试一下吧

我觉得蛮有意义的。

代码语言:javascript
复制
GSE1462
GSE18732
GSE20950
GSE21785
GSE26526
GSE32575
GSE43837
GSE474
GSE58979
GSE60291
GSE62832
GSE70529
GSE72158

可以使用我们的4大R包啦

很方便的下载数据

代码语言:javascript
复制
rm(list = ls())
options(stringsAsFactors = F)
library(GEOmirror)
geoChina('GSE21785')
load('GSE21785_eSet.Rdata')
exp <- exprs(gset[[1]]) 
exp[1:4,1:4]
pd <- pData(gset[[1]])
anno = gset[[1]]@annotation
group_list =c(rep("Tubulus",6),rep("Glomerulus",6))
group_list=factor(group_list,levels = c("Tubulus","Glomerulus"))
boxplot(exp,las=2,col=group_list)
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-12-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 是可以展现指定基因集的火山图
  • 看起来比较正常的火山图是
  • 也有一些时候全部基因的火山图也不正常
  • 这些数据集你也尝试一下吧
  • 可以使用我们的4大R包啦
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档