首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >比较不同的肿瘤somatic突变的signature

比较不同的肿瘤somatic突变的signature

作者头像
生信技能树
发布2020-06-09 14:51:54
1.8K0
发布2020-06-09 14:51:54
举报
文章被收录于专栏:生信技能树生信技能树

前面我们详细讲解过,sanger研究所科学家【1】提出来了肿瘤somatic突变的signature概念 ,把96突变频谱的非负矩阵分解后的30个特征,在cosmic数据库可以学习它。不同的特征有不同的生物学含义【2】,比如文章【3】 就是使用了 这些signature区分生存!主要是R包deconstructSigs可以把自己的96突变频谱对应到cosmic数据库的30个突变特征。

  • 【1】https://software.broadinstitute.org/cancer/cga/msp
  • 【2】https://en.wikipedia.org/wiki/Mutational_signatures
  • 【3】https://www.nature.com/articles/s41586-019-1056-z

另外一个策略就是自己推断denovo的signature,可以使用SomaticSignatures 包的identifySignatures函数。这个教程我也在生信技能树分享过:使用R包SomaticSignatures进行denovo的signature推断

而且前面我在生信菜鸟团的肿瘤外显子数据分析专辑提到了,很多研究者会嫌弃cosmic数据库的30个肿瘤突变signatures,他们觉得cosmic数据库30个signature的生物学意义并不好,会尝试自己分解出来自己的signature。比如:0元,10小时教学视频直播《跟着百度李彦宏学习肿瘤基因组测序数据分析》 这个文献,研究者就是使用R包SomaticSignatures进行denovo的signature推断,拿到了11个自定义的signature。

这个时候,通常的分析节奏,就是把11个自定义的signature去和cosmic数据库的30个突变特征进行对比。原文图表如下:

不同signature对比

signatures的本质就是96突变形式的比例,所以可以直接在R里面进行相关性计算。

首先查看自己的11个自定义的signature的96突变频谱

下面的escc_denovo_results.Rata文件来源于前面的教程:

load(file = 'escc_denovo_results.Rata')
str(sigs_nmf) 
# sp signatures_probabilities
sp=sigs_nmf@signatures
head(sp)
colSums(sp)
sp=apply(sp,2,function(x){
  x/sum(x)
})
denovo=sp
rownames(denovo)

可以看到,自己的11个自定义的signature的96突变频谱如下:

11个自定义的signature的96突变频谱

然后查看cosmic的30个signature的96突变频谱

需要读取网络文件,signatures_probabilities.txt,代码如下:

# https://cancer.sanger.ac.uk/cancergenome/assets/signatures_probabilities.txt
cosmic=read.table('https://cancer.sanger.ac.uk/cancergenome/assets/signatures_probabilities.txt',
                  header = T,sep = '\t')[,1:33]

head(cosmic[,1:3])
tmp=cosmic[,2];substr(tmp,2,2) <- '.'
rownames(cosmic)=paste(gsub('>','',cosmic[,1]),
      tmp)

简单的转换,保证两个signature的矩阵行名是一样的

osmic的30个signature的96突变频谱

绘制相关性热图

代码如下:

comp=cbind(denovo[rownames(cosmic),],
           cosmic[,4:33])
colSums(comp)
pheatmap::pheatmap(cor(comp))
pheatmap::pheatmap(cor(comp)[1:11,12:41])

可以看到:

两个signature的相关性热图

文章里面的不同体系的signature的关系,得到了验证;

ESCC 508 Sigatures	COSMIC Signtures
S1				COSMIC Signature 2
S2				COSMIC Signature 13
S3				COSMIC Signature 15/6
S4				COSMIC Signature 1
S5				COSMIC Signature 18
S6				COSMIC Signature 17
S7				No similar COSMIC signatures
S8				COSMIC Signature 22
S9				COSMIC Signature 16
S10				No similar COSMIC signatures
S11				COSMIC Signature 11

你可以去跟Whole-genome sequencing of 508 patients identifies key molecular features associated with poor prognosis in esophageal squamous cell carcinoma文章对比一下,几乎是一模一样。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-06-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 首先查看自己的11个自定义的signature的96突变频谱
  • 然后查看cosmic的30个signature的96突变频谱
  • 绘制相关性热图
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档