前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >100篇泛癌研究文献解读之PhyloWGS算法的肿瘤内部异质性和基因组不稳定性

100篇泛癌研究文献解读之PhyloWGS算法的肿瘤内部异质性和基因组不稳定性

作者头像
生信技能树
发布2019-05-20 17:38:07
1K0
发布2019-05-20 17:38:07
举报
文章被收录于专栏:生信技能树生信技能树

为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹,加州举行的会议中发起了泛癌计划。参考:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视频教程在:TCGA知识图谱视频教程(B站和YouTube直达)

发表于 PLoS Genet. 2018 Sep 的研究,Pan-cancer inference of intra-tumor heterogeneity reveals associations with different forms of genomic instability. 系统性的探索了32种癌症的接近6000个肿瘤病人数据的肿瘤内部异质性情况,值得注意的是作者这里使用PhyloWGS算法的结果来代表肿瘤内部异质性,所有的生物学意义的结论都是基于这个假设。

文献解读属于100篇泛癌研究文献系列,首发于:http://www.bio-info-trainee.com/4132.html

PhyloWGS算法得到的克隆数量

PhyloWGS算法这里就不介绍了,用法很简单,但是需要原始的测序数据,所以这里也没有办法演示,但是作者提供了每个样本的PhyloWGS算法得到的克隆数量数据下载。

虽然PhyloWGS本来是为WGS测序数据设计的,但是软件作者说明了其在WES数据也可以使用,可以看到PhyloWGS算法得到的克隆数量这个指标是跟一些因素相关的,包括purity (B) inferred by ABSOLUTE, mean number of reads per mutated sites (RMS) (C), number of mutations (D) and number of copy number altered segments

假设PhyloWGS算法得到的克隆数量就代表着肿瘤内部异质性,那么这个肿瘤内部异质性就手动突变数量和拷贝数变化情况的影响。

根据突变数量和CNV情况对样本进行分类

通过阈值可以分成4组:

  • low numbers of mutations (<300) and CNA (<80) (gray),
  • high number ofmutations (>300) and low number of CNA (<80) (M class, green)
  • high number of CNA(>80) and low number of mutations (<300) (C class,red),
  • high numbers of both mutations (>300) and CNA (>80) (MC class, orange).

它们的相关性如下:

PhyloWGS和EXPANDS的比较

可以看到EXPANDS推断的克隆数量也是在根据突变数量和CNV情况对样本分成的4组是有差异的。

基因组不稳定性影响着肿瘤内部异质性

如下图可以看到,根据突变数量和CNV情况对样本分成4类,它们这4类的肿瘤内部异质性显著差异,排序后可以通过热力图展示。

不同克隆结构代表的异质性

前面是直接使用PhyloWGS算法得到的克隆数量代表肿瘤内部异质性,实际上,即使不同病人都是5个亚克隆, 它们的克隆结构也可以不一样,如下所示:

这个时候,需要引入 Tree scores的概念。

亚克隆的异质性

这个时候需要对PhyloWGS算法有一定的理解,特别是软件的输出结果的理解。

分析结果下载

S1 Table. Properties of the tumor samples.

  1. Column 1—Tumor sample name
  2. Column 2—Tumor type
  3. Column 3—Tumor subtype
  4. Column 4—Mean number of reads per mutated site
  5. Column 5—Number of mutations
  6. Column 6—Number of copy number altered segments
  7. Column 7—Top scoring phylogenies mean number of clones
  8. Column 8—Top scoring phylogenies mean Tree score
  9. Column 9—Top scoring phylogenies mean number of clonal mutations
  10. Column 10—Top scoring phylogenies mean number of subclonal mutations
  11. Column 11—TCGA curated tumor sample purity
  12. Column 12—ABSOLUTE inferred tumor sample purity.

理论上,使用这个表格的数据,我们可以重现作者的分析结果。

后记

从流程图来看,本研究并不复杂,也很容易复现出来, 关键是如何提出还有如何挑选数据集。

当然了,如果你想超脱于他们的泛癌计划已经发表的研究,那么就非常有必要跟着我读完这100篇泛癌文献!

详见我的100篇泛癌研究文献解读目录:http://www.bio-info-trainee.com/4132.html

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-05-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • PhyloWGS算法得到的克隆数量
  • 根据突变数量和CNV情况对样本进行分类
  • PhyloWGS和EXPANDS的比较
  • 基因组不稳定性影响着肿瘤内部异质性
  • 不同克隆结构代表的异质性
  • 亚克隆的异质性
  • 分析结果下载
  • 后记
相关产品与服务
灰盒安全测试
腾讯知识图谱(Tencent Knowledge Graph,TKG)是一个集成图数据库、图计算引擎和图可视化分析的一站式平台。支持抽取和融合异构数据,支持千亿级节点关系的存储和计算,支持规则匹配、机器学习、图嵌入等图数据挖掘算法,拥有丰富的图数据渲染和展现的可视化方案。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档