前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >TCGA数据库里面配对取样的肿瘤转录组数据并不多( 居然是单细胞分析思路)

TCGA数据库里面配对取样的肿瘤转录组数据并不多( 居然是单细胞分析思路)

作者头像
生信菜鸟团
发布2021-07-05 19:08:42
1.1K0
发布2021-07-05 19:08:42
举报
文章被收录于专栏:生信菜鸟团

我看到了一个研究可能对大家有帮助,《Transcriptional response profiles of paired tumor-normal samples offer novel perspectives in pan-cancer analysis》,

发表这个研究的杂志不怎么样, Oncotarget. 2017; 8:41334-41347. https://doi.org/10.18632/oncotarget.17295 但是里面有一个信息蛮有意思的,而且毕竟是比较早期的数据挖掘了,不同于现在的粗制滥造各种灌水套路,起码他们是实打实的做了不少原创性工作了的!

如下所示,这个数据挖掘研究纳入了TCGA数据库里面的样本量还算比较多的癌症种类,而且挑选那些提供了配对样品的 :

  • bladder urothelial carcinoma (BLCA, n = 19),
  • breast cancer (BRCA, n = 111),
  • colon adenocarcinoma (COAD, n = 41),
  • head and neck squamous cell carcinoma (HNSC, n = 41),
  • kidney chromophobe renal cell carcinoma (KICH, n = 25),
  • kidney clear cell renal cell carcinoma (KIRC, n = 72),
  • kidney renal papillary cell carcinoma (KIRP, n = 32),
  • liver hepatocellular carcinoma (LIHC, n = 50),
  • lung adenocarcinoma (LUAD, n = 57),
  • lung squamous cell carcinoma (LUSC, n = 51),
  • prostate adenocarcinoma (PRAD, n = 52),
  • thyroid carcinoma (THCA, n = 59),
  • and uterine corpus endometrial carcinoma (UCEC, n = 23)

可以看到,绝大部分癌症的配对样品都不多哦!

亚型之间差异分析然后聚类

首先对每个癌症的这些样品做 paired tumor and normal samples. 的 差异分析,然后挑选 Genes with log2(fold-change) ≥ 2 in at least 10% of all samples were retained for subsequent analysis. 差异分析相信大家都不陌生了,基本上看我六年前的表达芯片的公共数据库挖掘系列推文即可;

经过一系列的差异分析后,挑选合适的基因,以较小的表达量矩阵进入后续的Consensus clustering result at k = 10 分析,如下所示的降维聚类分群结果,是不是跟单细胞数据分析有点类似?

首先是挑选基因,然后是降维聚类分群,然后看不同群里面的不同癌症领域是否聚在一起或者泾渭分明!(下面的图表就是单细胞里面的 :展示细胞比例变化之balloonplot和马赛克图

可以看到HNSC被拆分到了C1和C4两个独立的亚群,这个也是作者最重要的结论!其实没有太大的意思,头颈癌里面本来就是不同癌症的混合体,包括口腔癌,鼻咽癌,喉癌等等。

亚群之间差异分析

这个时候的差异分析,不再是各个肿瘤内部的N-T配对差异分析啦,是针对10个亚群,每个都是继续看其相当于其它9个亚群的 差异上下调基因,同样的阈值筛选。如下所示交集:

这个步骤,在单细胞数据分析里面超级常见,其实就是每个亚群找标记基因的策略。

针对HNSC

前面提到了HNSC被拆分到了C1和C4两个独立的亚群:

HNSC Subtype 1 (17 samples in C1) and HNSC Subtype 2 (23 samples in C4).

所以就可以进行细分亚群的差异分析啦!

看完这个,你对单细胞数据分析是否有了基础认识了?如果你对单细胞数据分析还没有基础认知,可以看基础10讲:

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-06-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 亚型之间差异分析然后聚类
  • 亚群之间差异分析
  • 针对HNSC
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档