前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一个简单的转录组发NC(化腐朽为神奇)

一个简单的转录组发NC(化腐朽为神奇)

作者头像
生信技能树
发布2022-03-03 14:20:16
8020
发布2022-03-03 14:20:16
举报
文章被收录于专栏:生信技能树

转录组的时代(2010-2015年间)早就过去了,哪怕是单细胞转录组其实也已经在慢慢退火。但是绝大部分临床医生仍然是在挖掘2000-2010的芯片数据,主要是因为芯片数据教程众多,而且个人电脑比较容易hold住。不过大家仍然是要向前看啊,掌握与时俱进的技术。

技术是新旧确实是科研课题价值的一个关键因素,但总有一些人能化腐朽为神奇,哪怕是一个超级简单的传统bulk转录组项目,比如2021发表在NC杂志的文章,《Postpartum breast cancer has a distinct molecular profile that predicts poor outcomes.》,它配套数据集在:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE158854

可以看到,样品量非常少,就是 estrogen receptor positive (ER+) cases (n = 16), ( 拆开成为了两个分组:9 Postpartum, 7 Nulliparous).

就是最简单的两个分组的实验设计:

  • postpartum (PPBC)
  • nulliparous cases (Nulliparous Breast Cancer–NPBC)

全部的样品如下所示 :

代码语言:javascript
复制
GSM4812255 Nulliparous_Breast_Cancer_01
GSM4812256 Postpartum_Breast_Cancer_01
GSM4812257 Nulliparous_Breast_Cancer_02
GSM4812258 Postpartum_Breast_Cancer_02
GSM4812259 Nulliparous_Breast_Cancer_03
GSM4812260 Nulliparous_Breast_Cancer_04
GSM4812261 Postpartum_Breast_Cancer_03
GSM4812262 Postpartum_Breast_Cancer_04
GSM4812263 Nulliparous_Breast_Cancer_05
GSM4812264 Postpartum_Breast_Cancer_05
GSM4812265 Nulliparous_Breast_Cancer_06
GSM4812266 Postpartum_Breast_Cancer_06
GSM4812267 Postpartum_Breast_Cancer_07
GSM4812268 Nulliparous_Breast_Cancer_07
GSM4812269 Postpartum_Breast_Cancer_08
GSM4812270 Postpartum_Breast_Cancer_09

而且是“上古时期”的测序仪:Illumina HiSeq 2500 (Homo sapiens),使用的也是上古时代的转录组数据分析流程,居然拿到的是 GSE158854_Avon_Breast_Cancer_RSEM_FPKM.txt.gz,文件才1.2 Mb,后续全部靠这一点点数据各种花样分析。

当然,能发NC有它的两个优点:

首先是疾病特殊性:Young women’s breast cancer (YWBC)

Women diagnosed within 5–10 years of childbirth, defined as postpartum breast cancer (PPBC),

关注这个特性的乳腺癌患者,基本上就跟关注男性乳腺癌患者一样,比较少见。

确实是两个分组的标准 差异分析

目前简单的差异分析流程,基本上转录组测序技术和芯片技术拿到的表达量矩阵后续分析大同小异:

研究者关于这个差异分析的结果展现如下所示:

热图

可以看到,全局基因里面,两个分组还是说比较好的区分,在364个差异基因里面就更好的区分了两个分组。

有意思的是作者拿差异基因列表里面的 185 upregulated PPBC genes 去进行PPI网页数据库进行简单的注释:

PPI网页数据库进行简单的注释

至少看起来就是网页截图,略微有点草率。把两个核心上调通路展现了一下,这个是意料之中,肿瘤的特性就是恶性增殖,所以 cell cycle相关基因上调很正常,然后肿瘤免疫也是情理之中、

当然不仅仅是这2个生物学特性上调啊, 还有:

  • cell cycle
  • cell death
  • T-cell immunity
  • estrogen receptor signaling
  • mammary gland developmental

都是统计学显著的gsea分析上调/激活的生物学功能。

有意思的是作者把proliferation, cell death, and DNA damage pathways,分开 讨论了。

另外一个亮点是转录因子分析:

文章里面介绍的是 Master regulator analysis,这个分析在同年(2021) 有一个发表在CELL的TCGA数据挖掘文章就是基于此。

原文的描述是:In order to infer the activities of transcription factors, we used the master regulator inference algorithm (MARINa) compiled in R ‘viper’ package to perform the regulon analyses on PPBC and NPBC samples.

所以重点就是这个 viper包的使用了,其实我前些天介绍的 各种肺上皮单细胞亚群的处理前后差异 ,里面提到的单细胞转录因子分析选择的是 dorothea 这个R包,本质上是计算 Viper 得分。

数据分析的好处是,只有你做,肯定是可以找到差异,文章的故事就有了前进的方向。

肿瘤研究里面的生存意义必不可少

本文也不例外,甚至它的生存意义在提升到了标题的高度,2021发表在NC杂志的文章,《Postpartum breast cancer has a distinct molecular profile that predicts poor outcomes.》

写在后面

年轻时候我也觉得发表在CNS杂志上面的科学研究才值得学习,“幼稚”的认为NC文章是灌水。或许,它确实是水,但没办法抹杀它的社会价值,让你的结果烂在电脑里面或者实验记录本里面,不如跟着一个会讲故事的人变废为宝。

数据分析确实很重要,但讲故事的能力更重要,毕竟绝大部分人还是在生命科学领域里面讨口饭吃。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-01-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 首先是疾病特殊性:Young women’s breast cancer (YWBC)
  • 确实是两个分组的标准 差异分析
  • 另外一个亮点是转录因子分析:
  • 肿瘤研究里面的生存意义必不可少
  • 写在后面
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档