专栏首页百味科研芝士【文献解读】利用METABRIC和TCGA挖掘CNA负荷对乳腺癌的预后影响

【文献解读】利用METABRIC和TCGA挖掘CNA负荷对乳腺癌的预后影响

今天继续跟大家分享文献解读专题,这次给大家解读一篇18年发表在Frontiers in Genetics的文章,题目为:Association Analysis of Somatic Copy Number Alteration Burden With Breast Cancer Survival。

这篇文章同样是关于CNV的文章,但却不再是单基因的CNV状态,作者关注的是CNV的burden,也就是肿瘤基因组发生这些改变的百分比,也称为CNA负荷。整篇文章作者都在回答一个问题,CNA负荷对乳腺癌的预后影响究竟是怎样的?作者是借助METABRIC data和TCGA data实现对数据的挖掘。

METABRIC 和TCGA患者的临床特征

作者下载了METABRIC数据集,包括临床数据和体细胞突变数据,并将METABRIC分为Discovery (n=980) and Validation (n=985),同时TCGA数据集也被用于做Validation(n=825)。在Method部分,作者写到剔除了所有可能的 germline CNVs来保证所获得的均为体细胞的CNV。

METABRIC 和TCGA患者的临床特征

对于乳腺癌研究而言,PAM50十分重要,作者首先基于PAM50进行了生存分析,绘制了生存曲线,发现无论在METABRIC 的发现数据集还是测试数据集中,the luminal A亚型在OS和DSS方面有较好生存时间:

CNA Landscape以及与生存结果的关系

首先我们要明确CNA burden是指常染色体上(1-22)出现CNA的百分比。作者对每个病人样本计算了每一条染色体的CNA burden,发现1, 8, and 16 号染色体的CNA burden是显著的比其他染色体高,并通过热图的形式展示,如下:

基因集富集分析

接着作者对1,8,16号染色体上的存在CNA 的基因 进行基因集富集分析,每个染色体我们分别去前10%变化频率较高的基因进行分析,并考察CNA burden 是否与患者的OS和DSS相关。结果发现在METABRIC数据集中,较高的CNA burden的生存概率变低,同时在TCGA数据集中也发现了类似的结果。

CNA Burden与PAM50,年龄之间的关系

由于之前有文献报道称PAM50,年龄与病人的预后显著相关,作者接着考察了CNA Burden与PAM50,年龄之间的关系。单因素方差分析用于计算CNA Burden与PAM50的关系,发现二者显著相关,同时对年龄分别采用去线性回归分析以及将年龄分段(21–39, 40–49, 50–59, 60–69, and 70–97)进行单因素方差分析,也发现了他们之间存在显著相关。

CNA Burden 预后因素考察

作者最后一步进行了常规的单因素和多因素cox分析,发现CNA Burden是一个独立的预后因子(常见的三线表展示)。

OK,这个文章就结束了,这篇文章思路还是比较新颖,我们听说过TMB,这次的CAN burden也是一个新颖的概念,作者以此切入点来分析,来挖掘自己的故事,希望对您有帮助!

本文分享自微信公众号 - 百味科研芝士(keyanzhishi),作者:Sunny

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-10-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • TCGA的兄弟网站TCPA了解下,爆好用!

    想必大家都知道TCGA,但与之配套的TCPA很多人都不知道。TCPA全称The cancer proteome atlas,癌症蛋白图谱。更新到3.0版本的TC...

    百味科研芝士
  • 四个基因的能量代谢模型构建与验证,轻松发4分sci!

    今天分享一篇2019年6月发表于J Cell Physiol(IF:4.522)的文章,标题是Identification of a four‐gene met...

    百味科研芝士
  • 4分+基于SEER数据库挖掘原发性肝淋巴瘤的发病率、预后因素和生存结局

    大家好,这次给大家分享一篇2020年5月发表在Front Oncol杂志上的文章,2019年影响因子4.848,仍然是一篇基于SEER数据库的文章,重点研究影响...

    百味科研芝士
  • 文科汪入门「机器学习」

    机器学习的相关学习资料汗牛充栋,很多有意学习的朋友被淹没在浩瀚的资料中,不明所以。因此,找到适合自己程度的资料是很关键的。

    iOS Development
  • Leetcode 14:Longest Common Prefix 最长公共前缀

    Write a function to find the longest common prefix string amongst an array of st...

    爱写bug
  • 手把手教你用Python库Keras做预测(附代码)

    当你在Keras中选择好最合适的深度学习模型,就可以用它在新的数据实例上做预测了。但是很多初学者不知道该怎样做好这一点,我经常能看到下面这样的问题:

    数据派THU
  • .NET面试题系列[4] - C# 基础知识(2)

    面试出现频率:主要考察装箱和拆箱。对于有笔试题的场合也可能会考一些基本的类型转换是否合法。

    s055523
  • 写在员工离职之后

    https://www.cnblogs.com/freeflying/p/4709539.html

    纯洁的微笑
  • Go 语言的基本数据类型

    0)变量声明 var 变量名字 类型 = 表达式 例: var num int = 10 复制代码 其中“类型”或“= 表达式”两个部分可以省略其中的一个。 1...

    李海彬
  • pc端与移动端的事件总结

    <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title></title> <style>...

    前朝楚水

扫码关注云+社区

领取腾讯云代金券