TCGA肿瘤数据库使用训练(二)

转载请注明:解螺旋·临床医生科研成长平台

利用cBioPortal分析并作图

回顾一下昨天发布的题目:

图多,但流程都一样的。

A:前列腺癌的TCGA Provisional数据集。查询APC、CTNNB1、GALNT10、GRB2、LYN、SIGLEC1、SOS1、ZAP70、FAM84B这9个基因,选择有拷贝数变异(CNA)的子集,浏览各基因在各样本中的变异情况,并标出疾病状态标签(Disease Free status)。

B:上述基因变异与否的无进展生存期的生存曲线。

C:前列腺癌,MSKCC, Cancer Cell 2010数据集,选择有CNA的子集,查询上述9个基因的变异情况,标出疾病状态。

D:与C同一数据集的无进展生存曲线。

E:与图A、B同一数据集的总体生存期曲线。

Tip:图A、B、E是用provisonal的数据,可能已有更新,所以做出的图跟已发表的文献中略有不一样也不要方。图C和D做出来是和文中一样的。

步骤

下方的基因组数据类型就用默认的。接着病例子集选择带有CNA数据的病例。基因查询列表中填上题目中的9个基因,等自动验证名称全部有效,出现下方的绿色提示后,就点提交查询按钮。

下面自动弹出的第一个界面OncoPrint就是这些基因在样本中的变异情况,差不多就是图A了。把鼠标悬停在图和选项卡之间的空白区域,就能显示其他的选项。

在Add clinical tracks下拉框中,搜索Disease Free Status,输入前几个字母就找到了,将它勾选上。这样在图形上方便增加了一道疾病状态的图,标出每个样本的“无疾病”或“复发/进展”状态。

接下来就是文献中的图了,可以下载保存,建议选择PDF或SVG,都是可以放大不失真的矢量格式,且便于进入Adobe Illustrator进一步编辑排版,比如文章里的图例和生存数据汇总的表格位置跟网页上的不一样,就有可能是后期排版调整的。

文章中图A只截取了包含基因变异的一段,其实后面492个样本的信息都有绘制。下图就是从下载回来的PDF文件中截取的,也没截完。

接下来,在上方的选项卡中找到Survival,就看到下边的Kaplan Meier生存曲线图。

这个页面上,上方是总体生存期的KM曲线图(图E),下方是无进展生存期的曲线图(图B)。你要问为什么作者倒过来排版,我也不造啊^(oo)^

同样可以保存svg格式,而png适用于网页展示,贴到文章里的话可能会糊的。

你可以看到,这图跟原文是有一点点不同的,应该是数据更新过了。不过大结论也没变。

接下来图C和图D,只是换一个数据集,点网页上方的Modify Query,修改查询条件。

这就回到了熟悉的查询界面,找到前列腺后,选择MSKCC,Cancer Cell 2010的数据集,同时记得取消刚才的TCGA, Provisional,下边样本子集选择CNA,再次提交查询。

接下来的步骤就跟上边一样了。同样,OncoPrint中的图只截取了有变异的一小段,成为图C。

后边的Survival找到无进展生存期的图,即图D。

这回是用一份已发表的数据,所以做出来应该跟示例文献中的图是一样的。啊~文中两个OncoPrint的图里为啥“无疾病”和“复发/进展”的颜色是反过来的捏?本宝宝也不知道这图经历了什么^(oo)^但是我们新做的图,颜色是一致的,所标的样本疾病状态和下面的基因变异情况,跟文中的是能对应上的。

除了这张图之外,这份文献对TCGA的运用还有不少值得学习的地方。比如,那9个基因的筛选也有TCGA的参与,即是用TCGA provisional数据集的485例患者随机拆分成10套n = 300的训练集(training set)和n = 185的测试集(testing set),经过Cox模型筛选得来的。

本题作业所用的图,是把筛选好的9个基因放回原来的TCGA provisional整个数据集中进行验证,再用一个独立的外部数据集,即MSKCC, Cancer Cell 2010,再次验证。此外,也在黑色素瘤的TCGA, provisional数据集中得到相似的结果。

当然作为一篇5分的文章,还要加上动物实验和作者新收集的临床样本等,感兴趣的同学可以自己看看~

明天第三题预告

用RTCGAToolbox包下载结肠癌的mRNAArray的数据,肿瘤类型代号:COAD;版本号:20140115;基因:IL17A。

图中所标的P值,其获取方法在本次单元课中未提及,故作业不做要求。

有兴趣的小伙伴还可以试试该文补充材料的Fig 1,即同一套数据的RORC基因。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180208A0YATE00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券