前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用GDC下载TCGA肿瘤患者的临床信息

使用GDC下载TCGA肿瘤患者的临床信息

作者头像
生信修炼手册
发布2019-12-20 11:34:21
1.8K0
发布2019-12-20 11:34:21
举报
文章被收录于专栏:生信修炼手册生信修炼手册

在GDC中,对肿瘤患者的临床信息进行了标准化,分成了以下7个类别

  1. Demographic
  2. Diagnosis
  3. Exposure
  4. Family History
  5. Follow Up
  6. Molecular Test
  7. Treatment

在以下链接中,提供临床信息的具体列表,共有200多项

https://gdc.cancer.gov/about-data/data-harmonization-and-generation/clinical-data-harmonization

其中有20项临床信息是必须的,展示如下

在GDC中,临床信息的下载和普通文件是类似的,在Repository中,数据类型选择Clinical, 示意如下

当然可以根据Cases的属性在进行过滤,过滤之后,在右侧可以看到文件的列表,示意如下

可以看到,原始的临床信息采用了XML格式来存储,在改文件中保存的信息更加全面。将对应的文件添加到Cart中,可以进行下载,示意如下

如果需要下载原始的文件,可以通过点击Download, 下载manifest文件,通过gdc-client来下载,这样做需要后期自己读取XML文件中的信息,在进行整理。

对于临床信息,同时还提供了TSVJSON的下载格式,其中TSV格式特别的友好,用Excel打开即可查看,示意如下

列数较多,这里只截取了部分。需要注意,这种方式得到的临床信息相比XML文件会少一点,但是对于生存分析等常用场景来说,也足够了。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-06-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档