肿瘤数据挖掘还在用TCGA?这个数据库你绝对没听过!(二)

上期初步介绍了TARGET数据库,今天继续。

TARGET为选定的儿科癌症生成了大规模基因组数据,并提供了访问权限,其目的在于发现儿童癌症的治疗靶点,并将这些发现转化为临床应用

下面我们就来简单介绍一下TARGET数据库的数据类型,下载方法等。

数据类型

Genome-Scale Characterization

通过芯片以及测序的检测得到癌症以及癌旁的数据,从而分析其基因结构和表达的变异。不同类型的数据可以单独分析,也可以多组学分析来构建更为全面的基因组图谱。

Sequencing

使用第二代和第三代测序技术,对癌症和配对癌旁样本进行测序,分析儿童癌症中 mutations, gene fusions以及其它的一些变异。此外,在ALL和NBL项目中使用了靶向测序。

Open vs Controlled Access

由于TARGET对于患者的隐私有严格的保护,因此,数据分为两类: open or controlled access。这两种数据都可通过 TARGET Data MatrixOpens来访问。

Open Access Data

这种类型的数据是经过验证和解析的数据,无法识别单个患者,但此类数据可以用于分析。研究者可以通过点击TARGET Data MatrixOpens中任何标有“Open”的链接来访问这些数据。

Controlled Access Data

这类数据包含特定的患者/肿瘤信息以及原始数据,此类数据可用于进行复杂的生物信息学分析。但此类数据只有获得DUC才能进行访问和下载。

下载介绍

The Data Matrix (https://ocg.cancer.gov/programs/target/data-matrix)可以链接到TARGET的open and controlled access 数据。用户可以通过点击相应的文本链接来获取特定的数据。下载示例如下:

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180726B1CZ3N00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券