COSMIC是癌症相关体细胞突变位点的最大的数据库之一,网址如下:
https://cancer.sanger.ac.uk/cosmic/
最新版本为v85,更新与2018年5月8日。
整个网站由以下4个项目构成
癌症相关的体细胞位点,是整个网站的核心,收录了来自不同研究机构和数据库的体细胞突变数据,并提供了方便的浏览,检索,下载功能。
对癌症研究中常用的细胞系样本进行深入研究,分析其突变信息。相比COSMIC
, 整个项目中涵盖的变异数据会少一点。该项目网址如下:
https://cancer.sanger.ac.uk/cell_lines
通过交互式的网页,展现了基因突变导致的蛋白结构域的变化。该项目网址如下
https://cancer.sanger.ac.uk/cosmic3d/
在搜索框中输入一个具体的基因名称或者蛋白名称,可以查看具体的记录。官 方的DEMO数据如下
在癌症研究中,找到相关的突变基因是最核心的目的之一。通过对各种癌症进行调研,整理了一份癌症相关的突变基因列表,这份列表就是Cancer Gene Census
,简称CGC
。该项目网址如下
https://cancer.sanger.ac.uk/census
在CGC
种,将所有的癌症相关基因分成两类
登陆之后,可以下载CGC
的完整列表
COSMIC
不仅提供了原始数据的下载功能,还整理了许多有重要意义的数据集供我们参考和下载。
下载Cosmic
数据库中的数据,有以下几种数据供下载
按需下载即可。下载时需要登陆的,而且部分数据只对大学和非盈利机构的用户公开。
从Cancer Gene Census
基因列表中,挑选没有已知数据库的基因进行展示
融合基因的列表
对所有的数据集进行了整理,分成了大规模的全基因组数据和来自ICGC
, TCGA
, PCGP
两部分来呈现
研究药物靶标基因的相关突变,对于临床治疗有重要意义。Cosmic
收集和整理了药物靶标基因的相关突变。
在癌症中,突变位点是非常多。研究人员提出了Mutational Signatures
这个概念,突变的特征集合,共划分了96种突变类型,首先根据碱基突变的类型,有C>A
, C>G
, C>T
, T>A
, T>C
, T>G
共6种基本类型,然后在考虑突变位点上有和下游的1个碱基,每个碱基有A,T,C,G 4种可能的情况,一共就有6X4X4 = 96 种突变类型。
不同癌症中这96种突变类型出现的频率有所不同,将96种突变类型的频率结合起来,可以作为一种固定的突变模式,用来表征某一类癌症。
Cosmic
基于10952给外显子和1048个全基因组数据,总结出了30种Mutational Signatures
。其中Signature1
示例如下
在网站上,还提供了一系列的工具。
通过不同的组织来查看相关类型的癌症,更加的直观方便。
基因组浏览器
copy nunber analysis, 查询拷贝数变异的工具。
一个API工具,可以快速查询COSMIC
数据库中某个突变是否存在。返回JSON
格式的数据,
以上查询对应的链接如下
https://cancer.sanger.ac.uk/api/ga4gh/beacon?allele=A&chrom=7&dataset=cosmic&format=json&pos=140753336&ref=38
返回的内容如下
{
"response" : {
"exists" : "true"
},
"query" : {
"allele" : "A",
"ref" : "GRCh38",
"pos" : "140753336",
"dataset" : "cosmic",
"chrom" : "7"
},
"beacon_id" : "COSMIC Beacon",
"version" : "85"
}
COSMIC
数据库中默认的坐标是基于hg38版本的基因组的,可以在首页的Genome Version
中选择CRCH37
,切换到hg19版本。