HCMDB(人类癌症转移数据库)是一个集成数据库,可以存储和分析癌症转移的大规模表达数据。该数据库从GEO和TCGA中收集了124个先前公开的转录组数据集,用于比较转录组以检查转移相关基因的表达,在目前版本的HCMDB中,它包含来自四百多个实验的29种癌症类型。为了注释那些可能与转移相关的基因,数据库基于7,000多种已发表的文献,总共筛选了2183个基因(1901个蛋白质编码基因,24个长非编码RNA和203个miRNA)。
HCMDB是一个易于使用的查询和浏览与癌症转移相关基因的数据库,将成为研究与肿瘤转移相关的转录组变化的全基因组视图的强大工具。
HCMDB网址:
http://hcmdb.i-sanger.com/index
HCMDB的原理图工作流程:
图片来源:网站截图
下面来看看这个数据库的使用教程:
Part One 基因检索
进入网站主页,我们可以通过输入基因符号或基因ID(基因别名,基因旧符号,uniprot ID,refseq acc,ensemble id,miRBase acc等)搜索感兴趣的基因,包括蛋白质编码基因,lncRNA和microRNA。
快速搜索允许单基因搜索,而批量搜索最多允许15个基因。
Part Two 转移相关信息总结
我们以EGFR为例,单击“提交”按钮将看到搜索结果,包括摘要,每个基因的先前关于转移的研究以及表达分析。点击搜索后会显示基因种类和其他详细信息。
一
研究结果
研究结果总结部分包括基因名、ID、对肿瘤转移的相关描述等。
二
基因研究现状
表格会展现该基因与癌症转移关系已被验证的先前研究,点击左侧链接可以进入文章首页查看具体信息。
三
基因表达分析
在上方可以选择需要研究的癌症类型,之后点击右侧Filter进行检索;
点击左侧Exp ID栏可以查看文章详细信息;
点击最右侧Result栏的图标,可以弹出差异分析结果图和共表达结果图,差异显著会显示DIFF,不显著会显示NOT。
弹出的Chart图中会显示P-value和Log2FC值以及共表达散点图。
Part Three 数据库浏览
点击Browse选项,选择癌症名称、样本大小、基因类别,点击Filter进行筛选,结果会展现出癌症类型、基因类型、癌症部位、转移部位等信息。我们可以浏览所有实验并根据有关癌症类型,原发部位,转移部位和基因类型的条件过滤感兴趣的结果。
点击左侧蓝色链接进入详细分析选项。
一
数据集相关信息
这里会展示该分析数据集来源、相关描述,mRNA、lncRNA、miRNA数目、数据类别。
选择用于差异表达基因分析的数据组,点击submit显示分析结果。
二
基因差异分析
1
mRNA
点击左侧基因栏,可以显示该基因的详细信息,如同之前的部分,点击左侧Exp ID栏可以查看详细信息,点击最右侧Result栏的图标,可以弹出差异分析结果图和共表达结果图,差异显著会显示DIFF,不显著会显示NOT。
点击plot,显示该基因的差异表达和共表达信息。
在右侧会展现该基因组基因表达热图,将鼠标移至热图上方可显示该基因信息。
2
lncRNA
点击上方DE lncRNA,同样可以对lncRNA进行分析。
3
基因功能
点击功能分析选项,结果会展现GO和KEGG分析气泡图,红色气泡表示分子功能,黄色并表示生物学过程,绿色表示细胞组成,圆圈的大小表示基因数量,颜色越浅表示P值越小。
4
差异表达基因网络图
点击Network选项,包含mRNA-mRNA和mRNA-lncRNA共表达网络分析。
⑴mRNA-mRNA
点击右上方蓝色图标可以让原点重新排列,点击绿色图标可以指定布局,点击紫色图标可以展现为环形结果图。
⑵ mRNA-lncRNA
选择mRNA-lncRNA共表达分析选项,黄色点代表mRNA,蓝色点代表lncRNA,与上面相同,点击右上方图标可改变阵列图形。
Part Four 数据下载
返回选择Download选项,在该界面可以下载数据库中包含的数据集和实验支持的基因转移关联数据。
到这里网站的使用教程就结束了,HCMDB结合了TCGA和GEO数据,同时与文献相辅相成,相比于其他数据库,HCMDB可同时分析蛋白质编码基因,lncRNA和microRNA。可同时获得差异分析、功能分析、mRNA-mRNA和mRNA-lncRNA网络互作用结果等,为研究癌症转移的实验前分析与基因筛选提供了很大的便利,除此之外,该数据库也可以成为生物信息分析研究的一个有力工具。