HCMDB:人类肿瘤转移数据库NAR.IF=10.2

HCMDB是2017年10月份发表在Nucleic Acids Research核酸研究杂志上的一篇关于人类肿瘤转移相关的表达量数据库(mRNA、miRNA、lncRNA)。HCMDB提供了一个与肿瘤转移相关的表达量数据挖掘平台。

文章的通讯作者为华东师范大学的董东教授。文章链接为:https://doi.org/10.1093/nar/gkx1008。数据库链接为:http://hcmdb.i-sanger.com/index。

微阵列芯片和转录组测序被广泛应用于研究不同类型肿瘤转移的表达模式,相关的研究工作数量还在迅速增加。然而,这些表达量信息数据分散在不同的资源库,由于缺乏一个一体化的数据挖掘平台,使得充分分析这些数据存在困难。HCMDB整合肿瘤转移相关的表达量数据,为系统了解肿瘤转移,提供了一个有价值的数据平台。

这里,不得不多说一句,最近10年,在肿瘤研究领域,很多新技术被广泛使用,如蛋白质组、代谢组、二代测序等,产出了很多数据。然而,肿瘤研究的很多细分领域,还十分缺乏对应的数据库。可以看出,组学相关的数据库构建是近些年来科研领域的一大蓝海。

数据的收集过程如下图所示,在GEO和SRA中,通过一系列关键字进行检索,接着人工去除没有同时包含原发瘤和转移瘤,以及样本量不足的结果,得到455个数据集。在TCGA中,根据临床信息,提取到对应的82个数据集。

通过浏览文献信息,对实验设计进行分类,见下图,可以看出实验组和对照组为原发瘤和转移瘤的比例最高,为34%。

采用常见的生物信息学分析工具,如FastQC、Bowtie、Cufflink、limma、PITA、miRanda等。进行比对、表达量计算、差异分析、靶基因预测。为了更好的注释转移相关的基因,利用’metastasis’ 加基因名作为关键字在PubMed中进行检索,并进行人工校队,得到对应的文献的信息。

网站构建,数据库框架采用MySQL,PHP和JavaScript进行浏览和搜索功能的开发,Tomcat作为Web服务器。

如下图所示,网站的主要访问方式为Search和Browse。在Search栏目,输入基因名、miRNA名称进行搜索。以基因名为例,在搜索结果中,可以看到该基因相关的基本信息,该基因与肿瘤转移相关的研究文献,对应在不同实验设计中的表达量情况。在Browse栏目中,可以浏览数据库整合的全部实验设计信息,点击进入可以查看相应的差异基因情况、差异miRNA、差异lncRNA、差异基因GO、KEGG富集结果、以及调控网络等信息。

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180104B0OSNY00?refer=cp_1026

同媒体快讯

扫码关注云+社区