这周一直都在更新关于相互作用预测方面的数据库介绍。加上之前介绍的一些相互作用预测数据库
1. [[BioGRID-蛋白,化学物质相互作用数据库 V4.4]]
2. [[ConsensusPathDB-综合性相互作用分析数据库]]
3. [[PINA-肿瘤相互作用分析数据库]]
4. [[STRING-蛋白相互作用数据库使用]]
5. [[IncAct-基因相互作用分析数据库]]
6. [[IID-组织特异性相互作用预测数据库]]
一共有了 6 个相互作用方面的数据库。因此就简单的对目前的这 6 个数据库进行一下比较说明。
目前的两个数据库,其中 [[PINA-肿瘤相互作用分析数据库]] 和 [[IID-组织特异性相互作用预测数据库]] 属于组织特异性的数据库。PINA 在相互作用分析的基础上加入了肿瘤的表达数据,进一步分析基因在肿瘤当中的相关程度。而 IID 的组织适用性则更多,其中还包括了很多正常的组织和非肿瘤疾病。
除了这两个特异性的数据库。剩余的四个则是综合性的相互作用数据库了。所以就来比较一下这四个数据库的差异。
数据来源
首先从数据来源而言,除了 STRING 之外的三个数据库都是基于实验证据构建的。而 STRING 除了包括了实验证据的相互作用之外,也包括了一些预测的以及文本挖掘的数据。
输入
- 在 BioGRID 以及 ConsensusPathDB 只支持单个基因的输入
- IncAct 则单基因输入的基础上,可以输入多个基因。但是在 IncAct 当中,输入多个基因之后,还需要每一个基因选择具体的物种。而不能提前制定物种,有一些麻烦
- STRING 支持多种数据类型的输入。可以输入单个蛋白,蛋白序列,多个蛋白,多个蛋白序列等等等等。同时在输入结果之后,可以提前选择目标物种。
输出
- ConsensusPathDB:结果输出最多。其中包括了多个方面的内容。但是在结果的展示方面也最简陋。和目标蛋白相互作用的具体内容都没有分开说明,全部是用文字来说明的。同时也没有提供数据检索数据下载的链接
- BioGRID: 主要也是通过表格和网络图的形式来进行展示,提供了检索数据下载的链接。
- IncAct:通过表格和网络图来展示输入蛋白的所有相互作用关系。提供了检索数据下载的链接。
- STRING:主要是通过网络图的形式来进行展示。需要注意的是。如果是输入单个蛋白的话,默认展示比较可信度最高的一些基因。而不是所有相关的基因。提供了检索数据下载的链接。
同时如果是输入多个基因的话,在 IncAct 是同时分析输入基因和哪些基因存在相互作用关系。而 STRING 则是分析输入的基因之间是否存在相互作用关系。
特点
除了基本的输入和输出。每个数据库还具有其他的一些特征
- STRING:可以直接对相互作用网络进行富集分析等功能分析
- BioGRID:在预测结果当中还包括了相关化学物质以及翻译后修饰位点的预测
- IncAct :还包括了类似 miRNA,lncRNA 这些的相互作用预测
另外,对于具体的相互作用信息,可以直接查看作用位置。
- ConsensusPathDB: 则是一个蛋白质-蛋白质、遗传、代谢、信号、基因调控和药物-靶标相互作用的综合性数据库
总的来说
以上就是四个工具的比较的结果了。另外以上四个数据库都提供了所有数据下载的功能。如果只是想要查看某一个基因的相互作用关系的话。其实可以把四个数据库综合起来查看。这样得到的结果也就更加全面了。