在基因的相互作用分析预测方面,我们介绍过 [[STRING-蛋白相互作用数据库使用 | STRING]], [[BioGRID-蛋白,化学物质相互作用数据库 V4.4 | BioGRID]] 更加偏向于蛋白之间的相互作用预测。[[IncAct-基因相互作用分析数据库 | IncAct]] 是一个多组学的预测数据库。而 [[ConsensusPathDB-综合性相互作用分析数据库 | ConsensusPathDB]] 则是一个解释蛋白质-蛋白质、遗传、代谢、信号、基因调控和药物-靶标相互作用的数据库。但是对于基因相互作用而言,在不同的组织和疾病当中调控关系肯定也是不一样的。所以在进行相互作用预测的时候也要基于特定的环境来进行预测。今天就介绍一个基于特定环境预测相互作用关系的数据库:IID: http://iid.ophid.utoronto.ca/ 。
由于 IID 要进行组织特异性的相互作用网络。因此就需要收集两个方面的数据
首先就需要收集蛋白之间的相互作用关系。IID 的相互作用信息主要来自于三个方面:
为了了解基因在特定组织的特异性,作者利用多个 GEO 公共数据集来分析基因在不同的组织当中的表达情况。例如,作者使用 GSE18290 来分析基因在不同发育阶段的表达情况。
基于第一部分的结果,可以知道哪两个基因存在相互作用关系。进一步如果这两个基因在某一个组织当中都有一定的表达量,那么就认为这两个基因在这个这个组织当中存在相互作用关系。
在 IID 当中支持多个基因的输入,最多可以输入 1000 个基因。同时 IID 支持三种基因格式:基因名,UniProt ID 以及 Entrez ID ([[gene-基因基本信息查询数据库 | gene数据库]])。
在输入想要查看的相互作用之后,首先可以选择相互作用的方式以及实验性证据的最小个数。
其次如果有想要观察特定组织/疾病的内的相互作用。可以进一步进行选择。这里我们选择在胃癌当中关系相互作用关系。
输出结果方面,主要是通过表格和网络图的方式来进行展示的。在证据类型当中,也展示了是预测还是实验的结果。
以上就是 IID 的主要使用方法。相较于其他相互作用数据库。IID 主要是增加了关于组织特异性的表达情况的数据。进而确定具体的相互作用蛋白是否在特定组织当中表达。
对于来自于其他的数据库的相互作用信息而言,如果数据不跟随原始数据库实时更新的话,有可能会造成预测信息滞后的情况。例如最近的 IID 下载的 BioGRID 的数据是 2021-04-07。而 BioGRID 几乎每个月都会有一次数据更新。11月份和4月份的数据已经有很大的区别了。