有很多同学在留言区询问如何预测和研究蛋白的相互作用,今天就把发篇文章给大家介绍下。蛋白质-蛋白质相互作用(protein-protein interaction, PPI)是指两个或两个以上的蛋白质分子通过非共价键形成蛋白质复合体(protein complex)的过程。在进行数据挖掘的时候往往会得到很多的差异表达的基因,当你对着一堆基因毫无头绪时,此时PPI数据库对你的数据挖掘起了很大的助攻作用。常用的PPI分析数据库有STRING,bioGRID,然而在分析时其功能也是有一定的局限性,所以今天我给大家这个数据库在预测分析上功能更加强大,废话不多说,直接往下看。
该数据库名字叫做GeNets(网址:http://apps.broadinstitute.org/genets#),我们可以利用这个数据通过机器学习方法对差异基因(你寻找的一组差异基因)进行分析,找出其关键基因以及信号通路;同时该数据库也可以通过聚类讲寻找到的差异基因进行聚类;更人性化的是可以长期保存你所输入的一组数据,每次用的时候直接调用数据就可以了。(进入数据库后直接简单注册就能免费使用, 推荐使用谷歌浏览器)。
进入数据库后选择快速可视化选项,基因列表可以选择你以前保存的,也可以选择粘贴新的,将需要分析的基因列表粘贴进去即可在网络选择中可以选择GEO数据库作为数据的训练集,同时也可选择Web3(包括多个数据库,推荐使用),选好之后直接点绿色图标就可以了。
该图就是你所分析的数据库,点击箭头3所指向的链接即可对输入的基因列表进行可视化。
可视化结果如下图:其中不同的颜色代表不同的分类,通过机器学习的方法将其聚类到不同的疾病模型和信号通路上,点击箭头1所指向的区域可以查看富集分析的结果。
同时将页面下拉可以得到具体的分析结果,同时得到对输入基因进行注释的结果:
点击GENE SET ANALYSIS中的pre-GWAS分析可以得到下面的结果:
好了,今天先给大家介绍到这,该数据库还有很多其他的分析,如果感兴趣可以去尝试下怎么使用。
关注后获取《科研修炼手册》1、2、3、4、5、6,基金篇精华合集
领取专属 10元无门槛券
私享最新 技术干货