专栏首页生信修炼手册MINT:蛋白质相互作用数据库简介

MINT:蛋白质相互作用数据库简介

欢迎关注”生信修炼手册”!

MINT, 全称molecular interaction Database, 是一个蛋白质相互作用的数据库,该数据库中的蛋白相互作用都是由专家审核过的有实验证据支持的,目前该数据库涵盖了607个物种,共117001个蛋白相互作用关系。网址如下

https://mint.bio.uniroma2.it/

目前该数据库中的数据已经集成到intact这个数据库中去了,所以官网上只提供了下载功能,示意如下

既可以一次下载整个数据库中的所有内容,也可以只下载常见物种的数据。下载的文件格式称之MITAB格式,这种格式是\t分隔的纯文本文件,专门用来描述两个蛋白间的相互作用。

对于蛋白A和蛋白B, 如果二者存在相互作用,就说存在一个interaction, 而蛋白A和B称之为interactors, 在MITAB格式的文件中,除了记录interaction 之外,还记录了interactors的诸多属性。该文件列数很多,下面对前15列信息进行说明

1. column1

第一列记录的信息为Unique identifier for interactor A, 代表蛋白A的唯一标识符,在MINT数据库中,采用的是uniprot数据库中的蛋白编号,比如uniprotkb:Q4ZGA4

2. column2

第二列记录的信息为Unique identifier for interactor B, 和第一列的内容类似,用来记录蛋白B的唯一标识符

3. column3

第三列记录的信息为Alternative identifier for interactor A, 代表蛋白A的其他标识符,比如在intact数据库中的蛋白编号intact:EBI-9675545, 在MINT数据库中的蛋白编号intact:MINT-1525738, 或者是在uniprot数据库中的别名,比如uniprotkb:A0SDZ7, 多个标识符用|连接

4. column4

第四列记录的信息为Alternative identifier for interactor B,和第三列类似,用来记录蛋白B的其他标识符

5. column5

第五列记录的信息为Aliases for A, 代表其他数据库中的名字,格式为databaseName:name(alias type), 比如对应的基因名称uniprotkb:HBZ(gene name), 多个别名用|连接

6. column6

第六列记录的信息为Aliases for B, 和第五列类似,用来记录蛋白B的别名

7. column7

第七列记录的信息为Interaction detection methods,代表蛋白相互作用检测的方法,格式为databaseName:identifier(methodName),比如psi-mi:”MI:0096”(pull down)

8. column8

第八列记录的信息为First author,代表记录该蛋白相互作用的文献的第一作者

9. column9

第九列记录的信息为Identifier of the publication,代表对应文献的标识符,比如pubmed:22458338

10. column10

第十列记录的信息为NCBI Taxonomy identifier for interactor A, 代表蛋白A对应物种的tax id,比如human为taxid:9606(human)|taxid:9606(Homo sapiens)

11. column11

第十一列记录的信息为NCBI Taxonomy identifier for interactor B,和第十列类似,用来记录蛋白B对应的物种

12. column12

第十二列记录的信息为Interaction types,代表相互作用的类型,格式为dataBaseName:identifier(interactionType),比如psi-mi:"MI:0915"(physical association)

13. column13

第十三列记录的信息为Source databases,代表该相互作用来源的数据库,比如psi-mi:"MI:0471"(MINT)

14. column14

第十四列记录的信息为Interaction identifiers,代表相互作用的标识符,比如在intac数据库中的标识符intact:EBI-7355797, 在MINT数据库中的标识符mint:MINT-68665, 多个数据库中的标识符用|连接。

15. column15

第十五列记录的信息为Confidence score,代表相互作用结果的打分值,比如intact-miscore:0.52, 不同的实验证据其强度不同,通过打分值来衡量相互作用的可靠程度

除此之外,该文件中还可以包含很多其他列的信息,具体的解释可以参考以下链接

https://psicquic.github.io/MITAB28Format.html

蛋白质相互作用的研究是非常重要的,所以关于蛋白质相互作用的信息如何表示和存储,专门有团队研究和制订了特定的文件格式,并且规定了各种鉴定方法和相互作用类型对应的专有名词,详细信息见如下链接

https://www.ebi.ac.uk/ols/ontologies/mi

·end·

—如果喜欢,快分享给你的朋友们吧—

本文分享自微信公众号 - 生信修炼手册(shengxinxiulian),作者:lzyg

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-10-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • HLA Dictionary-Allel和抗原之间的对应关系

    HLA Dictionary , 中文名叫做HLA 字典,记录了HLA-A, -B, -C, -DRB1/3/4/5 和 -DQB1 等HLA基因的不同Alle...

    生信修炼手册
  • 今天我们来聊一聊孟德尔随机化

    在传统的实验设计中,由于种种混杂因素的存在,我们仅仅能够分析变量之间的关联性,最典型的比如GWAS, 对于显著的位点,只能够说明这些位点和性状之间存在关联。对于...

    生信修炼手册
  • 使用biopython查询NCBI数据库

    NCBI网站是最常用的生物信息数据库之一,集成了pubmed,genebank等子数据库。最简便的用法当然是直接在网站上检索,为了方便检索,NCBI提供了自己的...

    生信修炼手册
  • 深入了解SQLMAP API

    以前觉得sqlmap自己玩得挺溜了,结果最近有一个任务,需要调用sqlmap api接口来验证存在sql注入漏洞的站点,一开始听到这个任务觉得完了,可能完成不了...

    FB客服
  • TAF 必修课(三):Server 启动全过程

    本节对 Taf-server整个启动流程进行解析,思考多协议支持,开发运营一体化。

    serena
  • 职场逆袭!腾讯云数据库TDSQL培训认证第二期报名通知

    腾讯云数据库学堂自上月起,已经正式开放培训认证对外招生,本月我们将继续提供TDSQL的培训,也就是说,现在无论你是在职人员还是高校学生,只要对腾讯云数据库TD...

    腾讯云数据库 TencentDB
  • docker-6:mac使用docker部署开发用grafana和prometheus

    /Users/hepengyuan/Documents/docker-local/docker-local-prometheus/etc

    千里行走
  • 最新版Prometheus+Grafana+node-exporter炫酷界面

    https://www.cnblogs.com/xiao987334176/p/9930517.html

    py3study
  • [记录点滴] 一个解决Lua 随机数生成问题的办法

    原因是LUA的random只是封装了C的rand函数,使得random函数有一定的缺陷,

    罗西的思考
  • LN 10.4升级过程中的几点注意事情及心得

    年初的时候刚升级了10.3,这个月又开始了10.4的升级,目前还在准备工作还在进行中,但是有些东西不得不记录下来。

    崔文远TroyCui

扫码关注云+社区

领取腾讯云代金券