前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Pfam:蛋白质家族数据库简介

Pfam:蛋白质家族数据库简介

作者头像
生信修炼手册
发布2020-05-08 16:33:51
5.7K0
发布2020-05-08 16:33:51
举报
文章被收录于专栏:生信修炼手册生信修炼手册

欢迎关注”生信修炼手册”!

在蛋白质分子中,包含多个结构特异并且功能区里的区域,这些区域称之为domain, domain 可以看做蛋白质功能的基本单位,蛋白质的功能由包含的多个domain共同决定。研究domain, 可以更好的研究蛋白质功能。

Pfam是蛋白质家族的数据库,根据多序列比对结果和隐马尔可夫模型,将蛋白质分为不同的家族。网址如下

http://pfam.xfam.org/

在该数据库中,提供了以下2个不同层级蛋白质家族信息。

1. family

每个family以PF编号唯一标识,示意如下

所有的family可以分为以下6种类型

  1. Family A collection of related protein regions
  2. Domain A structural unit
  3. Repeat A short unit which is unstable in isolation but forms a stable structure when multiple copies are present
  4. Motifs A short unit found outside globular domains
  5. Coiled-Coil Regions that predominantly contain coiled-coil motifs, regions that typically contain alpha-helices that are coiled together in bundles of 2-7.
  6. Disordered Regions that are conserved, yet are either shown or predicted to contain bias sequence composition and/or are intrinsically disordered (non-globular).
2. clan

对多个family进行相似性分析,将具有相似的三维结构或者相同motif的family归为一个clan, 可以看做是superfamily的概念,每个clan以CL编号标识,示意如下

除此以外,还提供了物种的蛋白质组信息,就是该物种内所有的蛋白质family 信息,示意如下

以human为例,其蛋白质组的信息如下

其实就是该物种的所有蛋白质对应的Pfam的集合。

该数据库最新版本为31.0, 于2017年3月更新,包含16712个蛋白质家族信息。ftp地址如下

ftp://ftp.ebi.ac.uk/pub/databases/Pfam/releases/Pfam31.0/

后缀为hmm的文件是由HMMER3构建的隐马可夫模型,可用于序列比对。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-08-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. family
  • 2. clan
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档