首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pfam数据库基础

Pfam is a large collection of protein families, represented by multiple sequence alignments and hidden Markov models (HMMs)

Pfam数据库是一系列蛋白质家族的集合,其中每一个蛋白家族都以多序列比对和隐马尔科夫模型的形式来表示。

打开网站,在左上角搜索要查询的目的蛋白的名称(类别),比如真菌转录因子(fungal transcription factor)

可以看到如下界面:

我们重点关注Zinc相关的转录因子

点击Accession,可以看到

点击

点击sequence,在下方点 generate下载stockholm格式的seed文件

seed文件相当于一个种子,通过种子可以在蛋白质数据库中找到对应的蛋白。

用notepad++打开seed文件,可以看到其数据结构,具体含义参加stockholm文件说明。

通过肉眼比对,我们可以看到6个非常保守的半胱氨酸残基

通过HMM(隐形马尔科夫模型)的作图软件,可以绘制相应的图片,直观地展示序列特征

可以清楚地看到6个非常保守的半胱氨酸残基

在线作图网址:http://skylign.org/#showcase

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180105G0XGDE00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券