Pfam is a large collection of protein families, represented by multiple sequence alignments and hidden Markov models (HMMs)
Pfam数据库是一系列蛋白质家族的集合,其中每一个蛋白家族都以多序列比对和隐马尔科夫模型的形式来表示。
打开网站,在左上角搜索要查询的目的蛋白的名称(类别),比如真菌转录因子(fungal transcription factor)
可以看到如下界面:
我们重点关注Zinc相关的转录因子
点击Accession,可以看到
点击
点击sequence,在下方点 generate下载stockholm格式的seed文件
seed文件相当于一个种子,通过种子可以在蛋白质数据库中找到对应的蛋白。
用notepad++打开seed文件,可以看到其数据结构,具体含义参加stockholm文件说明。
通过肉眼比对,我们可以看到6个非常保守的半胱氨酸残基
通过HMM(隐形马尔科夫模型)的作图软件,可以绘制相应的图片,直观地展示序列特征
可以清楚地看到6个非常保守的半胱氨酸残基
在线作图网址:http://skylign.org/#showcase
领取专属 10元无门槛券
私享最新 技术干货