前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >详解motif的PFM矩阵

详解motif的PFM矩阵

作者头像
生信修炼手册
发布2019-12-19 15:45:24
1.6K0
发布2019-12-19 15:45:24
举报
文章被收录于专栏:生信修炼手册生信修炼手册

欢迎关注”生信修炼手册”!

在之前的文章中,对motif的几个基本概念进行了简单介绍。一致性序列采用IUPAC碱基表示标准来描述motif的序列信息,sequence logo是结合碱基分布频率和一致性序列的一种直观展示形式。本文对motif的碱基分布频率进行详细介绍。

PFM全称为position frequency matrix, 用于代表motif的碱基分布频数,本身是一个很容易了解的概念,以下图所示的motif序列为例

根据以上8条序列可以统计出对应的碱基分布频数,如下所示

每行为一种碱基,每一列为motif的一个位置。

在描述motif信息时,除了一致性序列和sequence logo外,PFM矩阵也是一个常见的元素。不同软件会有不同的标准,理解这些格式就是本文的核心内容。

JASPAR是一个常用的转录因子motif数据库,在该数据库中,针对PFM矩阵有多种格式,如下图所示

1. RAW PFM

原始的PFM矩阵示意如下

第一行和fasta格式的序列标识符类似,>开头,MA开头的字符串为转录因子在JASPAR数据库中的编号,是唯一的,AGL3表示该转录因子的名称。

接下来的4行依次表示A, C, G, T4种碱基在每个位置的频数分布。

2. JASPAR

JASPAR格式的PFM矩阵示意如下

和原始的PFM矩阵非常类似,只不过在每行的开头标注了对应的碱基,并且用[]操作符将碱基频数矩阵括起来。

3. TRANSFAC

TRANSFAC格式的PFM矩阵示意如下

采用了TRANSFAC数据库中的文件标准,AC表示motif编号,ID表示motif的名称,PO以及下面的行为对应的碱基分布频数。

4. MEME

MEME格式的PFM矩阵示意如下

ALPJABEAT代表碱基的字符集,strands代表链的方向性,+ - 代笔在使用meme预测motif时没有指定链的方向,Background代表背景中的碱基组成频率,MOTIF和以下的行为对应的碱基分布频率。

不同的软件和数据库对应的PFM矩阵的格式不同,在使用不同软件和数据库时需要注意。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-04-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. RAW PFM
  • 2. JASPAR
  • 3. TRANSFAC
  • 4. MEME
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档