专栏首页生信修炼手册JASPAR:转录因子motif数据库

JASPAR:转录因子motif数据库

欢迎关注”生信修炼手册”!

JASPAR是一个免费公开的转录因子数据库,在该数据库中收录了转录因子的mitif信息,可以用来预测转录因子与序列的结合区域。网址如下

http://jaspar.genereg.net/

在该数据库中,提供了以下9种不同来源和类别的转录因子信息

1. JASPAR CORE

该类别下都是从文献中收集的,有实验证据支持的真核生物转录因子motif信息,而且经过了人工核对,是一个非冗余的,高质量的转录因子motif数据库,所以也是整个数据库中的核心。

由于其高质量量,非冗余等特性,通常情况下,该类别信息都是我们的第一选择。每个motif编号以MA开头,示意如下

2. Collection CNE

该数据集包含了233个调控人类非编码基因的转录因子motif信息,是根据Xie et al. (PNAS 2007)文章中的数据收集整理的,编号以CN开头,示意如下

3. Collection FAM

该类别下保存的是转录因子的类别class信息,多个转录因子可以拥有相同的调控序列,将调控序列相同的转录因子归为一类。每个class的编号以MF开头,示意如下

4. Collection PBM

该类别下是运用体外技术分析了104个小鼠的转录因子后得到的motif信息,每个motif编号以PB开头,示意如下

5. Collection PBM HLH

和PBM类似,只不过该类别下是 C. elegans bHLH的19个转录因子的信息,物种不同,该类别下的motif编号以PL开头,示意如下

6. Collection PBM HOMEO

该类别下包含的是小鼠的转录因子motif信息,是从文献Berger et al (Cell 2008)整理得到的,每个motif编号以PH开头,示意如下

7. Collection PHYLOFACTS

该类别下分析的是哺乳动物进化保守基因的转录因子motif信息,对应的文章为

Systematic discovery of regulatory motifs in human promoters and 3’ UTRs by comparison of several mammals

每个motif的编号以PF开头,示意如下

8. Collection POLII

该类别包含的是RNA聚合酶结合区域的motif序列,每个motfi编号以PL开头,示意如下

9. Collection SPLICE

该类别包含的是human剪切位点的motif序列,数据量很小,一共只有6个motif, 每个motif编号以SA开头,示意如下

每个collection都是一个小的子集,core 是整合了所有这些子集,从而构建的非冗余数据集。在core数据集中,将物种分层了一下6大类别

通过官网的检索功能,可以方便的进行检索,示意图如下

在检索出的motif详情页面,提供了许多信息,以MA0001.1为例

1. 基本信息

包括名字,编号,类别,对应的物种等信息,示意如下

motif每个bp上碱基的分布,碱基的大小与对应的频率成正比,频率越大,对应的字母越大,示意如下

3. position frequency matrix

简称PFM, motif每个bp上四种碱基的频数分布,提供了多种格式的下载,示意如下

4, Binding sites

红色标识的是motif对应的具体的序列,示意如下

该数据库提供了下载功能,主要是motif对应的PFM矩阵,示意如下

JASPAR数据库是免费的,但是相比TRANSFAC数据库, 还是有很多不足之处,首先就是motif数量的差异,比TRANSFAC数据库少了许多,其次就是信息的类别上,JASPAR只提供了motif信息,并没有直接的转录因子调控的靶标基因的信息。

通过JASPAR数据库,我们只能获取转录因子的motif信息,然后通过软件去预测和DNA序列的结合位点,即TFBS。

·end·

—如果喜欢,快分享给你的朋友们吧—

本文分享自微信公众号 - 生信修炼手册(shengxinxiulian),作者:lzyg

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-11-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • FactorBook:人和小鼠转录因子chip_seq数据库

    FactorBook整合了ENCODE数据库中人和小鼠的chip_seq数据,以转录因子为中心,进行了转录因子motif分析, 与其他转录因子或者组蛋白修饰的关...

    生信修炼手册
  • TRRUST:人和小鼠的转录因子调控网络数据库

    TRRUST数据库是一个记录转录因子调控关系的数据库,不仅包含转录因子对应的靶基因,也包含了转录因子间的调控关系。目前该数据库只存储了人和小鼠相关的调控信息,而...

    生信修炼手册
  • TFTG:human转录因子靶基因数据库

    研究转录因子调控的靶基因有两种常用的手段,第一种就是利用chip-seq等方式,研究特定转录因子在基因组的结合位置,从而判断其调控的基因,因为有实验证据的支持,...

    生信修炼手册
  • 利用peerjs轻松玩转webrtc

     随着5G技术的推广,可以预见在不久的将来网速将得到极大提升,实时音视频互动这类对网络传输质量要求较高的应用将是最直接的受益者。而且伴随着webrtc技术的成熟...

    菩提树下的杨过
  • 单细胞转录组高级分析二:转录调控网络分析

    组织内细胞异质性的基础是细胞转录状态的差异,转录状态的特异性又是由转录因子主导的基因调控网络(GRNs)决定并维持稳定的。因此分析单细胞的GRNs有助于深入挖掘...

    生信技能树jimmy
  • 使用MEME挖掘序列中的de novo motif

    对于de novo motif分析而言,我们只需要提供序列就可以了。由于peak的长度范围存在一定的波动,通常选取peak中心,即峰值两侧固定长度的序列用于下游...

    生信修炼手册
  • 写在Github被微软收购之际 - Github的那些另类用法

    这几天朋友圈被微软75亿美元收购Github的新闻刷屏了。Jerry也来贡献一篇和Github相关的文章。

    Jerry Wang
  • 做人需要低调,编码不能「自私」

    极端的人是可怕的,也许是你不经意间的傲慢行为,也许是你漫不经心怼人的话语,说不定就能呼唤起他们内心深处的小恶魔,毫无道理,也毫无预兆,你就有可能深受其害。

    Bug生活2048
  • MotifStack:多motif序列比较和可视化

    最近大量跑chip-seq,看到一篇2016Cell的文章《Cistrome and Epicistrome Features Shape the Regula...

    生信宝典
  • 为什么要选择腾讯云服务器?看完云服务器测评就知道了!

    腾讯云服务器,简称 CVM 是通过高性能服务器虚拟化的云服务器、拥有专业团队打造资源隔离、数据安全、密码安全、安全加固等多达 20 种安全防护手段。其实就是和阿...

    用户2416682

扫码关注云+社区

领取腾讯云代金券