前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >转录调控必知数据库:ENCODE

转录调控必知数据库:ENCODE

作者头像
医学数据库百科
发布2020-10-27 16:42:58
4.5K0
发布2020-10-27 16:42:58
举报

之前我们在介绍很多转录调控相关的数据库的时候,都会提到这些数据库包含了ENCODE数据库。那么ENCODE数据库是什么样的数据库呢?

ENCODE

(Encyclopedia of DNA Elements, https://www.encodeproject.org/),翻译成中文就是DNA元素百科全书,其主要目的是为了了解这个基因组当中的调控反应,主要方法还是利用高通量的测序技术来进行分析的。

按照上图的展示,目前的ENCODE通过多种测序数据来反应基因组变化的过程,分别是通过

  • Hi-C 来观察三维基因组
  • ATAC-seq/chip-seq 研究基因的转录调控
  • 甲基化芯片来研究甲基化的调控作用
  • RNA-seq 来研究基因表达的变化
  • RIP-seq 研究在转录后调控的信息

我们可以通过ENCODE数据库来检索自己想要的数据。类似很多转录调控数据库也是在ENCODE数据库获得目标原始数据后,进行分析后构建的自己数据库。

数据统计

目前ENCODE数据不止是包括人的数据,现在包含了四种物种的数据,主要含有: 人、老鼠、蠕虫、苍蝇这四个物种。

我们可以点击相关的数据类型,就可以得到ENCODE数据的这个类型的所有数据了。例如我们点击: DNA binding即可看到数据库的所有数据。

数据检索

同样的,我们可以基于自己的目的来检索想要的数据。

这里我们检索: CTCF。就可以看到和CTCF相关的数据集了。其中前四个是不同物种chip-seq的数据。

我们可以选择 CTCF(Homo sapiens),就可以看到具体的在人的物种当中所有和CTCF有关的数据集了。这里会显示不同的组织的数据,我们可以选择想要查看的组织类型进行查看。

具体数据集介绍

对于不同的检索方式,我们都能到具体数据集内容介绍里面。对于数据介绍基本格式基因相同,这里我们就用:ENCSR331OGX这个CTCF相关的chip-seq数据来简单介绍一下。

  1. 数据汇总信息。这里我们能看到数据集基本信息,包括患者基本信息。对于ENCODE的数据,都会放到GEO里面,所以我们在GEO里面其实也是可以检索到ENCODE的数据的。
  1. 具体的数据文件。这里我们可以看到数据的所有原始数据,包括测序数据的fastq数据以及基于ENCODE分析流程分析的所有bam文件和peak文件。

对于数据的peak文件,可以通过基因浏览器来进行查看。我们之前介绍过一个好看的基因浏览器。ENCODE默认的是UCSC的基因浏览器,可以点击 Visualize来进行查看。

  1. 数据处理流程:ENCODE提供了关于数据的标准处理流程,如果要使用他们的数据结果的时候,可以知道是怎么处理的;同时如果我们有自己的数据的话,不知道怎么处理,也可以参考这个数据处理流程的。

数据库总结

关于ENCODE基本介绍就是这些的。这个数据库主要还是一个偏向于原始数据储存的数据库。我们如果需要进行原始数据分析的话,可以从这个下载数据。但是如果是想要直接检索转录调控的结果的话,可以使用一些基于ENCODE数据分析完的数据库例如:我们之前介绍的Chea3[数据库推荐]多基因转录因子调控网络预测或者Cistrome等只要提到ENCODE数据的这些转录因子调控数据库。

建议还是如果要进行课题设计,可以使用那些对ENCODE加工的数据库好一些,这样只需要检索就可以获得结果。如果想要自定义的分析,那还是下载原始数据好一些,不过这个对于分析能力的要求就要高一些了。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-10-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据库百科 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档