前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >NAR| 表观组关联分析数据库 - EWAS Data Hub

NAR| 表观组关联分析数据库 - EWAS Data Hub

作者头像
生信宝典
发布2019-11-07 15:15:01
1.4K0
发布2019-11-07 15:15:01
举报
文章被收录于专栏:生信宝典

近年来, 表观组关联分析(Epigenome-wide Association Study,EWAS)已成为探索复杂性状表观遗传基础的有效策略。随着大量EWAS科研成果的发表,现已积累了海量表观遗传数据,尤其是DNA甲基化芯片数据,其海量数据的整合分析对系统研究不同实验条件下的DNA甲基化状态以及探索与各种性状相关的表观遗传机制具有重要意义。目前,国际上存在一些数据库来存储DNA甲基化芯片数据,但这些数据库缺乏有效和统一的归一化方法来消除不同数据集之间的批次效应,可能对下游分析产生负面影响,元数据标准不统一,并且都不提供跨不同组织、性别、种族和疾病的标准化的DNA甲基化图谱。为了解决这些问题,国家中心开发了EWAS Data Hub数据库。

近日,由中国科学院北京基因组研究所国家基因组科学数据中心(以下简称国家中心)开发的人类表观组关联分析数据库EWAS Data Hub正式上线。该项研究成果以“EWAS Data Hub: a resource of DNA methylation array data and metadata”为题在国际学术期刊《核酸研究》(Nucleic Acids Research)在线发表。(数据库链接:https://bigd.big.ac.cn/ewas/datahub/index)

目前,EWAS Data Hub整合了来自GEOTCGAArrayExpressENCODE数据库的共计75,344个样本的DNA甲基化芯片数据和对应的元数据,并采用了有效的归一化方法来消除不同数据集的批次效应。EWAS Data Hub利用海量高质量DNA甲基化数据和标准化元数据的优势,为485,512个探针和36,397个基因提供了一系列重要的评估值(包括组织特异性、年龄相关性、性别差异和种族特异性)和不同背景下的参考DNA甲基化图谱,涉及81种组织/细胞类型(包含25个脑部和25种血细胞类型),67种疾病(包括39种癌症),不同年龄、性别、种族和BMI。同时,EWAS Data Hub 还提供了高效的查询方式。

以探针“cg16867657”为例:

图A 该探针的基本信息,包括基因组位置、相关基因、与年龄性别等表型的相关性

图B展示了该探针在81种组织/细胞类型(包含25个脑部和25种血细胞类型)中的甲基化水平的分布;

图C展示了该探针在各组织中与年龄的相关性;

图D 该探针在6大种族中的甲基化水平;

图E 该探针在各肿瘤中的患者和健康样本的甲基化水平差异、生存分析曲线和甲基化和表达的关系散点图;

图F该探针在文献中的报道和与EWAS Atlas数据库的关联;

除了以上应用,EWAS Data Hub 提供了高效的查询方式:

  • 通过年龄,疾病等信息快速查询感兴趣样本的数据和元数据,并能打包下载。
  • 通过基因ID、探针号等信息浏览该探针/基因在不同背景下的参考DNA甲基化图谱。

构建数据库,你的数据也可以- 2篇NAR的数据库

论文链接

https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkz840/5580903

数据库链接

https://bigd.big.ac.cn/ewas/datahub/index

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-11-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信宝典 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 论文链接
  • 数据库链接
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档