首页
学习
活动
专区
工具
TVP
发布

生信宝典

专栏作者
731
文章
1324350
阅读量
335
订阅数
国家生物信息中心开发DNA甲基化芯片数据标准化方法—GMQN
过去十年来,由于DNA甲基化芯片技术的不断发展以及测序成本的快速下降,DNA甲基化芯片数据呈现爆发式增长。这些数据是表观基因组关联研究(Epigenome-Wide Association Studies,EWAS,NAR| 表观组关联分析数据库 - EWAS Data Hub)的宝贵资源,为基于大规模整合分析的EWAS研究提供了数据支撑。然而,在整合公共DNA甲基化芯片数据时,不得不面对两个棘手的问题。首先,公共数据样本量大且增长速度快,必须要考虑大数据整合中的N+1问题。其次,大多数公共数据没有提供原始数据。因此,无法获取control探针和OOB (Out Of Band)探针的信息,而这两类探针的信息是目前绝大多数DNA甲基化芯片标准化方法必须的。
生信宝典
2022-01-19
3820
NAR| 表观组关联分析数据库 - EWAS Data Hub
近年来, 表观组关联分析(Epigenome-wide Association Study,EWAS)已成为探索复杂性状表观遗传基础的有效策略。随着大量EWAS科研成果的发表,现已积累了海量表观遗传数据,尤其是DNA甲基化芯片数据,其海量数据的整合分析对系统研究不同实验条件下的DNA甲基化状态以及探索与各种性状相关的表观遗传机制具有重要意义。目前,国际上存在一些数据库来存储DNA甲基化芯片数据,但这些数据库缺乏有效和统一的归一化方法来消除不同数据集之间的批次效应,可能对下游分析产生负面影响,元数据标准不统一,并且都不提供跨不同组织、性别、种族和疾病的标准化的DNA甲基化图谱。为了解决这些问题,国家中心开发了EWAS Data Hub数据库。
生信宝典
2019-11-07
1.2K0
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档