首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

大数据中心在国际核酸研究期刊同期发表七篇研究成果

刚刚过去的10月,北京基因组所生命与健康大数据中心(BIG Data Center,BIGD)有七篇数据库文章陆续被国际学术期刊核酸研究Nucleic Acids Research (NAR)杂志接收,这七篇研究成果将在该刊2019年1月的数据库专刊中集中刊发。去年NAR连登四篇大数据中心研究成果已属突破性研究进展,今年BIGD再创辉煌,有六篇针对不同研究领域的特色专业数据库文章和一篇介绍大数据中心整体资源建设进展的文章集中发表。

自2016年以来,这已经是第三年NAR以国际数据中心的模式来介绍BIGD资源和成果。在2018年1月份发布的数据库专刊简介《The 2018 Nucleic Acids Research database issue and the online molecular biology database collection》的开篇部分,NAR就已经将BIGD与美国NCBI、欧洲EBI一起作为国际数据中心进行了介绍,表明BIGD已跻身全球知名生物大数据中心行列。

今年BIGD再次发布整体建设成果与进展(Database Resources of the BIG Data Center in 2019)。全文介绍了BIGD的核心数据资源,包括数据(Data)、信息(Information)、知识库(Knowledge)三大部分;2018年开发的新数据库资源和以往数据资源的整合及完善。文章最后还介绍了BIGD的数据提交系统BIG Submission,用户访问控制系统BIG SSO,对于不同资源提供的大量索引数据执行查询和搜索服务的BIG Search,目前BIG Search已整合了PlantTFDB、LncRNADisease、DEG、lncRNASNP等20个来自不同合作单位的数据库资源。

为了促进生物大数据有效利用与转化,我们针对一些重要的研究领域,如长非编码RNA(lncRNA)、表观遗传甲基化、RNA编辑、核小体定位等进行了专门的数据分析与知识审编。下面我们就介绍一下BIGD今年在核酸研究发表的六篇针对不同研究领域的专业数据库文章。

1

表观组关联分析知识库EWAS Atlas

EWAS Atlas是一个完全基于人工审编和文献挖掘的知识库。当前版本的EWAS Atlas主要关注DNA甲基化这一重要的表观修饰。EWAS Atlas一共整合了401篇文献中649个研究报道的329,172个高质量甲基化与表型关联。这些关联一共涉及到305种表型,1,830个队列以及390种表型本体。此外,EWAS Atlas还配备了功能强大的表型富集工具,用于研究表型与表型,表型与表观变异的关系。该项研究成果以“EWAS Atlas: a curated knowledgebase of epigenome-wide association studies”为题在线发表。

2

犬类数据库iDog

iDog是家犬(Canis lupus familiaris)和野生犬的综合资源库,数据来源于Dog 10K Genomes Project,旨在为犬类生物学研究提供各种数据服务。包括基因、基因组、SNP、品种/疾病特征、基因表达、GO功能注释及狗-人类同源疾病和相关文献。此外,iDog还提供用于执行基因组数据可视化和分析的在线工具。该项研究成果以“iDog: an integrated resource for domestic dogs and wild canids”为题在线发表。

3

RNA编辑与疾病相关知识库EDK

EDK是基于文献挖掘的RNA编辑与疾病关联关系的知识库,整合了与人类疾病相关的异常RNA编辑和RNA编辑酶活性异常事件。目前,通过人工审编200多篇相关文献,EDK整合了248个实验验证的异常RNA编辑相关的61种疾病,这些异常RNA编辑涉及32个mRNA、16个microRNA、1个长非编码RNA(lncRNA)、11个病毒。此外,编辑酶的活性异常与疾病的产生也密切相关。6种RNA编辑酶的活性异常共与44个疾病事件相关。该项研究成果以“Editome Disease Knowledgebase (EDK): a curated knowledgebase of editome-disease associations in human”为题在线发表。

4

植物RNA编辑数据库PED

PED是一个植物RNA editosome数据库,旨在对植物RNA编辑信息进行全面的审编、整合及标准化。基于文献审编和细胞器基因组注释,PED收录了8个模式植物的98个RNA编辑因子和1,621种植物中的20,836个RNA编辑事件。其中,RNA编辑事件分布在203个细胞器基因上,涵盖了1,673个植物细胞器。此外,PED还整理了RNA编辑因子和RNA编辑事件之间的相互作用,RNA编辑因子对植物表型的影响以及详细的实验证据等信息。该项研究成果以“Plant editosome database: a curated database of RNA editosome in plants”为题在线发表。

5

人类长非编码RNA数据库LncBook

LncBook提供了目前为止数据量最大的人类lncRNA数据集。目前版本共收录270,044个lncRNA,包括从现有数据库整合的247,246个lncRNA,基于RNA-seq数据鉴定的21,815个新的lncRNA,以及1,867个已有文献报道的lncRNA。LncBook对这些lncRNA进行了表达、甲基化(DNA Methylation)、变异(SNP)、相互作用(miRNA-lncRNA)的注释与分析,针对已报道的1867个lncRNA进行了系统的疾病与功能注释。通过LncBook,用户不仅能查询lncRNA基本序列注释信息、疾病及功能信息,而且能获得lncRNA的多组学信息分析结果,还可以使用多种在线工具进行分类、比对、鉴定等分析。该项研究成果以“LncBook: a curated knowledgebase of human long non-coding RNAs”为题在线发表。

6

多物种全基因组核小体定位图谱数据库NucMap

NucMap是基于大规模数据整合分析的多物种全基因组核小体定位图谱数据库。该数据库识别多物种不同条件下的核小体定位图谱,并提供相关的RNA-seq、DNA甲基化、组蛋白修饰、转录因子 ChIP-seq数据信息。目前版本整合了从酵母到人类的15个物种的477个样本的798个全基因组核小体测序数据,包含搜索、浏览、分析和下载等主要功能模块。该项研究成果以“NucMap: a database of genome-wide nucleosome positioning map across species”为题在线发表。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181106G165BP00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券