2021年3月,由深圳国家基因库等多家单位参与制定的地球生物基因组计划(Earth BioGenome Project, EBP)信息技术与信息学标准(VERSION 1.0)正式发布,国家基因库序列归档系统(CNSA)成为EBP的推荐存储库。
EBP信息技术与信息学标准(VERSION 1.0)正式发布
协调遗传数据和相关元数据的收集、整合、标准化、分析、存档和共享是EBP的核心任务。EBP的目标是通过与世界各地不同的研究机构或团体合作,对所有已知物种的基因组进行系统的测序和分析。
为了让EBP项目成员在符合《生物多样性公约》及其《名古屋议定书》和相关国际协议/法规的前提下促进合作和数据共享,EBP项目信息技术与信息学委员会需要针对样本信息搜集、数据分析过程、数据输出访问等环节,确定支持数据和元数据处理的最低要求、标准操作程序(SOP)、操作建议和基础设施要求。
EBP信息技术与信息学标准(VERSION 1.0)的发布将有助于EBP及其成员对EBP项目收集的基因组及其元数据进行背景分析和再利用。通过遵循这一标准,信息技术与信息学委员会还希望开发一个涵盖基础设施、生产系统、档案库和分析流程的模型和平台,以更有效地管理EBP的总体进度和数据,遵守不同国家和政治实体的数据共享法律法规,促进数据的共享、挖掘和应用。
CNSA成为EBP的推荐存储库
EBP涉及与目标基因组数据相关的多种元数据。EBP信息技术与信息学标准(VERSION 1.0)明确了项目每个阶段需要存储的数据类型及推荐的存储库。提交到存储库的数据和元数据会生成用于公共引用的永久标识符(如登录号等)。
国家基因库序列归档系统(CNSA)成为EBP的推荐存储库,为DNA和RNA高通量测序数据、组装数据、变异数据、样本元数据、项目数据提供存储服务。
截至2021年3月4日,CNSA已支持论文发表228篇,发表期刊127个,包括The Lancet、Nature、Science、Cell等。👉 CNGBdb科研支撑成果汇【更新至20210304】
后续EBP信息技术与信息学标准将持续更新,敬请关注。
部分信息来源于“BGI华大”公众号,部分图片来源于EBP官网。