说到本体论,生信的同学估计第一个想到的就是基因本体论 ( Gene Ontology, GO ) 了,而基因本体论其实也是开放生物医学系统注释(Open Biomedical Ontologies (OBO))下的一个分类项目。今天来说另外一个生物科学数据分析和数据管理本体论——EDAM - Bioscientific data analysis ontology。
关于本体论,本体论与生物医学的一些背景知识可以参考隔壁老湿在简书的《学习笔记:本体论与生物医学》一文, 这里主要聊一下 EDAM - Bioscientific data analysis ontology。
EDAM 是生物医学领域研究 GO 以外的又一个例子,个人最开始是从 Galaxy Project 了解得到,EDAM 在 Galaxy 项目中主要用于解决海量生物医学工具在 Galaxy 平台面板中分类不统一,用户难以查找的难题而被纳入使用。最早在 Galaxy Release 21.09 版本中上线(参考:《Galaxy Release (v 21.09),新的工具面板视图 - 语雀》)。
Galaxy Project - Replace tool panel sections with EDAM
EDAM - Ontology of bioscientific data analysis and data management,是一个全面的本体论,包含了在生物科学数据分析和数据管理(包括计算生物学、生物信息学和生物图像信息学)中广泛存在的既定的、熟悉的概念。EDAM 包括与生命科学中的数据分析和数据管理相关的主题(topics)、操作(operations)、数据类型(types of data)和数据标识符(data identifiers)以及数据格式(data formats)。EDAM 提供了一组包含首选术语和同义词、相关术语、定义和其他信息的概念,组织成一个简单直观的层次结构,以方便使用(见下图)。
EDAM 目前包含了一下几个子项目,Galaxy Project 的工具面板正好是使用了 Bio.Tools 这一本体库。
Bio.Tools 是一个致力于提供软件和数据库的全面登记册,以便来自生物和生物医学科学领域的研究人员寻找、理解、利用和引用他们日常工作所需的资源(software and databases)的服务。 Everything from simple command-line tools and online services, through to databases and complex, multi-functional analysis workflows is included. Resources are described in a rigorous semantics and syntax, providing end-users with the convenience of concise, consistent and therefore comparable information.
Each bio.tools entry is assigned a human-readable, unique identifier based on the resource name, e.g. biotools:signalp. These identifiers provide a persistent reference to our "Tool Cards" of essential information, as well as a means to trace resources and integrate bio.tools data with other resources.
每个 bio.tools 条目都会根据资源名称分配一个人类可读的唯一标识符,例如 biotools: signalp(或者 biotools: ssamtools)。这些标识符提供了对基本信息的“工具卡”的持久引用,以及跟踪资源并将 bio.tools 数据与其他资源集成的手段。
All the bio.tools data and technical components are available under open license and we warmly welcome you to get involved.
所有的生物工具数据和技术组件都是开放许可的,此外,Bio.Tools 是由 ELIXIR 通过 ELIXIR-exgelerate 补助金支持的,该补助金由欧盟的 European Union Horizon 2020 项目根据补助金协议 676559 资助。
简单总结一下,目前对 DEAM 了解不多,Bio.Tools 也只还在探索中,但个人的感觉这其实就是一个生物医学软件与数据库的标准化数据库,把那些杂乱无章的软件统计分类管理,结构化也好层次化也好,最起码能一定程度降低对海量软件和数据库的搜索成本,可以有助于更容易地找到所需的工具。