kegg compound 数据库存储了在生命活动中发挥作用的各种小分子,生物大分子和其他类型的化学物质,采用C number 进行标识,比如, 代表L-赖氨酸。除了名称等信息外,还存储了该物质的化学结构和其他相关信息;
对于所有compound 的分类详见 Brite 数据库
http://www.genome.jp/kegg-bin/get_htext?br08001.keg
包括有机酸, 脂类, 碳水化合物, 核酸,肽链,维生素和辅助因子,类固醇,激素和递质,抗生素共9大类别;
看下每条记录的详细信息,以甲酸为例
http://www.genome.jp/dbget-bin/www_bget?cpd:C00058
上面的信息可以分成两大类:
1.基本信息
2.与其他数据库的链接
Reaction 数据库存储的是各种compound 之间的反应,所以会有Reaction的链接,比如
Pathway 数据库整合了ko, module, reaction, compound 等多个数据库库的信息,所以也会给出compound 参与的通路,在通路中,对应的compound 会高亮显示, 如下图中红色标记的圆形。
Module 是ko的集合,但是ko只是基因集,真正参与生命活动的是这些基因的产物,在产物发挥作用的时候,也需要compound 的参与,所有会给出compound 相关的module。
Enzyme 数据库保存各种酶的相关信息,酶作为催化剂调控一些生物学过程的发生和进行,在这个过程中肯定也会有compound 的参与;比如1.1.1.306 这种酶催化的反应中, 供体提供甲酸才能进行反应,所以会给出compound 对应的Enzyme 编号;
总结
compound 数据库存储了参与生命活动的各种分子的信息,数据库中的记录用C Number唯一标识, 每条分子都有对应的化学式,结构式,分子量等基本信息;
compound 和reaction , module, pathway, enzeme 等多个数据库都有联系;
领取专属 10元无门槛券
私享最新 技术干货