学习
实践
活动
专区
工具
TVP
写文章

KEGG Genome 数据库

kegg Genome 由organisms,selected viruses 和 Metagenomes 3个数据库构成。

kegg Organisms 数据库收录了有完整基因组序列的物种信息,对于每个物种,有两种表示方法:

三个字母或者四个字母的物种代码, 叫做org code, 比如human对应的org code 为, mouse对应的org code为;

T Number, 对于organisms 中的所有物种来说,开头都是T0, 比如 human 对应的T Number 为T01001;

以为例,链接为

http://www.kegg.jp/kegg-bin/show_organism?org=hsa

organisms 数据库记录了如下的信息:

selected viruses 数据库收录了与人类或者植物病理性相关的病毒信息,对于不同的病毒,用T Number 进行区分。所有的病毒的T Number 都是以 T4 开头的,比如

http://www.kegg.jp/dbget-bin/www_bget?gn:T40218

viruses 数据库中还会提供病毒的宿主,相关疾病等详细信息。

Metagenomes 数据库收录了一些环境微生物的相关信息,主要包括口腔,肠道,空气,皮肤, 泌尿生殖系统5大,大部分是口腔和肠道微生物。对于环境微生物,每个物种的T number 都是 T3 开头。

kegg官网提供的Genome 数据库的构成示意图如下:

对于organisms 数据库中的物种,kegg 提供了一个简单的taxonomy 分类体系,和 NCBI 的taxonomy 数据库还是有区别的。

总结

数据库存储物种信息,由organisms , viruses, metagenomes 三个数据库构成。

每个物种用T Number 唯一标识,organisms 中的物种都以T0 开头, viruses 中的物种以 T4 开头,metagenomes 中的物种以 T4 开头。

kegg有一套较为简单的物种分类体系,叫做kegg taxonomy, 和 ncbi taxonomy 还是有区别的。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180307G1EN2J00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

同媒体快讯

关注

腾讯云开发者公众号
10元无门槛代金券
洞察腾讯核心技术
剖析业界实践案例
腾讯云开发者公众号二维码

扫码关注腾讯云开发者

领取腾讯云代金券