前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >KEGG Genome 数据库

KEGG Genome 数据库

作者头像
生信修炼手册
发布2020-05-09 16:54:15
8820
发布2020-05-09 16:54:15
举报
文章被收录于专栏:生信修炼手册

kegg Genome 由organisms,selected viruses 和 Metagenomes 3个数据库构成。

kegg Organisms 数据库收录了有完整基因组序列的物种信息,对于每个物种,有两种表示方法:

  1. 三个字母或者四个字母的物种代码, 叫做org code, 比如human对应的org code 为hsa, mouse对应的org code为mmu
  2. T Number, 对于organisms 中的所有物种来说,开头都是T0, 比如 human 对应的T Number 为T01001;

human为例,链接为

http://www.kegg.jp/kegg-bin/show_organism?org=hsa

organisms 数据库记录了如下的信息:

除了 T number 和 Org code 等基本信息外,还包括了taxonomy 等其他信息。在这些详细信息中,Data source 代表基因组序列的来源数据库,通常是 Refseq 或者 Genebank; Original DB 是物种特异性的其他数据库,点击蓝色的字可以跳转到对应的数据库中去。其实这就是综合性数据库的价值,你只需要在综合性数据库中浏览,就可以知道这个物种相关的数据库有哪些,而且可以很方便的跳转到感兴趣的数据库中。

selected viruses 数据库收录了与人类或者植物病理性相关的病毒信息,对于不同的病毒,用T Number 进行区分。所有的病毒的T Number 都是以 T4 开头的,比如T40218

http://www.kegg.jp/dbget-bin/www_bget?gn:T40218

viruses 数据库中还会提供病毒的宿主,相关疾病等详细信息。

Metagenomes 数据库收录了一些环境微生物的相关信息,主要包括口腔,肠道,空气,皮肤, 泌尿生殖系统5大,大部分是口腔和肠道微生物。对于环境微生物,每个物种的T number 都是 T3 开头。

kegg官网提供的Genome 数据库的构成示意图如下:

对于organisms 数据库中的物种,kegg 提供了一个简单的taxonomy 分类体系,和 NCBI 的taxonomy 数据库还是有区别的。

总结

  1. kegg genome 数据库存储物种信息,由organisms , viruses, metagenomes 三个数据库构成。
  2. 每个物种用T Number 唯一标识,organisms 中的物种都以T0 开头, viruses 中的物种以 T4 开头,metagenomes 中的物种以 T4 开头。
  3. kegg有一套较为简单的物种分类体系,叫做kegg taxonomy, 和 ncbi taxonomy 还是有区别的。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-03-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 总结
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档