专栏首页生信修炼手册KEGG Genome 数据库

KEGG Genome 数据库

kegg Genome 由organisms,selected viruses 和 Metagenomes 3个数据库构成。

kegg Organisms 数据库收录了有完整基因组序列的物种信息,对于每个物种,有两种表示方法:

  1. 三个字母或者四个字母的物种代码, 叫做org code, 比如human对应的org code 为hsa, mouse对应的org code为mmu
  2. T Number, 对于organisms 中的所有物种来说,开头都是T0, 比如 human 对应的T Number 为T01001;

human为例,链接为

http://www.kegg.jp/kegg-bin/show_organism?org=hsa

organisms 数据库记录了如下的信息:

除了 T number 和 Org code 等基本信息外,还包括了taxonomy 等其他信息。在这些详细信息中,Data source 代表基因组序列的来源数据库,通常是 Refseq 或者 Genebank; Original DB 是物种特异性的其他数据库,点击蓝色的字可以跳转到对应的数据库中去。其实这就是综合性数据库的价值,你只需要在综合性数据库中浏览,就可以知道这个物种相关的数据库有哪些,而且可以很方便的跳转到感兴趣的数据库中。

selected viruses 数据库收录了与人类或者植物病理性相关的病毒信息,对于不同的病毒,用T Number 进行区分。所有的病毒的T Number 都是以 T4 开头的,比如T40218

http://www.kegg.jp/dbget-bin/www_bget?gn:T40218

viruses 数据库中还会提供病毒的宿主,相关疾病等详细信息。

Metagenomes 数据库收录了一些环境微生物的相关信息,主要包括口腔,肠道,空气,皮肤, 泌尿生殖系统5大,大部分是口腔和肠道微生物。对于环境微生物,每个物种的T number 都是 T3 开头。

kegg官网提供的Genome 数据库的构成示意图如下:

对于organisms 数据库中的物种,kegg 提供了一个简单的taxonomy 分类体系,和 NCBI 的taxonomy 数据库还是有区别的。

总结

  1. kegg genome 数据库存储物种信息,由organisms , viruses, metagenomes 三个数据库构成。
  2. 每个物种用T Number 唯一标识,organisms 中的物种都以T0 开头, viruses 中的物种以 T4 开头,metagenomes 中的物种以 T4 开头。
  3. kegg有一套较为简单的物种分类体系,叫做kegg taxonomy, 和 ncbi taxonomy 还是有区别的。

本文分享自微信公众号 - 生信修炼手册(shengxinxiulian),作者:庐州月光

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-03-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • DGV:人类基因组结构变异数据库

    DGV数据库收录了健康样本中大于50bp以上的基因组结构变化信息,对应的文章发表在Nucleic Acids Research上,链接如下

    生信修炼手册
  • 什么是SNP遗传力?

    heritability,翻译为遗传力, 用来描述表型变异中遗传变异的比例。众所周知,表型(P)由基因型(G)和环境因素(E)共同控制, 即

    生信修炼手册
  • CNVD:疾病相关的CNV数据库

    CNV作为一种重要的基因组结构变异形式,与很多疾病的发生发展密切相关,疾病相关CNV的文献报导很多,但是缺少一个综合性的数据库。

    生信修炼手册
  • NDBC | 腾讯TDSQL提出三个“数据库之问”,数据库技术未来重点在哪?

    李海翔,网名“那海蓝蓝”,腾讯金融云数据库技术专家。中国人民大学信息学院工程硕士企业导师。著有《数据库事务处理的艺术:事务管理和并发访问控制》、《数据库查询优化...

    分布式数据库TDSQL
  • 腾讯TDSQL提出三个“数据库之问”,数据库技术未来重点在哪?

    ? 李海翔,网名“那海蓝蓝”,腾讯金融云数据库技术专家。中国人民大学信息学院工程硕士企业导师。著有《数据库事务处理的艺术:事务管理和并发访问控制》、《数据库查...

    腾讯技术工程官方号
  • 腾讯对分布式数据库技术的深度思考与实践

    作者:李海翔,网名“那海蓝蓝”,腾讯金融云数据库技术专家。中国人民大学信息学院工程硕士企业导师。著有《数据库事务处理的艺术:事务管理和并发访问控制》、《数据库...

    腾讯云数据库 TencentDB
  • 分库分表 vs NewSQL数据库 顶

    最近与同行科技交流,经常被问到分库分表与分布式数据库如何选择,网上也有很多关于中间件+传统关系数据库(分库分表)与NewSQL分布式数据库的文章,但有些观点与判...

    算法之名
  • (转)mysql数据库中存储数字字段时,选择int和varchar的区别

    Dar_Alpha
  • MySQL见闻录 -- 入门之旅(一)

    相比于5代版本,这款跨越6、7代版本的8代版本有许多的好评,当然我也没体验过5代版本,反正要用就用最新的嘛。

    看、未来
  • 每日一题C++版(数字取整)

    编程是很多偏计算机、人工智能领域必须掌握的一项技能,此编程能力在学习和工作中起着重要的作用。因此小白决定开辟一个新的板块“每日一题”,通过每天一道编程题目来强化...

    小白学视觉

扫码关注云+社区

领取腾讯云代金券