前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >KEGG Brite 数据库

KEGG Brite 数据库

作者头像
生信修炼手册
发布2020-05-09 16:51:36
9900
发布2020-05-09 16:51:36
举报

KEGG被称为京都基因组百科全书,是一个综合性的数据库。对于如此庞大的数据库,肯定需要对数据进行分门别类的整理。除了将各种数据拆分到不同的子数据库中之外,KEGG还对所有的数据进行了更加细致的功能分类,这些功能分类的信息就存储在brite 数据库中。

birte 主要包含以下五大类别的分类信息:

  1. genes and protein
  2. compounds and reactions
  3. drugs
  4. diseases
  5. organisms and cells

在brite数据库中,以文件的形式存储分类信息。包含两种格式的文件:

  • table 格式,比如对药物的分类 http://www.genome.jp/kegg/drug/br08340.html
  • htext 文件,比如kegg orthology 的分类 http://www.kegg.jp/kegg-bin/get_htext?ko00000.keg

提供了两种格式的文件用于下载,htext 对应的后缀为 keg, json 对应json。

json 格式是网络数据传说的新标准,主要用于程序解析;`keg 文件是纯文本文件,可以用文本编辑器打开。

以所有ko的分类文件 ko00000.keg 文件为例:

分类层级按照字母顺序排列,示例文件中A 为第一级分类,B, C, D 依次为第二级。

我们可以直观的看到 K00844 属于Glycolysis / Gluconeogenesis 这个分类,对应的更上一级的分类为Carbohydrate metabolism,再上一级为 Metabolism

keg 文件格式还是非常容易理解的,但是使用起来不够直观,当我们想要查询某个KO的具体分类时,如果和这个KO处于同一分类的节点太多时,需要往上翻阅很多行,才能找到对应的分类;有时一不小心就翻过了,就会搞错。

当然可以通过程序格式化这个文件,比如将这个文件变成如下的格式:

KO

Name

C

B

A

K00844

HK…

Glycolysis…

Carbo..bolism

Metabolism

这样方便查看条目的详细分类信息;

对于没有编程基础的人来说,kegg 提供了keggHier 程序,专门用于查看brite中的分类信息。软件是用java 开发的,提供了图形界面,简单易用;

下载地址 :

http://www.kegg.jp/kegg/download/kegtools.html

使用方法

  • 双加批处理文件启动
  • 从菜单栏点击File按钮,选择导入kegg网站上的数据
  • 这里选择第一个kegg pathway map 的分类结构,进行查看

向下的三角形表示展开的意思,这里有3个,说明pathway 共有3层分类,鼠标可以点击任意一条记录,可以展开详细信息;

  • 右上角的搜索框可以搜索,通过搜索框可以快速查找你感兴趣的记录

总结:

  1. brite 是存储分类信息的数据库,提供了包含pathway, ko, module, drug, disease,organism 等所有记录的分类;
  2. 分类信息通过文件进行距离,有kegtable两种格式;
  3. 通过KEGGHier工具,可以方便的浏览 KEGG 分类系统;
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-02-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 总结:
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档