首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

KEGG Orthology 数据库简介

我们经常会使用KEGG数据库来研究基因的功能,而在KEGG 数据库中,直接存储分子功能的就是KEGG Orthology 数据库。

KEGG Orthology 简称KO,该数据库中的每一条记录用K number 唯一标识。基于同源基因具有相似功能的假设,把基因的功能进行了扩充。对于某个物种中功能研究的很清楚的基因,在不同的物种间搜寻该基因的同源基因,将这些同源基因定义为一个orthology, 用该基因的功能作为该orthology 的功能;这样就将对于不同物种基因功能的研究都利用起来,提供了一个全面的研究基因功能的数据库。

pathway,module 等数据库都是建立在KO数据库的基础上的,KO可以说是KEGG中处于核心地位的一个数据库,所以理解KO数据库就特别的重要。

对于一个具体的KO来说,在这个KO下是一系列基因,这些基因可以来源于不同的物种,但是具有相同的功能。以K00161为例,对应的同源基因的列表可以从KEGG的官网查询得到,

打开这个链接 , 在查询的文本框中输入K number, 如下图所示:

点击按钮,在跳转的页面可以看到具体的基因列表,如下图所示

在下拉列表中,还可以对物种进行筛选,比如只显示的基因。

对于已知的基因,可以直接在数据库中检索得到对应的功能,那么对于新发现的基因,如何利用KO数据库来研究其功能呢?

根据同源基因的定义,序列相似度在80%以上的就定义为同源基因。对于功能未知的基因,我们只需要根据序列比对查找对应的功能已知的同源基因就可以了。

KEGG官网提供了一个在线的工具,BlastKOALA。这个工具基于blast 比对,将输入的基因序列和KEGG Gene 数据库中的序列去比对,查找最佳匹配的一个gene, 将该基因对应的K number 赋予查询的基因。

地址如下:http://www.kegg.jp/blastkoala/

1.首先在文本框中输入带查询的基因的序列

2.设置对应的物种信息,减少查询的物种范围

3. 根据实际情况选择用于检索的基因集数据库

4. 最后输入邮箱地址,提交任务就可以了

首先会给你的邮箱发一封邮件,你必须点击这个邮件中的链接才能开始工作,当结束后,会再发一封邮件给你,通过邮件中的链接就可以看到最终的分析结果。

总结

KO 数据库是研究基因功能的基础数据库,每个KO下对应的是一系列具有相同功能的基因,这些基因可以来源于不同的物种。

基于序列比对的原理,我们可以利用KO 数据库来研究新基因的功能。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180226G15D5I00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券