前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >关于基因ID的二三事

关于基因ID的二三事

作者头像
医学数据库百科
发布2020-06-04 12:24:52
1.3K0
发布2020-06-04 12:24:52
举报
文章被收录于专栏:医学数据库百科

对于一个基因而言,我们经常使用的,同时在文章里面能看到的还是基因名。例如: TP53, RNF180。这样的名字,是这个基因功能+编号的简写。例如TP53就是Tumor Protein P53的简写,RNF180是Ring Finger Protein 180的简写。对于很多对基因进行记录的数据库而言,为了他们自己数据库记录的方便,对于每个基因都会进行自己数据库的唯一编号,这样就导致了一个基因形成了很多不同的编号(ID)。例如下图就是一个基因多个数据库的不同ID号。

这也就导致经常在进行数据分析之前拿到手的关于基因的数据对于基因ID的注释可能不是我们想要的基因名,所以经常会就会需要进行ID转换。对于基因ID转换的主要目的还是转换为基因名,或者说转换成我们进行下一步分析的要求的ID号。

既然要讲一下ID转换,那首先还是要稍微的讲一下我们在一个基因可能存在哪些ID号,这样我们在碰到之后也知道这些是这样形式的ID来自于什么地方,这里我们就说一下常见的基因ID都是哪个数据库的。

Entrez Gene

有时候我们经常会碰到利用几个数字来代表基因的。例如下图的285671就代表RNF180。这种一般是数字代表基因的,最常见的就是Entrez Gene。对于这样的ID号,其实就是来自于ncbi里面的gene数据库。如果想要了解gene数据库的话,可以参考我们的第二条推送。

关于gene数据库对于ID的注释。这个ID号只是代表基因。对于一个基因而言它会有不同的mRNA转录本,进一步的也会有不同的蛋白异构体。在gene数据库里面对于转录本和蛋白的编号是以NM和NP开头的。如果是NM的话则代表是转录本编号,如果是NP的话则是蛋白编号。

另外,我们检索的这个基因是一个非编码的RNA(ncRNA)的话,那关于转录本的注释就从之前的NM开头变成了NR开头了。

Ensemble ID

Ensembl是另外一个记录基因信息的数据库。就笔者而言查询基因信息更多使用的gene数据库(其实更多的还是genecards),这个数据库使用的较少。但是这个数据库对于基因的注释十分的详细且权威,所以也就形成了很多个基因不同情况下的ID了。大致的我们能看到的和Ensembl有关的ID的话就有以下几种。

关于Ensembl ID,不管是什么类型的,其ID号的前三个开头都是以ENS开头的。剩下的可以再看第四位:

  • G代表是Gene。是这个基因的的唯一编码,类似于Gene数据库里面的数字
  • T代表Transcript。是数据库对于不同转录本的ID号。这个类似于上面gene数据库当中的NM编号开头的ID。
  • P代表protein。是数据库对于不同蛋白的ID号。这个类似于上面gene数据库的NP编号开头的ID。

另外对于不同的ID,由于其基因信息也会经常所以为了更加详细的区分,Ensembl数据库就又在各自的ID号后面又加了一个.ID来代表不同的版本。所以就有了ENSGXXXX.1这样的编号。

综上,Ensembl数据库的ID号可以用以下这个图来代表。

Uniprot ID

如果我们查找的是一个基因的蛋白的话,那么就有可能涉及到Uniprot这种专门注释蛋白的数据库。这种的ID有时候我们会在蛋白组学当中看到。对于Uniprot的ID号的话,主要是采用字母+数字混合的这种形式(具体的含义,没有详细的查找)。例如:Q86T96就代表RNF180这个基因的蛋白。

芯片当中的ID

我们在进行进行进行表达谱芯片分析的时候,经常会碰到芯片的ID号。这样我们在进行芯片分析的时候,其实首先分析的还是芯片的ID号,进一步的才是对ID号进行注释。例如Affymetrix Human Genome U133 Plus 2.0 Array这个芯片的话,其ID号就是这个样子的。

很多ID转换的数据库也提供了关于芯片ID的转换。但是这种的其实最好的还是下载了芯片的注释文件,来自己来注释,数据库提供的注释文件有可能是老的注释文件。所以说可能有很多注释不到的。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-06-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据库百科 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档