前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >OMIM数据库简介

OMIM数据库简介

作者头像
生信修炼手册
发布2020-05-11 10:34:56
1.6K0
发布2020-05-11 10:34:56
举报

OMIM 全称叫做Online Mendelian Inheritance in Man, 是一个不断更新的人类孟德尔遗传病的数据库。这个数据库主要关注人类基因变异和表型性状之间的关系。

网址如下:

https://omim.org/

数据库中的每一条记录,都会有一个唯一的由6位数字组成的OMIM 编号,不同数字开头的编号含义不同,其中:

  1. 数字1和2 开头的,代表常染色体上的相关位点和表型(1995年之前创建的)
  2. 数字3开头的,代表X染色体上的相关位点和表型
  3. 数字4开头的,代表Y染色体上的相关位点和表型
  4. 数字5开头的,代表线粒体上的相关位点和表型
  5. 数字6开头的,代表常染色体上的相关位点和表型(1995 年之后创建的)

对于等位基因,每一条记录都有一个唯一的MIM 编号,由点号分隔的两部分构成,点号之前是突变位点对应的OMIM 编号,点号之后是一个由4位数字构成的唯一ID, 用来记录等位基因。

以IX 基因为例,对应的等位基因有 300746.0001 和 300746.0101 两个MIM 编号。

这个数据库是不断更新的,截止到2018年5月29号,数据库中的数据记录如下:

数据库中的记录,分成了5个类别。

1. Gene description

这种记录以”*”开头,主要记录基因的相关信息,比如100640

2. Gene and phenotype, combined

这种记录以+开头,描述了基因和表型之间的关联,比如100650

在网页上,会给出基因和表型之间的关联

3. Phenotype description, molecular basis known

这种记录以#开头,描述了分子机制清楚的表型信息,比如100100

Text字段中,会给出详细的和该表型相关的基因突变信息

4. Phenotype description or locus, molecular basis unknown

这种记录以%开头,描述了分子机制不清楚的表型信息,通常都有由多种遗传因素控制的疾病,相关突变位点较多,比如100070

5. Other

其他类型的记录,这部分记录之前没有任何前缀,比如10050

目前该网站的完整数据只面向科研机构开放下载,下载页面的链接如下

https://omim.org/downloads/

其中的mim2gene.txt是大家都可以下载的,里面有数据库所有记录的编号。

第一列的ID就是omim编号,知道编号之后,可以快速得到对应的页面,链接格式如下

https://omim.org/entry/100640

虽然不能下载到完整的数据库,但是只需要根据编号,也可以快速得到想要的信息。如果你编程能力够强,也可以抓取所有的网页,构建一个本地版的数据库。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-05-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. Gene description
  • 2. Gene and phenotype, combined
  • 3. Phenotype description, molecular basis known
  • 4. Phenotype description or locus, molecular basis unknown
  • 5. Other
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档