OMIM使用简要说明【论坛精选优秀帖】

.OMIM 为“0nline MendelianInheritance in Man”的简称,它通过对新的病症分类并命名、收录表型和相关病因基因的关系来收录人类孟德尔疾病信息。所以我们可以通过表型或者基因型来搜索对应的信息。通过网址登陆到OMIM的主页:https://www.omim.org/

用户可通过主页中央的搜索框可完成简单的搜索任务,主页顶端的导航栏会对网站做相关性的介绍,这里仅介绍下该网站的词条统计性信息:https://www.omim.org/statistics/entry

这里记录了截止2017年3月6日的词目记录统计量,根据位置分为了常染色体、X染色体、Y染色体和线粒体的收录统计情况。我们需要注意的是MIM Number Prefix栏的信息,这里解释了MIM的数字前缀的意义:https://www.omim.org/help/faq#1_3(1.3 What do thesymbols preceding a MIM number represent?)

符号

含义

星号(*)

该记录是一个基因

井号(#)

这是一个描述性的记录,常常是一个表型,而不是一个唯一的基因座,

加号(+)

该记录包含了已知序列的基因和表型的描述

百分号(%)

该记录描述了一个经过证实的孟德尔表型或表型的基因座,但是潜在的分子基础未知

无符号前缀

该符号表明这个记录是一个表型的描述,但是它的孟德尔疾病基础还未被清楚地证实,或者该表型与其他搜索记录的区别尚不清晰

脱字符(^)

该记录已经不复存在,可能已经从数据库中删除或换成了其他词目

另外针对OMIM的收录条目的数字使用也有区别:(https://www.omim.org/help/faq#1_11 1.2 What numbering system is used in the OMIM database?)

每一个收录条目都使用了一个唯一的6位数字表示:

数字

说明

1-----(1000000);2-----(200000)

常染色体基因位点或表型(创建于1994年5月15日前)

3-----(300000)

X染色体关联的基因位点或表型

4-----(400000)

Y染色体关联的基因位点或表型

5-----(500000)

线粒体基因座或表型

6-----(600000)

常染色体基因位点或表型(创建于1994年5月15日后)

另外OMIM数据库的内容主要包括如下信息:

表型

示例

单个基因的孟德尔疾病、失调和表型

囊性纤维化,镰状细胞性贫血,软骨发育不全,表型性特征例如头发眼睛颜色不同,药物反应例如恶性高体热和华法林敏感性,可变的感染反应例如单纯疱疹(性)脑炎和发展为艾滋病的HIV感染,癌症的胚系易感基因例如BRCA1和乳腺癌卵巢癌,等等

具有显著性的单基因致病的复杂疾病

补体因子H和年龄相关的黄斑变性

复发性缺失和重复综合症

Potocki-Shaffer综合症和染色体10q26缺失综合症

对于一个查询网站,我觉得最重要的是搜索功能,通过主页的导航栏的Help链接我们可以查看到OMIM的搜索规则:https://www.omim.org/help/search

这里介绍了很多搜索帮助,简述如下:

搜索方式

说明

示例

基本搜索

简单输入词目

duchenne muscular dystrophy

加号运算符做前缀(+)

确保结果包含输入的搜索条目

+duchenne

减号运算符做前缀(-)

搜索结果不包含搜索条目

-duchenne

短语搜索

只返回包含该短语的搜索结果

"duchenne muscular dystrophy"

通配符搜索(*?)

作为搜索条目的通配符,*表示搜索条目接多个字符,?表示搜索条目接单个字符

dystroph* dystrophi? dystro??i?

搜索域搜索(title:)

指定搜索该搜索域的内容

title: Duchenne title:duchenne title:muscular

布尔运算符

支持布尔运算符的功能

AND NOT OR 等同于加减号前缀和或者

染色体位置搜索

指定包含的起始区域

1p36-p32

基因组坐标搜索

指定基因组的起始位置

1:12,000,000-48,000,000

2.通过前面的简单介绍说明我们尝试搜索下,例如:Parkinson

打开基本搜索结果界面(https://www.omim.org/search/?index=entry&sort=score+desc%2C+prefix_sort+desc&start=1&limit=10&search=parkinson):

图示是基本搜索返回界面的部分截图,在图中1号框位置我们可以对该搜索条目进行进一步的Gene Map Table和Clinical Synopsis搜索,这里分别会反馈搜索条目(Parkinson)相关染色体基因位置和临床简介信息,下面2号框(Hightlights)我们可以选择在结果中高亮搜索条目;在3号框位置的第一个返回结果为前缀为#号的描述性结果(#168600,PARKINSO DISEASE,LATE-ONSET; PD),下面描述了该疾病相关的染色体位置:1q22,4q23等等。接着是依次是表型基因型的关联信息(Phenotype-Gene Relations),表型系列的信息(Phenotypic Series),这里指的是相似表型的遗传异质性信息、对疾病的分类信息(ICD+)和疾病相关的外部链接(Links)。表型基因型的关联信息,点开可得一下拉表格:

我们可以看到图示框中分别有基因位置、对应表型、表型的MIN编号、遗传特点、表型对应到基因型的基础情况、基因位置和基因/位点的MIM编号,另外我们将鼠标放到相应信息位置可以看到对该信息的简单解释。

点开表型系列可得下表:

OMIM对表型系列做了分类,每一类表型都有一个编号,这里Parkinson疾病所属表型系列编号为:PS168600;我们可能会注意到这里的表型描述有的加了大括号,有的加了问号,该符号对表型也进行了分类说明:

类型

说明

中括号([])

非疾病,主要的遗传变异会导致异常的研究检测值

大括号({})

突变怀疑导致了多因素的病症或感染

问号(?)

表明表型和基因型之间的关联是暂时的,更详细的关联信息提供在详情中

病症后括号内的数字(1/2/3/4)

(1)病症对应到了野生型基因;(2)疾病本身被比对到了基因;(3)病症的分子基础已知;(4)病症是由于染色体的缺失或复制

同时表型比对信息(Phenotype Mapping Key)的数字也有不同的解释说明:

关键数字

说明

1

该病症的位置的确定是由于它与基因的关系,但是潜在的缺陷未知

2

该病症的位置比确认是通过统计的方式

3

该病症的分子基础已知

4

该病症是由连续的基因复制或删除,由多基因所涉及

通过以上信息我们可以进行简单搜索并快速浏览搜索条目的基因型和表型信息!

我们现在点开第一个搜索结果(#168600. PARKINSON DISEASE, LATE-ONSET; PD),进入表型结果界面https://www.omim.org/entry/168600?search=parkinson&highlight=parkinson

这是表型结果界面的部分截图,1号框显示了表型的条目信息,长且详细;2号框显示了该条目的别称;3号框列出了表型界面的内容,点击相应内容即可完成跳转;4号框对应了该表型的外部链接信息;5号框是一个列表,对应了表型和基因型的关系;6号框有临床概况(Clinical Synopsis)和表型系列信息(Phenotypic Series),点开可得相应的信息列表,其中表型系列信息(Phenotypic Series)和搜索结果界面的信息一样!

我们看下表型结果界面的临床概况(Clinical Synopsis)的下拉信息:

我们依次可以看到Parkinson的遗传特点属于个别情况,多因素遗传;身体各部位临床特征等信息,点击对应左侧的表型结果界面内容列表的链接可跳转至更详细的临床特征信息。

我们回来看下表型基因型的关联性表格(Phenotype-GeneRelationships),它包含了多个链接:

Location链接到该染色体区域的相关基因信息;Phenotype MIM number链接到该表型结果界面;Gene/Locus MIMnumber链接到与该基因相关的表型信息。

例如图中Location链接1q22,对应到了1号染色体长臂2区2带的基因信息:

例如点击图中Gene/Locus MIMnumber链接606436,对应显示了以该基因为搜索条目的相关表型信息:

这里我们注意到左侧的等位基因变异情况(AllelicVariants),点击完成跳转:

图中1号框表示总共列出48个突变例子,2号框是一个列表链接,列出了总共48个被挑选出来的变异信息。FAQs页面对突变收录的选择进行说明(https://www.omim.org/help/faq#1_4 1.4 How are mutations cataloged in OMIM?):被收录的突变包含第一个被发现的相关突变,高频发生的突变,涉及到明确表型的突变,历来具有显著性的突变,具有不寻常的突变机制的突变,不寻常的致病机制的突变和明确遗传性的突变(例如:同一个基因上的决定性突变,伴随其他突变的阴性突变)。这里大部分的突变都是与致病相关的。同时包含了少数多态性,它们多数有部分共有的失调症状具有正相关性。

3.下面我们介绍下OMIM的高级搜素模式:

我们可有选择OMIM、Clinical Synopsis和Gene Map三种搜索方式,另外这些搜索链接不仅仅在主页可以被选择到,其他界面也可以进行选择。

OMIM高级搜索(https://www.omim.org/search/advanced/entry):

这里包含了多种搜索选择,可以定义输入的搜索词条范围(SearchIn),搜索结果所具备的记录信息(OnlyRecords With),通过前缀限制输出结果(MIMNumber Prefix),限制搜索的染色体区域(Chromosome)以及收录时间(Dates)等。

ClinicalSynopsis高级搜索(https://www.omim.org/search/advanced/clinicalSynopsis):

这里就针对临床特征(Only entries with)和收录日期(Dates)对搜索进行了分类。

Gene Map高级搜索界面如下(https://www.omim.org/search/advanced/geneMap):

这里的搜索模式就涉及到了最开始搜索方式简述和针对所属染色体的搜索(Chromosome)。

最后对OMIM的数据下载就不做介绍,我使用了同学的edu后缀邮箱注册了,但是还未通过,但是网站有无需注释的txt文件可供下载,感兴趣的可以下来打开看看(mim2gene.txt)。如果还有疑问请查询OMIM的Help界面,这里就不累述了!

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2017-03-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏算法channel

用Word排版伪代码out了,推荐这个工具

多少次你看到别人的的伪代码排版如此完美而惊艳,心中不免好奇,怎么设计的?今天,和大家一起学习一款流行的排版利器:CTeX

2730
来自专栏jeremy的技术点滴

python开发小技巧

2604
来自专栏用户画像

2.2.2 物理层接口的特性

物理层考虑的是如何在连接各个计算机的传输媒体上传输数据比特流,而不是具体的传输媒体。物理层应尽可能屏蔽各种物理设备的差异,使数据链路层只需考虑本层的协议和服务。...

853
来自专栏C语言及其他语言

【程序源码】VC6下实现C语言贪吃蛇

程序源码 今天是正月初九,相信大家基本上都告别了“新年”这个词,回到了自己正常的轨道,小编也不例外,这不,又开始给大家分享好玩的了,现在过完年...

2617
来自专栏数据库

后GWAS时代的数据整合:RegulomeDB和HaploReg数据库

RegulomeDB和HaploReg数据库提供了将大量基因组学数据与非编码突变整合的思路。 1.背景 GWAS研究产生了大量的SNP,大部分在非编码基因组 这...

23810
来自专栏人工智能LeadAI

实时Android语音对讲系统架构

本文属于Android局域网内的语音对讲项目(https://github.com/yhthu/intercom)系列,《通过UDP广播实现Android局域网...

7064
来自专栏mathor

巴什博弈(Bash Game)

683
来自专栏深度学习之tensorflow实战篇

计算机常用算法对照表整理

常用对照: NLP CRF算法: 中文名称条件随机场算法,外文名称conditional random field algorithm,是一种数学算法,是2...

3665
来自专栏Java帮帮-微信公众号-技术文章全总结

【学习经验】Java中常用英文

【学习经验】Java中常用英文 第一章: public['pʌblik] 公共的,公用的 static['stætik] 静的;静态的...

34410
来自专栏抠抠空间

haslib 模块

一、模块简介 Python的hashlib提供了常见的摘要算法,如MD5,SHA1等等。 什么是摘要算法呢?摘要算法又称哈希算法、散列算法。它通过一个函数,把任...

3008

扫码关注云+社区