新型算法可确定基因组突变位点

导读:冷泉港实验室的研究团队设计了一种全新的方法来分析基因组序列——Scalpel,通过复杂的算法精确定位插入或缺失突变的基因组位点,此方法可用于患有孤独症、强迫症以及妥瑞士综合症的病人。相关研究成果发表于8月18日的Nature Methods上。

人类基因组包含有30亿个碱基,很难想象插入或移除一个DNA碱基会对身体健康产生多大的影响。而实际上,这种插入或删除确实会戏剧性地改变生物功能,甚至造成诸如孤独症或癌症等多种疾病。但是,想要察觉这些突变是十分困难的。最近,冷泉港实验室(CSHL)的一个研究团队设计了一种全新的方法来分析基因组序列,精确定位插入或缺失突变的基因组位点,此方法可用于患有孤独症、强迫症以及妥瑞士综合症的病人。

人类基因组中的“字母”包含了蛋白质信息,三个“字母”构成一个“单词”——三联体密码子,通过密码子进行翻译。众多单词再组装成一个句子,即成为一个特殊的蛋白质。在此过程中,如果有一个字母意外插入或删除,那么三联体密码子则会移位,导致后续的所有序列全部改变,这种移码突变将会造成蛋白质错误翻译。丢失单个蛋白质也会对细胞造成毁灭性的影响,例如功能紊乱,甚至是一些严重疾病。

DNA的插入和删除使得基因组的长度和序列千变万化,每个突变的波及范围从一个至上千个DNA碱基不等,并且这些突变也可以是重复的。尽管现如今基因组测序技术已经有了突破性进展,然而突变的多样性仍然使得确定突变位点充满挑战。

CSHL的科学家们,包括助理教授Mike Schatz,、Gholson Lyon、Ivan Iossifov和教授Michael Wigler,设计了一个发掘现存基因组数据集以寻找突变位点的方法。这一方法称作Scalpel,它是从集合所给基因组区域的所有序列开始。Scalpel,包含了一个计算机公式或者说算法,然后为所给区域创建一个新的序列,这就像拼凑谜语的破碎片段一样。

定量生物学家Schatz说到:“这些突变就像基因组中的精细切口,在这些切口处DNA插入或者删除,Scalpel为我们提供了一种放大镜头,使得我们能够精确定位切口的位置。”这些信息对于理解疾病相关突变是十分关键的。8月18日的Nature Methods上发表了这一研究,研究团队利用Scalped方法对患者样品进行了突变检索。CSHL的一位研究人员Lyon,也是一位职业精神病医师,他和他的团队对一位患有严重妥瑞士综合症和强迫症的患者基因组进行分析,确定并证实了超过一千个突变位点,从而展示了此种方法的精准度。

CSHL团队展示了一种类似的分析方法用于检索孤独症相关突变。他们建立了一个包含有593个家庭的数据集,这些家庭中都是只有一个孤独症患儿,而其他家庭成员均正常。研究人员发现593个家庭中具有总数达到330万个的突变位点,且大多数都为相对无害的。但是,仍有几十个突变是明显具有孤独症特异性的。Schatz说:“所有这些都增进了我们对于自发突变导致孤独症的理解和认识。”

然而,此工具应该获得更加广泛的应用。“我们正在和植物学家、癌症生物学专家以及其他专家学者进行合作,寻找突变位点”,chatz说,“这个工具十分强大,我们正试图揭示生命树中,基因组新片段的影响。”

摘自生物探索

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2014-08-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏生信技能树

2433个乳腺癌患者的173个基因的突变全景图

乳腺癌具有患者间与同一患者肿瘤内的基因组变异性。以患者间的异源性分类早期乳腺癌生物亚型,现在临床对乳腺癌患者通常是观察 morphological assess...

19620
来自专栏生信宝典

生信老司机以中心法则为主线讲解组学技术的应用和生信分析心得 - 限时免费

海哥,中国科学院遗传与发育生物学研究所,生物信息学博士。在生信宝典出品过多部“傻瓜式”教程。

9430
来自专栏生信宝典

2018国内基因编辑技术走势

3月30~31日,由北京大学天然药物及仿生药物国家重点实验室主办的2018基因编辑学术研讨会将在京举行。届时众多一线科研工作者将聚集于此共襄学术盛宴。 201...

58840
来自专栏生信小驿站

使用RNA-seq数据通过网络熵评估肿瘤内异质性摘要介绍

肿瘤内异质性(ITH)出现在肿瘤进展、转移和复发的不同阶段,而这些对于临床应用是重要的。我们使用来自肿瘤样品的RNA测序数据,并根据生物网络状态测量ITH水平。...

13910
来自专栏镁客网

北大课题组改进ECC测序法,利用信息冗余大幅增加测序精度 | 黑科技

14400
来自专栏生信技能树

【直播】我的基因组 36:这些可能是somatic突变的位点究竟是什么?

吓死我了! 前面我们讲到了可以把突变文件注释到dbsnp数据库,而dbsnp数据库信息非常丰富,比如我们可以看 ##INFO=<ID=SAO,Number=1,...

379160
来自专栏思影科技

面向工作记忆过程的双向额顶振荡系统

最近,来自加利福利亚大学Helen Wills神经科学研究所的学者通过研究表明在工作记忆过程中,前额叶皮质区与大脑后皮质区之间具有一套完整的平行双向神经振荡系统...

29550
来自专栏生信技能树

【直播】我的基因组57:最简陋的祖源分析

这……可能是最简陋的祖源分析了吧,没有之一。 ? 前面我们学习了千人基因组的人群分布情况,也简单的看了看我自己的基因型在那2504个人的距离情况,但是只能定位到...

65190
来自专栏新智元

【北航新型人工突触】能模拟人类神经系统基本功能的人工突触诞生

【新智元导读】近日 ACS Nano 刊登了一项研究报告,称已开发出能够模拟我们神经系统基本功能的人工突触,能够从同一“突触前”末端释放抑制和刺激信号。这项研究...

37350
来自专栏生信技能树

WGCNA分析+公共数据库挖掘你感兴趣的癌症

原文链接: Application of weighted gene co-expression network analysis to identify ke...

36530

扫码关注云+社区

领取腾讯云代金券