外显子组及全外显子组测序WES

1 外显子和外显子组

外显子是蛋白质的编码区域,是这和生物基因组的一部分。基因组中的全部外显子称为外显子组。人类基因组大约有1.8*10^5个外显子,30Mb,占人类基因组的1%。 研究表明,人类85%以上的疾病基因都由外显子碱基突变造成。

exom

2外显子测序技术的原理

Exome sequencing, 也叫 whole exome sequencing (WES)

包括三步:

  • 外显子序列的捕获富集
  • DNA测序
  • 数据统计分析

流程

2.1 外显子组的捕获富集

目前,主要通过(NimbleGen)和安捷伦(Agilent) 两种捕获芯片对外显子序列进行富集。其基本原理是捕获,富集,高通量分析

捕获富集

  • 首先将基因组 DNA随机打断成200 ~ 300 bP 左右的片段,随后进行 DNA片段平末端修复,5'端加磷酸基团,3'端 加 PolyA 尾 ,通过 TA连接将接头序列加到片段两端,经过一轮 PCR增后成为完整的片段文库
  • 然后将这些DNA片段与捕获芯片进行杂交,从而得到富集的目标片段;随机把目的片段连接成长链DNA片段
  • 然后再次随机打 断并在其两端连接上测序接头
  • 然后用与接头相匹配的序列为引物进行PCR扩增
  • 经质量检测合格后的外显子组文库即可上机测序。

2.2 DNA测序

二代测序为主

2.3 数据分析

  • 常规图像信息数据分析 去噪音,锐化,定位,校正等

  • 生物信息学分析 挖掘变异位点(包括SNP,短的插入/缺失片段) 流程是:通过质控去除测序中的低质量reads,然后将高质量的reads与参考基因组进行比对,统计SNP,Indels,CNV等,并进行注释,筛选,分析,验证等。

SNP

3 应用

3.1 遗传性疾病的检测

遗传性疾病包括单基因并,多基因病,染色体异常疾病,线粒体基因病和体细胞遗传病等。 单基因疾病又叫孟德尔遗传病,是单个基因突变导致的疾病,常以孟德尔遗传模式存在于家系。

3.2 发现致癌基因和抑癌基因

外显子区域突变容易导致非正常功能蛋白的产生,甚至和细胞癌变能力相关。这对标记物,治疗等有重要意义。

3.3 肿瘤分子分型

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券