随着三代测序技术的深入发展,研究者的目光已不再仅仅满足于获取基因组的序列信息。一个日益增长的需求是,如何在对特定基因组区域进行测序的同时,完整地保留其天然的碱基修饰?最近,李老师就遇到一位老师提出这样的设想:“我想对人类基因组的特定区域进行靶向测序,并同时分析其DNA甲基化,三代测序技术能实现吗?”
答案是肯定的。而实现这一目标的“黑科技”,便是牛津纳米孔(ONT)测序平台独有的自适应采样(Adaptive Sampling)技术。今天,我们就来深入解析这一堪称“读心术”的技术,看看它是如何实现对目标DNA的“智能筛选”的。
传统靶向富集的“两难之境”
在探讨自适应采样之前,让我们先回顾一下传统的靶向测序富集方法。通常,研究者会采用两种策略来富集感兴趣的区域(Regions of Interest, ROIs):
- 探针捕获(Probe Capture):设计并化学合成一系列与目标区域互补的探针,通过液相杂交将目标DNA片段“钓”取出来。
- 靶向扩增(Targeted Amplification):针对目标区域设计特异性PCR引物,通过扩增来大量富集目标片段。
这两种方法虽然成熟有效,但都面临着一个共同的“两难之境”。首先,它们都需要事先设计并合成物理的探针或引物,这不仅步骤繁琐,增加了额外的实验时间和经济开销,而且一旦目标区域需要调整,就必须重新设计和订购。
更致命的是,无论是探针捕获后的文库构建,还是靶向扩增本身,都不可避免地涉及到PCR过程。正如我们之前讨论过的,PCR会抹去DNA上所有天然的碱基修饰信息(如5mC、5hmC等),使得我们无法在测序后探究这些区域的表观遗传学特征。
自适应采样:在测序中完成“实时富集”
纳米孔测序的自适应采样技术,则彻底颠覆了这一“先富集,后测序”的传统模式。它是一种在测序过程中(on-the-fly) 完成的计算驱动型富集方法。
- 常规测序模式:在传统的过孔测序中,测序仪像一个开放的通道,无差别地接受所有进入纳米孔的DNA片段。最终能读到什么序列,完全取决于该片段在文库中的相对丰度。
- 自适应采样模式:该模式下的测序仪则化身为一个拥有“自主意识”的智能筛选器。它的工作思路如下:
a. 设定目标(The "Guest List"):在测序开始前,研究者只需将目标区域的序列信息(通常是一个FASTA或BED文件)输入到控制软件中。
b. 实时识别(The "ID Check"):当一条DNA分子在马达蛋白的牵引下开始进入纳米孔时,系统会实时采集其产生的电流信号。强大的算法可以在该分子的前几十到几百个碱基刚刚通过时,就对其进行超快速的碱基识别(basecalling)和比对。
c. 决策与执行(The "Gatekeeper's Action"):
■ 如果匹配:算法判断这段“前瞻”序列属于预设的目标区域,测序将正常继续,完整读取该分子的全长序列。
■ 如果不匹配:若算法判定该分子为非目标序列(背景DNA),系统会立即施加一个反向电压。这个操作会瞬间改变孔内的电场方向,将这条正在进入的DNA分子“弹出”或“拒绝” ,让纳米孔迅速恢复空闲状态,准备迎接下一条分子的到来。
技术优势:化繁为简,信息完整
简单概括,自适应采样技术的核心优势在于:
- 摆脱湿实验:它彻底摆脱了实验捕获或扩增目标区域的繁琐步骤,将富集过程从实验台转移到了测序仪内部。
- 成本与时间效益:只需预先设定目标序列,依靠信号处理和算法在硬件运行中即时完成富集,极大地节省了额外的探针/引物开销和实验时间。
- 保留完整表观信息:最关键的是,这是一个完全PCR-Free的富集过程。因此,被选中的目标DNA分子上的天然碱基修饰信息得以完整保留,实现了在同一条read上同时获得序列和修饰信息的“一石二鸟”效果。
结语
这一期,我们一同了解了纳米孔自适应采样技术的基本原理。它将测序仪从一个被动的“记录者”变成了一个主动的“筛选者”,为靶向测序,特别是靶向表观遗传学研究,开辟了全新的道路。
关于自适应采样的具体应用场景、性能表现以及实验设计中的注意事项,我们将在后面的节目中单独为大家进行更详细的讲解。好了,这一期节目就到这里,我们下期再见!