高通量DNA测序是近年来发展起来的革命性技术,大大推动了快速、廉价获取基因组信息的能力,进而对生命科学产生深刻的影响。测序化学是高通量DNA测序的重要内容,且发展十分迅速;一些构思巧妙的新颖测序化学方法被相继报道,本文综述了高通量DNA测序化学的最新研究进展。 High-throughput DNA sequencing, a revolutionized technology, greatly accelerated mining data from ge- nomes rapidly and cost-efficiently, thus have a profound impact on life sciences. Sequencing chemistry is a pivotal part of high-throughput DNA sequencing, and has been developed dramatically in recently years; a number of ingenious methods of novel sequencing chemistry by synthesis have been reported. In this paper, the development of high- throughput DNA sequencing chemistry by synthesis is reviewed.
高通量DNA合成法测序(DNA sequencing-bysynthesis (SBS))技术代表全基因组测序的巨大潜力[
最早实现高通量DNA测序的报道是2005年454公司[
dNTP在DNA聚合酶催化下发生聚合酶链式反应,每合成一个dNTP便会产生相同摩尔数的焦磷酸盐(PPi),焦磷酸盐水解产生质子(H+)[
图1. 3’-O-烯丙基-dNTPs的可逆终止焦磷酸测序法和使用常规dNTPs的传统焦磷酸测序法的结果比较。在可逆终止焦磷酸测序法(a)中,均聚物的每个碱基均对应一个清晰的峰信号;而在的传统焦磷酸测序法(b)中,每个均聚物只产生一个峰信号,很难准确判断碱基数目的个数;(c) 3’-O-烯丙基-dNTPs或者3’-O-(2-硝基苯)-dNTP的结构
值发生变化,且pH值变化的程度产生焦磷酸盐的数目相关,即与参加dNTP合成的个数相关。因此,通过检测延伸反应发生前后H+的变化,同样可以跟踪延伸反应的情况。Life Technologies公司利用该原理发展了离子半导体(Ion Torrent)测序技术[6,12],即是通过pH敏感场效应晶体管阵列芯片检测DNA聚合过程中产生氢离子而实现DNA序列的测定。Ion Torrent测序平台的核心是一块创新的半导体芯片,其中包含了数百万个孔(反应池)和专有的大规模并行芯片传感器(每个反应池对应一个检测器)。通过限制加入dNTPs的数量,即每次只加入单一的dNTP来实施测序反应:四个非修饰核苷酸(dATP,dGTP,dGTP,dTTP)按排定的顺序,每次只加入一个,当加入的dNTP与模板互补时,以单链DNA为模版的测序引物在DNA polymerase作用下发生合成反应,检测具有与参与合成的dNTP数量具有定量关系的H+浓度(图2)。通过使用由大约1.68 μm × 1.3 μm的微孔反应池构成的阵列,每个反应池固定含DNA模板直径为1 μm的微珠,且底部有独立的传感器和电极,用来跟踪检测反应池中的测序反应类型:当dNTP流经反应池时,如加入的dNTP与模板互补,杂交在单链DNA模版的测序引物便在DNA polymerase作用下发生合成反应,并随之产生具有定量关系的H+,从而改变反应池中的pH值,而pH值的变化(∆pH)将导致反应池底部金属–氧化物–传感层表面电势的变化,同时进一步引起底部场效应晶体管终端的电压(∆V)的变化。与焦测序技术相比,同样采用无修饰的核苷酸,且测序化学原理更简单真实,能够在2小时内获取从10 Mb到1 Gb以上的高准确序列。
图2. Ion Torrent测序平台单个反应池延伸反应及其测序检测原理:当dNTP流经反应池并发生延伸反应,产生的H+,从而改变反应池中的pH值(∆pH),并将导致反应池底部金属–氧化物–传感层表面电势的变化,同时进一步引起低部场效应晶体管终端的电压(∆V)的变化。如果本次加入dNTP发生1个碱基的延伸,则终端电压(∆V)的改变数值有一个确定数值(左);如果本次加入dNTP发生2个核苷的合成,则终端电压(∆V)的改变数值是发生是1个核苷合成改变值的2倍(右)。依照四个碱基单体(dATP,dGTP,dGTP,dTTP)每次加入一个单体的顺序不断循环,便实现了每个反应池中模板序列的测序碱基不断增加
2011年哈佛大学化学与化学生物学系将末端磷酸标记的荧光核苷酸与可重复密封的微反应器相结合,开发出一种并行边合成边测序的新技术,其测序原理见图3[
图3. 末端磷酸标记的荧光核苷(TPLFNs)结构与测序原理:在DNA聚合酶的作用下,延伸引物以非荧光、四磷酸标记荧光核苷为底物进行延伸合成反应,释放非荧光、荧光标记的焦磷酸盐,后者在磷酸化酶的降解作用下产生荧光产物
这种荧光焦磷酸测序既保持了焦磷酸测序的好处,如快速周转、单色检测等,又具有并行化的检测灵敏度和简便性。值得称道的是该测序平台不需要像焦磷酸测序和离子半导体测序平台中对每个“反应器”构件对应的检测器,而是用一个成像设备完成所有“反应器”测序反应的检测,因而更具有价格优势。
当同一时间只有一种类型的dNTP被合成上去,由于被加入的dNTP类型可以事先知道,那么仅仅通过相对简单的单色荧光检测就能判断合成是否发生。但其不足包括下述二个因素:一是这种核苷酸3’端的羟基往往是活性的,并不能限制测序引物链每次只进行一个核苷酸的合成。因此,荧光光学法检测就不仅需要判断合成是否进行,还需要建立合成核苷个数与信号强度的定量关系;第二,每次只加入一种类型核苷酸的合成反应,容易引起需要其它三种类型核苷因为底物的缺失而造成的非特异合成,产生测序错误[14-16]。代表合成测序巨大潜力的方法应该是:四种类型的核苷酸同时加入反应中进行合成反应,以保障所有的测序引物都有反应底物,降低错误合成的几率;此外,每次合成还要求只延伸一个核苷酸,即测定一个核苷序列,以避免需要建立复杂、有时甚至是模糊不清的核苷合成个数与荧光强度的定量关系。图4给出了循环终止测序法使用的核苷酸单体结构,其分子特征为:核苷酸单体的3’端羟基被保护基团临时封闭,每种单体在相应的碱基位置连接一个对应的荧光基团;通过温和的反应可以将相应的基团切割,清除荧光基团、活化3’端羟基,以进行下一个核苷的测序反应。循环终止测序法的好处法在于:1) 四个核苷酸可以同时参与合成反应;2) 可以大规模并行进行;3) 不需要独立的“反应池”,具有更高的通量;4) 相同碱基的重复片段可以通过终止法一个一个地进行阅读。这类方法实施面临的重大挑战是:更为复杂的3端羟基临时封闭的标识核苷酸分子需要具有快速,有效的脱保护动力学,在DNA聚合酶的作用下显示出有效的合成动力学,以及标记物所具有的特性(如荧光基团具有良好的荧光特性等)。因为测序长度受控于“整个”循环合成反应的效率(包括聚合反应和去封闭反应的效率)。此外,其封闭基团在它掺入到延伸引物后,还必须在温和条件下得以切除,否则可能很不幸
图4. 3’端羟基可逆封闭、修饰可切割荧光的2’-胸腺嘧啶三磷酸(T)核糖位置核苷的结构(不同碱基标记相应的荧光基团)
地干扰DNA聚合酶,核苷,寡核苷酸杂交的模板,或者固相载体而影响循环测序反应的进行。目前主要有三类3’端羟基可脱保护的封闭基团:即3’-O-烯丙基基团,3’-O-叠氮甲基和3’-O-氰乙基基团,且这三类封闭基团均能通过化学反应将3’临时保护基团和荧光基团清除。
Ju等人第一个报道了荧光标记的3’-O-烯丙基修饰的dNTP合成方法[17-19],并合成出一套测序反应单体试剂。四个单体可以同时进行延伸测序反应,并在本次测序完成之后,需要两个脱保护步骤来活化3’端的羟基和清除荧光基团:用紫外光裂解荧光基团和钯催化反应切割烯丙基团以恢复3’端的羟基。前面提到,利用355 nm的激光下辐射10秒后荧光基团将被裂解;Na2PdCl4的三苯基膦三磺酸盐溶液在70℃下处理30~90秒,则3’端的烯丙基基团被切除,从而进行下一个循环的测序反应。他们测定了14个碱基的长度。值得注意的是烯丙基基团的切割条件相对苛刻,很难适合延伸引物非固定的合成测序模式。
哥伦比亚大学的Ju研究组[20,21]报道了一种非荧光标记的3’-O-叠氮甲基封闭的脱氧核苷配合可切割荧光基团标记的双脱氧核苷进行合成法测序列。该方法很像传统的Sanger测序法中的延伸过程,被荧光标记ddNTPs合成的引物被永远终止继续延伸,而被合成的3’-O-叠氮甲基封闭的脱氧核苷在3’端封闭基团被脱保护后可以继续延伸:用100 mM的三(2-羰基乙基)磷盐酸盐(TCEP,pH 9.0)充满反应腔,并维持65℃反应10分钟将参加延伸反应的荧光标记ddNTPs中的荧光基团和3’-O-叠氮甲基封闭的脱氧核苷中的保护基团切割,以进行循环合成测序列,其序列测定长度达到30多个碱基。在上述3’-O-叠氮甲基基团封闭的脱氧核苷、配合可切割荧光基团标记的双脱氧核苷进行合成法序列测定中,荧光基团标记的双脱氧核苷完成该次测序后,其测序引物即被终止,换句话说,也就是测序模板在不断减少,因而后续提供的测序信号的强度也在不断减少,这将导致测序长度受到限制。
Solexa公司集上述两组核苷优点于一身,开发出的3’-O-叠氮甲基-2’脱氧核苷三磷酸(dNTPs)已成功用于商业化测序仪[
2011年Knapp等人报道了一类与3’-O-叠氮甲基具有同样功能的3’-O-氰乙基可脱保护标记荧光核苷的合成[
图5. 荧光标记的3’-O-叠氮甲基-2’-胸腺嘧啶三磷酸(T)用三(2-羰基乙基)膦处理脱去荧光基团和解除3’封闭基团。除了每个碱基和对应标记的荧光基团不同外,其余三个核苷(A、G、C)具有类似结构
图6. 荧光标记的3’-O-氰乙基-2’-胸腺嘧啶三磷酸(T)用四丁基氟化铵/四氢呋喃和无水二甲亚砜的混合物脱去荧光基团和解除3’封闭基团。除了每个碱基和对应标记的荧光基团不同外,其余三个核苷(A、G、C)具有类似结构
和无水二甲亚砜的混合物在45℃处理15分钟完成了对荧光基团和3’-O-2-氰乙基基团的切割,同时顺利完成了下一个该类核苷的延伸反应。
高通量DNA测序技术是国际上近几年发展起来的,已经成为生物和医学领域中发展最快、影响最大、应用最为广泛的前沿高技术研究领域。高通量DNA测序技术平台的核心是测序化学,新的测序化学方法有可能催生成本更低、测序速度更快、准确度更高、或者测序长度更长等特征的高通量DNA测序技术平台。本文综述了高通量DNA合成测序化学的近年来的最新研究进展,对理解和进一步深入研究高通量DNA测序技术提供借鉴。
本实验由国家自然科学基金(60971018),江苏省自然科学基金项目资助。特此感谢。
[
[
[
[
[
[
[
[
[
[
[
[
[
[
[
[
[
[
[
[
[
[