三代DNA测序技术介绍及其具体应用,分子生物学论文
摘 要: DNA测序技术的研究、开发与进步, 在生命科学的各个研究领域均显示出其非凡的魅力.该文梳理了DNA测序技术的发展脉路, 详细介绍了第一代测序技术的桑格-库森法、化学降解法, 第二代测序技术的Roche 454测序法、Illumina Solexa测序法、ABI SOLID测序法, 第三代测序技术的单分子荧光测序法、纳米孔测序法, 并分析了三代测序技术的核心原理与特征, 指出DNA测序技术的产生与快速发展为生命科学研究带来了革命性的改变, 使人类对自然和自身的认知进入了到新的科学层面.
关键词: DNA测序; Sanger-Coulson method; Maxam-Gilbert method; 高通量测序; 单分子测序;
Abstract: The research, development and progress of DNA sequencing technology have shown its extraordinary charm in various fields of life science.This paper reviews the development of DNA sequencing technology from its first generation of Sanger-Coulson method and chemical degradation method, to the second generation of Roche 454 sequencing method, Illumina Solexa sequencing method and ABI SOLID sequencing method, and to the third generation of single molecule fluorescence sequencing method and nanopore sequencing method.Meanwhile, the core principles and characteristics of three generations of sequencing technology are analyzed.It is pointed out that the emergence and rapid development of DNA sequencing technology has brought revolutionary changes to life science research, which prompts human's cognition of itself and understanding of nature into a new scientific level.
Keyword: DNA sequencing; Sanger-Coulson method; Maxam-Gilbert method; high-throughput sequencing; single-molecule sequencing;
1953年, Watson和Crick发现DNA双螺旋结构[1], 之后人们认识到生物的遗传信息是由DNA序列决定的, 即A、T、C、G这4种碱基的排列方式决定了生物的形态、生长发育以及疾病等特征.那么, 如何破解“生命密码”, 探究物种的DNA序列及其完整性, 则成为生命科学研究领域的热门话题.随着科学技术的进步与发展, DNA测序技术 (又称基因测试技术) 在业界人士的关注、研究与促进下, 有了迅猛的发展, 不仅在传统生物学、医学研究等领域开辟了新的视角, 并推动生物信息学、系统生物学、分子遗传学、基因组学、精准医学等学科的进一步发展, 而这些学科的发展又促进生命科学研究的进步.1977年, 被奉为标志性测序技术的Sanger链终止测序法诞生, 自此第一代DNA测序方法正式浮出水面, 并因其高准确性一直沿用至今.21世纪以来, 第二代高通量测序技术取得了快速发展及广泛的应用, 而第三代单分子测序技术逐渐走向成熟和多元化, 受到广大科研人员的关注与欢迎.这些测序技术的进步与发展, 加快了对人类信息探索的发展, 如2008年1月, “国际千人基因组计划”启动, 它由中国深圳华大基因研究院、美国国立人类基因组研究所、英国桑格研究所承担, 绘制了有史以来最有医学应用价值、最为详尽的人类基因组遗传多态性图谱;2012年11月, 该计划研究人员首次对比分析了千人规模以上的基因组, 发布了1 000余人的基因数据, 在生命科学研究中取得了划时代的进展[2].DNA测序技术的发展路径如图1[3]所示.本文阐释了DNA测序技术的应用与研究进展, 旨在为生命科学研究人员提供研究依据与方向.
1 第一代DNA测序技术
DNA双螺旋结构被发现之后, 在1954年, Whitfeld等[4]利用磷酸单酯酶的脱磷酸作用、高碘酸盐的氧化作用, 将含脱氧核糖的寡核昔酸从链末端逐一分离, 并测定其种类, 即为测量多聚核糖核苷酸的化学降解法.然而, 这种方法的操作极其复杂, 无法被广泛应用, 直到1977年, 英国生物化学家Sanger等提出的双脱氧核苷酸末端终止测序法, 以及Maxam等提出的类似的化学降解法, 标志着DNA测序技术的正式诞生.
1.1 桑格-库森法 (Sanger-Coulson method)
1977年, Sanger等[5]提出了双脱氧核苷酸末端终止测序法, 发明了第一代测序技术.我国科学技术名词审定委员会审定公布的《遗传学名词》 (2007年) 、《生物化学与分子生物学名词》 (2008年) 、《细胞生物学名词》 (2009年) 中, 均将其命名为桑格-库森法 (Sanger-Coulson method) , 我国很多网站和学术论文将其简称为Sanger测序法.桑格-库森法的定义为以2, 3-双脱氧核苷三磷酸为底物, 快速测定DNA中核苷酸序列的方法[6].该方法的核心原理是因为双脱氧核苷酸 (ddNTP) 的2′和3′上都不含羟基, 使得DNA的合成过程中无法形成磷酸二酯键, 因而将其用以中断DNA合成反应.具体而言就是在4个DNA合成反应体系中, 在DNA模板链上分别加入一定比例的互补参入却不能延伸的4种双脱氧核苷三磷酸ddNTP (ddATP, ddCTP, ddGTP, ddTTP) , 而它们都带有放射性同位素标记, 然后与正常的4种脱氧核苷三磷酸 (dNTP) 竞争, 再通过凝胶电泳和放射自显影的方法, 根据4条泳道上的条带顺序来确定待测分子的DNA序列.
图1 DNA测序技术发展历程
1.2 化学降解法 (Maxam-Gilbert method)
1977年, Maxam等[7]发明了DNA片段序列的测定方法, 即化学降解法.化学降解法与桑格-库森法类似, 其核心原理是首先将1个DNA片段的5′端磷酸基作32P放射性标记, 然后利用特殊试剂降解, 即采用不同的化学方法, 修饰、裂解特定碱基, 从而产生一系列长度不一且5′端被标记的DNA片段, 再将这些以特定碱基结尾的片段群, 通过聚丙烯酰胺凝胶电泳进行片段分离, 并采用放射性自显影技术, 判断各片段末端碱基, 读出目的DNA序列[8,9].
1.3 第一代测序技术的应用与发展
迄今为止, 人类获得的绝大部分DNA序列都是基于桑格-库森法获得的[10], 它与化学降解法的应用, 带来了DNA测序技术的快速发展:1986年, 美国应用生物系统公司 (Applied Biosystems Inc, ABI) 推出的第一代商用ABI 370A测序仪可在双脱氧核苷酸上直接标记不同颜色荧光基团;1998年, ABI采用其开发的毛细管凝胶电泳技术, 推出的ABI Prism 3700毛细管测序仪可同时进行96个并行测序反应, 真正实现了测序规模化[11,12];ABI Prism 3730是ABI Prism 3700基础上发展而来的, 至今仍是第一代测序的主力机型, 也常用于验证其他新测序设备的准确性.在这一时期, 还出现了诸如焦磷酸测序法、链接酶法等其他测序技术.
毛细管电泳测序方法的出现与应用, 促进了人类基因组计划的完成.1985年, 美国科学家提出人类基因组计划, 于1990年正式启动, 测定了人类染色体的30亿个碱基对组成的核苷酸序列, 绘制了人类基因组图谱, 并且识别其载有的基因及其序列信息, 达到破译人类基因遗传密码的最终目的[13].截止到2005年, 人体全序列的基因测定工作已经完成[14,15].整个计划历时15a, 其中中国、美国、英国、法国、德国和日本6个国家的科学家共同参与了这一预算达30亿美元的人类基因组计划, 而人类基因序列图则己成为全人类共同的财富[16].该项目的完成标志着分子医学时代的到来, 也开启了人类基因组测序的新时代.
2 第二代DNA测序技术
尽管第一代DNA测序技术以其可达1 000bp的测序读长、99.999%的高准确性帮助人们完成了大量的测序工作, 但其测试速度慢、成本高、通量低等方面的不足, 也致使其不能得到大众化的应用.随着科学技术的进步以及科研人员对测序技术的努力开发, 2005年Roche公司发布的454测序系统标志着测序技术跨入高通量并行测序的时代.第二代DNA测序技术又称次世代测序技术 (next generation sequencing, NGS) 、大量并行测序技术 (massive parallel sequencing, MPS) 、高通量测序技术 (high-throughput sequencing, HTS) , 以低成本、99%以上的准确度, 1次可对几百、几千个样本的几十万至几百万条DNA分子同时进行快速测序分析.这一时期的代表技术有Roche公司的454、Illumina公司的Solexa、ABI公司的SOLID, 由于该时期的测序技术十分前沿, 因而市场主要被这3家公司所垄断.
2.1 Roche 454测序技术
2005年, 美国的罗氏 (Roche) 公司利用焦磷酸测序法研发出不同于第一代的测序技术, 即454测序技术.这项技术的核心原理是依靠生物发光技术对DNA序列进行分析, 在DNA聚合酶、ATP硫酸化酶、荧光素酶和双磷酸酶的协同作用下, 将引物上的dNTP聚合与1次荧光信号释放偶联起来, 通过检测荧光信号的强度, 达到实时测定DNA序列的目的.其测序步骤是利用喷雾法把待测的DNA样本主要打断成300~800bp长的序列片段后构建测序文库、微乳液PCR的扩增及测序分析[17].454测序系统是第一个被商业化的平台, 但随着测序技术的进步, 罗氏公司已宣布454焦磷酸测序仪退出市场.
2.2 Illumina Solexa测序技术
2006年, Solexa公司发明了Solexa测序技术, 后被美国的Illumina公司收购.Solexa测序技术基于高密度的单分子阵列进行序列测定, 其步骤是:1) 首先用超声或氮气等方法将DNA随机打断成100~200bp片段, 再在两端加上通用接头, 然后进行PCR扩增, 构建ssDNA文库;2) 将接好接头的待测DNA片段放入含有基片的流通池内, 片段的另一端因随机与附近的另一接头序列互补而被固定, 使得打断的DNA片段两端固定在基片上, 形成桥状结构, 即桥式扩增;3) 在8个微流道的测序芯片上进行测序, 可以重复几十个循环[18,19].
2.3 ABI SOLID测序技术
2007年, 美国应用生物系统公司基于连接酶法开发了SOLID测序技术, 并将其用于商业测序.SOLID测序技术以连接酶的连接反应取代聚合酶的聚合反应, 并采用双碱基编码的方式获取DNA序列信息.其测序步骤是:1) 将基因组DNA打断成100~200bp片段, 在片段两端加上测序接头, 构建单链DNA文库;2) 微乳液PCR的扩增, 其过程与454测序方法类似, 只是测试模板微球更小, 仅1μm;3) 加入连接酶进行连接测序[20,21].
2.4 三种测序技术的比较
以上三种测序技术的特征、成本及特点见表1.
表1 第二代DNA典型测序技术的特征、成本及特点
2.5 第二代测序技术的应用与发展
继三种典型测序技术之后, 有了新的发展, 先后出现了Ion Torrent、Heliscope、Nanopore、SMRT、Ion PGM、GeXp等第二代、第三代测序技术.这些技术的开发与应用极大地加速了基因组重测序、宏基因组测序、DNA甲基化测序、转录组测序、目标基因组区域再测序、基因的表观遗传修饰检测、微生物检测等领域的研究工作, 解决了第一代测序技术无法大规模进行试验的现实问题.
3 第三代DNA测序技术
近年来, 为了更加精确与高效地挖掘DNA序列信息, 科研人员研究、开发出第三代测序技术, 即单分子测序 (single molecule sequencing) 技术.这项技术与前两代技术不同的是测序时不需要进行PCR扩增, 而是基于单分子水平的边合成边测序思想, 实现了对每一条DNA分子的单独测序.目前其测序技术原理主要分为两大类:1) 单分子荧光测序[22], 以Helisope Bioscience公司的SMS技术、Pacfic Bioscience公司的SMRT技术为代表, 用荧光标记脱氧核苷酸进行探测, 用显微镜观测、记录荧光强度的实时变化;2) 纳米孔测序[23], 以英国牛津纳米孔公司为代表, 利用直径非常细小的纳米孔, 根据不同碱基产生的电信号的差异进行测序.
第三代DNA测序技术相较于前两代测序技术, 具有超长读长、运行快、无需模板扩增、直接检测表观修饰位点等特点, 主要用于基因组测序、甲基化研究、突变鉴定 (SNP检测) 等方面.第三代测序技术的优点是巨大而不可比拟的, 但该代技术尚处于发展阶段, 还未成熟和多元化, 测序精度还低于前两代技术, 用于商业化的测序仪相对较少.
4 结语
第一代DNA测序技术的产生宣示了划时代的生命科学研究的到来, 其高准确性的特点使其至今仍然被应用;第二代DNA测序技术具有速度快、成本低、通量高等优点, 是目前最为成熟、应用最为广泛的技术, 其发展给生命科学领域的研究带来了空前的进步, 但也存在所测DNA长度较短的问题, 需要第一代测序技术的佐证;第三代技术大幅降低了测序费用, 是未来的发展方向.从三代DNA测序技术的发展与应用可知, DNA测序技术的产生与快速发展为生命科学研究带来了革命性的改变, 可以一次性对某个物种的DNA到RNA的遗传信息进行全貌解析, 使得人类知晓并掌握自身的全基因组序列, 以及水稻、小麦、家蚕等其他物种的基因序列, 甚至包括细菌的基因序列.同时, SNP的大量存在, 也使人们认识到人类基因组图谱并不是独一无二的, 每个人的独特图谱是实际存在的.因而, 如何快速、经济、高通量、高精确性地探明一段DNA序列所代表的生物学意义, 使人类对自然和自身的认知进入到新的科学层面, 则成为科研人员的孜孜不倦的追求目标.
参考文献:
[1]WATSON J D, CRICK F H C.A Structure for deoxyribose nucleic acid[J].Nature, 1953, 171:737-738.
[2]赵坤.面向新一代测序技术的基因拼接算法[D].济南:山东大学, 2015.
[3] 喻秋霞.基于二代测序靶向捕获技术准确检测地中海贫血珠蛋白基因变异[D].广州:南方医科大学, 2013.
[4]WHITFELD P R.A Method for the determination of nucleotide sequence in polyribonucleotides[J].Biochemical Journal, 1954, 58 (3) :390-396.
[5]SANGER F, NICKLEN S, COULSON A R.DNA sequencing with chain-terminating inhibitors[J].Biotechnology, 1977, 24 (12) :104-108.
[6]王海.高通量测序技术新名词的理解和辨析[J].中国科技术语, 2017, 19 (4) :51-54.
[7]MAXAM A M, GILBERT W A.A new method for sequencing DNA[J].Proceedings of the National Academy of Sciences, 1977, 74 (2) :560-564.
[8]毛亚文, 陈江华.DNA测序技术的发展进程[J].亚热带植物科学2018, 47 (1) :94-100.
[9]HEATHER J M, CHAIN B.The sequence of sequencers:The history of sequencing DNA[J].Genomics, 2016, 107 (1) :1-8.
[10]毛舒燕, 梁婧文.测序技术发展状况及相关专利分析[J].中国医药生物技术, 2015 (3) :271-276.
[11]PROBER J M, TRAINOR G L, DAM R J, et al.A system for rapid DNA sequencing with fluorescent chain-terminating dideoxynucleotides[J].Science, 1987, 238 (4825) :336.
[12]VALENCIA C A, PERVAIZ M A, HUSAMI A, et al.A survey of next-generation-sequencing technologies[M].New York:Springer New York, 2013:13-24.
[13]WATSON J D.The Human genome project-past, present, and future[J].Science, I990, 248 (4951) :44-49.
[14]MIKLOS G L G.The Human cancer genome project-one more misstep in the war on cancer[J].Nature Biotechnology, 2005, 23 (5) :535-537.
[15]CREAGER A N H.Drawing the map of life inside the human genome project[J].Science, 2010, 329 (5988) :143-144.
[16]EVANS J P.The Human Genome project at 10years:ateachable moment[J].Genetics in Medicine, 2010, 12 (8) :477-477.
[17] 杨耀.基于高通量测序技术的全基因组甲基化研究[D].南京:东南大学, 2010.
[18]FULLER C W, MIDDENDORF L R, BENNER S A, et al.The challenges of sequencing by synthesis[J].Nature Biotechnology, 2009, 27 (11) :1013.
[19]WALLA P J.DNA sequencing and next-generation sequencing methods[M]//Moden Biophysical Chemistry:Detection and Analysis of Biomolecules.Wiley-VCH Verlag GmbH&Co.KGaA, 2014.
[20]VOELKERDING K V, DAMES S A, DURTSCHI J D.Next-generation sequencing:from basic research to diagnostics[J].Clinical Chemistry, 2009, 55 (4) :641-658.
[21]YEGNASUBRAMANIAN S.Chapter fifteen-preparation of fragment libraries for next-generation sequencing on the applied biosystems SOLiD platform[J].Methods in Enzymology, 2013, 529:185-200.
[22]MUNROE D J, HARRIS T J.Third-generation sequencing fireworks at Marco Island[J].Nature Biotechnology, 2010, 28 (5) :426.
[23]EISENSTEIN M.Oxford Nanopore announcement sets sequencing sector abuzz[J].Nature Biotechnology, 2012, 30 (4) :295-296.