高通量测序:第二代测序技术详细介绍.doc

上传人:韩长文 文档编号:6301108 上传时间:2020-10-22 格式:DOC 页数:9 大小:1.37MB
返回 下载 相关 举报
高通量测序:第二代测序技术详细介绍.doc_第1页
第1页 / 共9页
高通量测序:第二代测序技术详细介绍.doc_第2页
第2页 / 共9页
高通量测序:第二代测序技术详细介绍.doc_第3页
第3页 / 共9页
高通量测序:第二代测序技术详细介绍.doc_第4页
第4页 / 共9页
高通量测序:第二代测序技术详细介绍.doc_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《高通量测序:第二代测序技术详细介绍.doc》由会员分享,可在线阅读,更多相关《高通量测序:第二代测序技术详细介绍.doc(9页珍藏版)》请在三一文库上搜索。

1、.在过去几年里,新一代DNA 测序技术平台在那些大型测序实验室中迅猛发展,各种新技术 犹如雨后春笋般涌现。之所以将它们称之为新一代测序技术(next-generation sequencing), 是相对于传统Sanger 测序而言的。Sanger 测序法一直以来因可靠、准确,可以产生长的 读长而被广泛应用,但是它的致命缺陷是相当慢。十三年,一个人类基因组,这显然不是理 想的速度,我们需要更高通量的测序平台。此时,新一代测序技术应运而生,它们利用大量 并行处理的能力读取多个短DNA 片段,然后拼接成一幅完整的图画。 Sanger 测序大家都比较了解,是先将基因组DNA 片断 化,然后克隆到质粒

2、载体上,再转化大肠杆菌。对于每个测序反应,挑出单克隆,并纯化质 粒DNA。每个循环测序反应产生以ddNTP 终止的,荧光标记的产物梯度,在测序仪的96 或384 毛细管中进行高分辨率的电泳分离。当不同分子量的荧光标记片断通过检测器时, 四通道发射光谱就构成了测序轨迹。 在新一代测序技术中,片断化的基因组DNA 两侧连上接头,随后运用不同的步骤来产生几 百万个空间固定的PCR 克隆阵列(polony)。每个克隆由单个文库片段的多个拷贝组成。之后进行引物杂交和酶延伸反应。由于所有的克隆都是系在同一平面上,这些反应就能够大 规模平行进行。同样地,每个延伸所掺入的荧光标记的成像检测也能同时进行,来获取

3、测序 数据。酶拷问和成像的持续反复构成了相邻的测序阅读片段。 精品.Solexa 高通量测序原理 -采用大规模并行合成测序法(SBS, Sequencing-By-Synthesis)和可逆性末端终结技术(Reversible Terminator Chemistry)-可减少因二级结构造成的一段区域的缺失。-具有高精确度、高通量、高灵敏度和低成本等突出优势-可以同时完成传统基因组学研究(测序和注释)以及功能基因组学(基因表达及调控,基因功能,蛋白/核酸相互作用)研究-将接头连接到片段上,经 PCR 扩增后制成 Library 。-随后在含有接头(单链引物)的芯片( flow cell )上将

4、已加入接头的 DNA 片段变成单链后通过与单链引物互补配对绑定在芯片上,另一端和附近的另外一个引物互补也被固定,形成“桥”-经30伦扩增反应,形成单克隆DNA簇-边合成边测序(Sequencing By Synthesis)的原理,加入改造过的DNA 聚合酶和带有4 种荧光标记的dNTP。 这些dNTP是“可逆终止子”,其3羟基末端带有可化学切割的基团,使得每个循环只能掺入单个碱基。此时,用激光扫描反应板表面,读取每条模板序列第一轮反应所聚合上去的核苷酸种类。之后,将这些基团化学切割,恢复3端粘性,继续聚合第二个核苷酸。如此继续下去,直到每条模板序列都完全被聚合为双链。这样,统计每轮收集到的荧

5、光信号结果,就可以得知每个模板DNA 片段的序列。目前的配对末端读长可达到250 bp,更长的读长也能实现,但错误率会增高。读长会受到多个引起信号衰减的因素所影响,如荧光标记的不完全切割。精品.Roche 454 测序技术“一个片段 = 一个磁珠 = 一条读长(One fragment =One bead = One read)”1)样品输入并片段化:GS FLX 系统支持各种不同来源的样品,包括基因组DNA、PCR产物、BAC、cDNA、小分子RNA 等等。大的样品例如基因组DNA 或者BAC 等被打断成300800 bp 的片段;对于小分子的非编码RNA 或者PCR 扩增产物,这一步则不需

6、要。短的PCR 产物则可以直接跳到步骤3)。2)文库制备:借助一系列标准的分子生物学技术,将A 和B 接头(3和5端具有特异性)连接到DNA 片段上。接头也将用于后续的纯化,扩增和测序步骤。具有A、B 接头的单链DNA 片段组成了样品文库。3)一个DNA 片段一个磁珠:单链DNA 文库被固定在特别设计的DNA 捕获磁珠上。每一个磁珠携带了一个独特的单链DNA 片段。磁珠结合的文库被扩增试剂乳化,形成油包水的混合物,这样就形成了只包含一个磁珠和一个独特片段的微反应器。4)乳液PCR 扩增:每个独特的片段在自己的微反应器里进行独立的扩增,而没有其他的竞争性或者污染性序列的影响。整个片段文库的扩增平

7、行进行。对于每一个片段而言,扩增后产生了几百万个相同的拷贝。随后,乳液混合物被打破,扩增的片段仍然结合在磁珠上。5)一个磁珠一条读长:携带DNA 的捕获磁珠随后放入PTP 板中进行后继的测序。PTP 孔的直径(29um)只能容纳一个磁珠(20um)。然后将PTP 板放置在GS FLX 中,测序 开始。放置在四个单独的试剂瓶里的四种碱基,依照T、A、C、G 的顺序依次循环进入PTP 板,每次只进入一个碱基。如果发生碱基配对,就会释放一个焦磷酸。这个焦磷酸在ATP 硫酸化酶和萤光素酶的作用下,经过一个合成反应和一个化学发光反应,最终将萤光素氧化 成氧化萤光素,同时释放出光信号。此反应释放出的光信号

8、实时被仪器配置的高灵敏度CCD 捕获到。有一个碱基和测序模板进行配对,就会捕获到一分子的光信号;由此一一对应,就 可以准确、快速地确定待测模板的碱基序列。这也就是大名鼎鼎的焦磷酸测序。 精品.6)数据分析:GS FLX 系统在10 小时的运行当中可获得100 多万个读长,读取超过4-6 亿个碱基信息。GS FLX 系统提供两种不同的生物信息学工具对测序数据进行分析,适用 于不同的应用:达400 MB 的从头拼接和任何大小基因组的重测序。 GS FLX 系统的准确率在99%以上。其主要限制来自同聚物,也就是相同碱基的连续掺入, 如AAA 或GGG。由于没有终止元件来阻止单个循环的连续掺入,同聚物

9、的长度就需要从 信号强度中推断出来。这个过程就可能产生误差。因此,454 测序平台的主要错误类型是插 入-缺失,而不是替换。 ABI SOLID 测序技术a. 文库制备 SOLiD 系统能支持两种测序模板:片段文库(fragment library)或配对末端文库(mate-paired library)。使用哪一种文库取决于你的应用及需要的信息。片段文库就是将基因组DNA 打断, 两头加上接头,制成文库。如果你想要做转录组测序、RNA 定量、miRNA 探索、重测序、 3, 5-RACE、甲基化分析、ChIP 测序等,就可以用它。如果你的应用是全基因组测序、SNP 分析、结构重排/拷贝数,则

10、需要用配对末端文库。配对末端文库是将基因组DNA 打断后, 与中间接头连接,再环化,然后用EcoP15 酶切,使中间接头两端各有27bp 的碱基,再加 上两端的接头,形成文库。 b. 乳液PCR/微珠富集 在微反应器中加入测序模板、PCR 反应元件、微珠和引物,进行乳液PCR(Emulsion PCR)。 PCR 完成之后,变性模板,富集带有延伸模板的微珠,去除多余的微珠。微珠上的模板经 过3修饰,可以与玻片共价结合。看到这里,是不是有一种似曾相识的感觉呢?那就对了, 此步骤与454 的GS FLX 基本相同。不过SOLiD 系统的微珠要小得多,只有1 um。 乳液PCR 最大的特点是可以形成

11、数目庞大的独立反应空间以进行DNA 扩增。其关键技术 是“注水到油”,基本过程是在PCR 反应前,将包含PCR 所有反应成分的水溶液注入到高速 旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。这些小水滴就构成了独 立的PCR 反应空间。理想状态下,每个小水滴只含一个DNA 模板和一个P1 磁珠,由于水 相中的P2 引物和磁珠表面的P1 引物所介导的PCR 反应,这个DNA 模板的拷贝数量呈指 数级增加,PCR 反应结束后,P1 磁珠表面就固定有拷贝数目巨大的同来源DNA 模板扩增 产物。 精品.c. 微珠沉积 3修饰的微珠沉积在一块玻片上。在微珠上样的过程中,沉积小室将每张玻片分成

12、1 个、4 个或8 个测序区域。SOLiD 系统最大的优点就是每张玻片能容纳更高密度的微珠,在同一 系统中轻松实现更高的通量。 d. 连接测序 这一步可就是SOLiD 的独门秘笈了。它的独特之处在于没有采用惯常的聚合酶,而用了连 接酶。SOLiD 连接反应的底物是8 碱基单链荧光探针混合物。连接反应中,这些探针按照 碱基互补规则与单链DNA 模板链配对。探针的5末端分别标记了CY5、Texas Red、CY3、 6-FAM 这4 种颜色的荧光染料。探针3端15 位为随机碱基,可以是ATCG四种碱基中 的任何一种碱基,其中第1、2 位构成的碱基对是表征探针染料类型的编码区,下图的双碱基编码矩阵规

13、定了该编码区16 种碱基对和4 种探针颜色的对应关系,而35 位的“n”表示随机碱基,68 位的“z”指的是可以和任何碱基配对的特殊碱基。 单向SOLiD 测序包括五轮测序反应,每轮测序反应含有多次连接反应。第一轮测序的第一 次连接反应由连接引物“n”介导,由于每个磁珠只含有均质单链DNA 模板,所以这次连接反 应掺入一种8 碱基荧光探针,SOLiD 测序仪记录下探针第1、2 位编码区颜色信息,随后的 化学处理断裂探针3端第5、6 位碱基间的化学键,并除去68 位碱基及5末端荧光基团, 暴露探针第5 位碱基5磷酸,为下一次连接反应作准备。因为第一次连接反应使合成链多 了5 个碱基,所以第二次连

14、接反应得到模板上第6、7 位碱基序列的颜色信息,而第三次连 接反应得到的是第11、12 位碱基序列的颜色信息 精品.几个循环之后,引物重置,开始第二轮的测序。由于第二轮连接引物n-1 比第一轮错开一位, 所以第二轮得到以0,1 位起始的若干碱基对的颜色信息。五轮测序反应反应后,按照第0、 1 位,第1、2 位. 的顺序把对应于模板序列的颜色信息连起来,就得到由“0,1,2,3” 组成的SOLiD 原始颜色序列。 e. 数据分析SOLiD 测序完成后,获得了由颜色编码组成的SOLiD 原始序列。理论上来说,按照“双碱基 编码矩阵”,只要知道所测DNA 序列中任何一个位置的碱基类型,就可以将SOL

15、iD 原始颜 色序列“解码”成碱基序列。但由于双碱基编码规则中双碱基与颜色信息的简并特性(一种颜 色对应4 种碱基对),前面碱基的颜色编码直接影响紧跟其后碱基的解码,所以一个错误 颜色编码就会引起“连锁解码错误”,改变错误颜色编码之后的所有碱基。 和其它所有测序仪一样,测序错误在所难免,关键是对测序错误的评价和后续处理。由于 SOLiD 系统采用了双碱基编码技术,在测序过程中对每个碱基判读两遍,从而减少原始数 据错误,提供内在的校对功能。这样,双保险确保了SOLiD 系统原始碱基数据的准确度大 于99.94%,而在15X 覆盖率时的准确度可以达到99.999%,是目前新一代基因分析技术 中准确

16、度最高的。 为避免“连锁解码错误”的发生,SOLiD 数据分析软件不直接将SOLiD 原始颜色序列解码成 碱基序列,而是依靠reference 序列进行后续数据分析。SOLiD 序列分析软件首先根据“双 碱基编码矩阵”把reference 碱基序列转换成颜色编码序列,然后与SOLiD 原始颜色序列进 行比较,来获得SOLiD 原始颜色序列在reference 的位置,及两者的匹配性信息。Reference 转换而成的颜色编码序列和SOLiD 原始序列的不完全匹配主要有两种情况:精品.“单颜色不匹配” 和“两连续颜色不匹配”。由于每个碱基都被独立地检测两次,且SNP 位点将改变连续的两 个颜色编码,所以一般情况下SOLiD 将单颜色不匹配处理成测序错误,这样一来,SOLiD 分析软件就完成了该测序错误的自动校正;而连续两颜色不匹配也可能是连续的两次测序错 误,SOLiD 分析软件将综合考虑该位置颜色序列的一致性及质量值来判断该位点是否为 SNP。 如有侵权请联系告知删除,感谢你们的配合!精品

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 科普知识


经营许可证编号:宁ICP备18001539号-1