03物理图谱与测序.ppt

上传人:本田雅阁 文档编号:2085981 上传时间:2019-02-11 格式:PPT 页数:173 大小:15.23MB
返回 下载 相关 举报
03物理图谱与测序.ppt_第1页
第1页 / 共173页
03物理图谱与测序.ppt_第2页
第2页 / 共173页
03物理图谱与测序.ppt_第3页
第3页 / 共173页
亲,该文档总共173页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《03物理图谱与测序.ppt》由会员分享,可在线阅读,更多相关《03物理图谱与测序.ppt(173页珍藏版)》请在三一文库上搜索。

1、第三章 DNA物理图谱的构建及序列测定,物理图谱(physical map),物理图/限制性图谱(restriction map)是各种限制性内切酶切点在某一DNA分子或DNA片段上的排列,由于各酶切点之间的距离是以碱基对(kbp mbp)表示的,所以可计算出二切点间的绝对距离,因此限制图也称物理图。物理图谱的构建是基因组研究的重要组成部分。,质粒pBR322的限制图,一、限制性核酸内切酶(restriction endonuclease),细菌核酸内切酶 识别、剪切特殊双链DNA序列 用途:DNA物理图谱构建、DNA序列分析、基因分离、基因定位、DNA重组,1.细菌的修饰作用和限制性核酸内切

2、酶的发现,20世纪50年代,Luria &Human、Bertani &Weigle: 噬菌体 细菌菌株1,正常生长。 细菌菌株2,生长受到强烈抑制;少数存 活,再次感染菌株2,正常生长受到 宿主的特意修饰。机制? 老虎机与破碎的试管,Luria,寄主控制的专一性(host controlled specificity) 几乎所有研究噬菌体的科学家都将之视为一种有趣但似乎没有什么意义的现象而忽略了。,1962,Arber(瑞士 ):宿主的修饰在噬菌体DNA上进行 1965,Arber:宿主所致的限制现象中伴随有噬箘体DNA的大量降解,宿主对入侵噬菌体的修饰与噬菌体DNA降解密切相关;预言细菌中

3、存在位点特异性限制酶;修饰是宿主甲基化酶作用结果:建立细菌限制-修饰(R-M)系统概念 如何分离酶?,Arber假说,细菌中存在具有相同位点特异性的 2种酶 :限制性内切核酸酶;甲基化酶细菌利用限制酶特异性识别、降解噬菌体DNA;细菌自身DNA分子通过甲基化修饰酶进行甲基化修饰保护,阻止限制酶的作用。 细菌的限制-修饰系统是抵御外来侵袭的一种重要措施 1978年诺贝尔生理学或医学奖,限制性核酸内切酶的发现,1968年,Linn & Arber于大肠杆菌B中发现第一种限制性内切核酸酶(I型:识别特异剪切随机)。 1968年,Meselson & Yuan从大肠杆菌K中获得高纯度限制性内切核酸酶(

4、I型)。 识别DNA序列上特定的位点,但其切断DNA分子时,却具有很大的随机性;兼具修饰功能,活性依赖一种小分子S-腺苷甲硫氨酸 Meselson错失诺贝尔奖,1970年,研究有关流感嗜血杆菌的遗传重组问题,噬菌体P22的DNA加入到嗜血杆菌的提取液中,DNA消失了 Smith从流感嗜血杆菌Rd中分离出第一种II型限制性内切核酸酶Hind II。 与Arber共享1978年诺贝尔生理学或医学,流感嗜血杆菌 (Haemophilus influenzae)能迅速降解外源的噬菌体 DNA ,其细胞提取液可降解 E.coli DNA ,但不能降解自身 DNA , Hind 限制性内切酶。 Hind

5、限制性内切酶位点和切割位点如下: 5 GTPy PuAC 3 3 CAPu PyTG 5 ,上世纪80年代,限制性内切酶开始克隆表达,限制-修饰系统,Smith等的工作,流感嗜血杆菌Rd与其它细菌相似DNA甲基化程度低: m5C,N6-mA;但存在甲基化酶 细胞粗提物磷酸纤维素层析蛋白; * S-腺苷甲硫氨酸转移甲基鱼精DNA/T7DNA。检测出4种腺嘌呤甲基化酶 其中一种处理T7DNA 免受Hind II裂解;先用Hind II处理鱼精DNA 对应甲基化位点破坏。限制性内切酶-修饰性甲基化酶共识别位点 限制性内切酶识别位点处的甲基基团伸入到双螺旋的大沟中去,阻碍了限制性内切酶的作用。,磷酸纤

6、维素层析阳离子交换层析,氨基酸的等点点(isoelectric point,pI),在一定的pH条件下,氨基酸分子中所带的正电荷和负电荷数相等,即净电荷为零,此时溶液的pH称为该氨基酸的等电点(isoelectric point, pI) 。 氨基酸在等电点时溶解度最小。,正离子 pHpI,两性离子 pH=pI,负离子 pHpI,离子交换层析分离蛋白质,甲基转移酶催化甲基化(methylation),甲基供体: S-腺苷甲硫氨酸 甲基受体:被修饰碱基(A、C多于G、T) 碱基的甲基化修饰不是随机的,而是限于一定的顺序或DNA的某一区域,在甲基化酶的作用下进行,甲基化是可逆的。 甲基化的意义:帮

7、助细胞识别和区分自身DNA和外来DNA;调节基因表达;帮助DNA修复等。,腺苷转移酶,PPi+Pi,+,甲硫氨酸,ATP,S-腺苷甲硫氨酸 (S-腺苷Met,SAM),S-腺苷甲硫氨酸,甲基转移酶,RH,RCH3,腺苷,SAM,S腺苷同型半胱氨酸,同型半胱氨酸,SAM为体内甲基的直接供体,H2O,腺苷或胞嘧啶的甲基化是多种细菌的限制修饰系统的一部份,真核生物中也存在广泛的DNA甲基化修饰现象,哺乳动物DNA的甲基化修饰和X染色体失活、胚胎发育、组织分化乃至癌症密切相关。 真核生物,修饰则影响基因表达。大多数情况下,甲基化修饰导致基因表达沉默。并且这种修饰在细胞有丝分裂时可以代代传递。 新的遗传

8、学分枝-表观遗传学,2. 限制性内切酶的种类与特性,限制性内切酶形式多样 大小:Pvu II(157个氨基酸); Cje I (1250个氨基酸)。 纯化分类的3000余种限制性内切酶,超过250种特异识别序列。 研发工作仍在继续:分析细胞提取物,计算机分析已知基因组数据。 同裂酶(识别序列与已有的重复);新识别位点,传统上将限制性内切酶按照亚基组成、酶切位置、识别位点、辅助因子等因素划分为三大类。然而,蛋白测序的结果表明,限制性内切酶的变化多种多样,若从分子水平上分类,则应当远远不止这三种。,I型限制性内切酶,兼有限制性内切酶和修饰酶活性的多亚基蛋白复合体(3x105-4x105Da),需M

9、g2+、ATP、SAM。 在识别位点很远的地方任意切割DNA链:EcoB 识别位点TGA*(N)8TGCT ;EcoK 识别位点AAC(N)6GTGC ( A 为可能的甲基化位点, N 表示任意碱基) 。切割位点在识别位点 1000bp 以外,且无特异性。 不产生确定的限制片段,不具备实用性。,II型限制性内切酶,种类多(2x104-10x104),需Mg2+激活 绝大多数酶识别序列/切割位点由48个核苷酸 多以同二聚体结合于DNA,识别对称序列 ;极少作为单聚体结合到DNA上,识别非对称序列 。 一些酶识别连续序列(EcoR I:GAATTC);另一些识别不连续序列(Bgl I:GCCNNN

10、NNGGC)。 切割后产生一个3羟基端和一个5磷酸基团 。 相应的修饰酶需要S-甲硫氨酸腺苷的存在。,IIS型限制性内切酶, 型具有相似的辅因子要求,但识别位点是非对称,也是非间断的,长度为 4-7bp ,切割位点可能在识别位点一侧的 20bp 范围内(如Fok I和Alw I )。,III型限制性内切酶,兼有限制-修饰两种功能,需Mg2+、ATP;当ATP、SAM同在时,DNA分解与甲基化同时进行 识别位点之外切开DNA链:EcoP1 和 EcoP15 识别位点分别是 AGACC 和 CAGCAG ,切割位点则在下游 24-26bp 处。 很少能产生完全切割的片段,不具备实用价值。,3.识别

11、位点的序列测定,1970年,Smith建立: 碱性磷酸酶(Alkaline phosphatase) T4多聚核苷酸激酶(T4 Polynucleotide Kinase ) 胰腺脱氧核糖核酸酶(DNase I) 蛇毒磷酸二酯酶(snake venom phosphodiesterase ) 电泳,碱性磷酸酶,T4多聚核苷酸激酶,T4 多核苷酸激酶是一种磷酸化酶,可将 ATP 的 g-磷酸基转移至 DNA 或 RNA 的 5 末端。,牛胰脱氧核糖核酸酶(DNase I),嘧啶 嘌呤,嘧啶 嘌呤,蛇毒磷酸二酯酶,基本过程,限制酶裂解33P-T7DNA 32P标记5端(碱性磷酸酶,T4激酶) DN

12、aseI消化 电泳分离双标记片段 蛇毒磷酸二酯酶水解核苷酸 鉴定,4.影响限制性内切酶活性的因素,*DNA纯度 DNA制备过程中的污染:蛋白质、酚、氯仿、酒精、乙二胺四乙酸(EDTA)、SDS(十二烷基硫酸钠)、高浓度的盐离子等,都有可能抑制核酸内切限制酶的活性。 对策: 增加核酸内切限制酶的用量,平均每微克底物DNA可高达10单位甚至更多。 扩大酶催化反应的体积,以使潜在的抑制因素被相应地稀释。 延长酶催化反应的保温时间。,内切酶活力单位,1U定义为37、1h内完全分解1g -DNA所需的酶量。 理论用量: 1g -DNA只需1U酶作用1h;实际用量:2U,2h 样品含酶抑制剂,重新纯化 限

13、量用酶非特异性核酸酶活性 Dnase的污染(活性需Mg 2+,DNA储存缓冲液含EDTA),*DNA甲基化程度,从大肠杆菌中分离的质粒DNA通常混有:dam甲基化酶,G*ATC;dcm甲基化酶,C*CA/TGG 基因克隆中使用失去了甲基化酶的大肠杆菌菌株制备质粒DNA,避免被核酸内切限制酶局部消化,甚至完全不被消化。 核酸内切限制酶不切割甲基化的核苷酸序列的应用:甲基化酶的识别序列同某些限制酶的识别序列相邻,抑制在这些位点发生切割作用,改变核酸内切限制酶识别序列的特异性;通过甲基化作用将内部的限制酶识别位点保护起来。,*酶切消化反应的温度,大多数核酸内切限制酶的标准反应温度都是37,但也有许多

14、例外的情况,例如Sma是25、Mae是45。消化反应的温度低于或高于最适温度,都会影响核酸内切限制酶的活性,甚至最终导致完全失活。,*DNA的分子结构,DNA分子的不同构型对核酸内切限制酶的活性也有很大的影响。某些核酸内切限制酶切割超螺旋的质粒DNA或病毒DNA所需要的酶量,要比消化线性DNA的高出许多倍,最高的可达20倍。 此外,还有一些核酸内切限制酶,切割它们自己的处于不同部位的限制位点,其效率亦有明显的差别。 位点偏爱(Site preference),位点偏爱(Site preference),EcoR 酶切割 噬菌体中的 5 个位点时不是随机的,靠近右端的位点比分子中间的位点切割快

15、10 倍; EcoR 和 Hind 在 噬菌体 DNA 中的切割速率分别有 10 倍和 14 倍的差异。 噬菌体 DNA 有 4 个 Sac 位点,三个在中央,一个在右臂,对中央三个位点的酶切速度快 50 倍。 EcoR 对腺病毒 2DNA 不同位置切点的切割速率也不同。,*核酸内切限制酶的缓冲液,核酸内切限制酶的标准缓冲液的组份包括氯化镁、氯化钠或氯化钾、Tris-HCl、-巯基乙醇或二硫苏糖醇(DTT)以及牛血清白蛋白(BSA)等。 Mg2+的作用是提供二价的阳离子。缓冲液Tris-HCl使反应混合物的pH恒定在酶活性所要求的最佳数值的范围之内。巯基试剂对于保持某些核酸内切限制酶的稳定性是

16、有用的,而且还可保护其免于失活。,不同的酶对离子强度的要求差异很大,并依次将限制酶缓冲液按离子强度的差异分为高、中、低三种类型,离子强度以 NaCl 来满足,浓度分别为 100mM 、50mM 和 0mM 。,NEBuffer 1(黄色): 10 mM Bis Tris 丙烷-HCl, 10 mM MgCl2, 1 mM DTT(pH 7.0 25)。 NEBuffer 2(蓝色): 10 mM Tris-HCl, 10 mM MgCl2, 50 mM NaCl, 1 mM DTT(pH 7.9 25)。 NEBuffer 3(红色): 50 mM Tris-HCl, 10 mM MgCl2,

17、 100 mM NaCl, 1 mM DTT(pH 7.9 25)。 NEBuffer 4(绿色): 20 mM Tris-Ac, 10 mM Mg(Ac)2, 50 mM KAc, 1 mM DTT(pH 7.9 25)。,宝生物公司缓冲液,特殊缓冲液: NEBuffer EcoRI: 50 mM NaCl, 100 mM Tris-HCl, 10 mM MgCl2, 0.025% Triton X-100(pH 7.5 25),双酶切缓冲液选择,5.星星活性(star activity),在极端非标准条件下,限制酶能切割与识别序列相似的序列,这个改变的特殊性称星星活性。 引起星星活性的因素

18、:甘油浓度高(5%);酶过量(100U/l);离子强度低(8.0);加入了有机溶剂如 二甲基亚砜、乙醇、乙二醇、二甲基乙酰胺、二甲基甲酰胺等;用其它二价阳离子如 Mn2+ 、Cu2+、Co2+ 或 Zn2+ 代替了 Mg2+ 。不同的酶对上述条件的敏感性不一样,如 Pst 比 EcoR 对高 pH 更敏感,但后者对甘油浓度更敏感。,二、构建物理图谱的克隆载体,构建物理图谱的基本策略:将基因组DNA片段与载体整合进行克隆,获得重叠克隆群。 载体的基本条件:自主复制原点,在宿主高效表达、稳定遗传;单克隆位点;筛选标记,质粒载体,柯斯质粒,粘粒(cosmid)人工构建的含有噬菌体DNA的cos序列和

19、质粒复制子的载体。 cos 序列是 噬菌体 DNA 中将 DNA 包装到噬菌体颗粒中所需的 DNA 序列。 1978年Collins & Hohn等为克隆真核DNA大片段构建(质粒外源基因容量-10Kb) 组成包括质粒复制起点(ColE1)、氨卡青霉素抗性标记、cos位点。,噬菌体基因组,粘粒载体,粘粒的特点,具有噬菌体的特性。粘粒在克隆了外源DNA在体外包装成噬菌体颗粒后,可以感染宿主菌并在细菌内按照噬菌体DNA的方式环化起来。但粘粒载体不含有噬菌体的全部必要基因,因此不会使宿主菌裂解,无法形成子代噬菌体颗粒。 具有质粒的特性。粘粒具有质粒复制子,可在宿主菌内像质粒DNA一样进行复制。 克隆

20、外源DNA的容量大。粘粒自身相对较小,一般只有57kb,而最大的克隆片段可达45 kb左右。 能与有同源序列的质粒进行重组。,粘粒克隆的主要原理,似 噬菌体载体。与外源片段连接时,粘粒载体相当于 噬菌体载体的左右臂, cos 位点经粘端退火,与外源片段相间连接成多联体。多联体与 噬菌体包装蛋白混合时, 噬菌体 A 基因蛋白的末端酶功能将切割两个 cos 位点,并将两个同方向 cos 位点之间的片段包装到 噬菌体颗粒。这些噬菌体颗粒感染大肠杆菌时,线状重组 DNA 被注入细胞并通过 cos 位点环化,形成完整粘粒载体,可象质粒一样复制并使宿主获得抗药性。 与 噬菌体载体不同。外源片段克隆在粘粒载

21、体中以菌落形式表现出来,非噬菌斑。这种菌落总和构成基因文库。 重组粘粒,可经辅助 噬菌体感染或诱导潜伏原噬菌体生长,重组粘粒的 cos 位点可作为包装的底物,导致重组粘粒 DNA 被包装到噬菌体颗粒中去。这些转导性颗粒从细胞中释放出来,既可无限期贮存,也可直接感染其他菌株。,酵母人工染色体 (Yeast artificial chromosomes YAC),利用酿酒酵母(Saccharomyces cerevisiae)的染色体的复制元件构建的载体。 酿酒酵母的形态为扁圆形和卵形,生长的代时为 90 分钟;含 16 条染色体,其大小为 225-1900kb ,总计有14106 bp;具真核

22、mRNA 的加工活性。,人工染色体必备结构元件,自主复制序列(autonomously replication sequences,ARS) :含有酵母菌中 DNA 进行双向复制所必须的信号 ; 着丝粒(centromere,CEN):负责染色体向子细胞的传递; 端粒(telomere,TEL):对染色体DNA末端起保护作用。,YAC 载体pYAC4,YAC 载体的工作原理,YAC 载体主要是用来构建大片段 DNA 文库(高等真核生物的基因组文库),不用作常规基因克隆。 BamH 切割pYAC4形成微型酵母染色体,含染色体复制必要顺式元件,可携带酵母染色体大小的 DNA 片段。 BamH切割后

23、形成的微型酵母染色体,用 EcoR或 Sma 切割抑制基因 sup4 内部位点形成染色体的两条臂,与外源大片段 DNA 相连形成大型人工酵母染色体,转化进入酵母菌后可象染色体一样复制,并随细胞分裂分配到子细胞中去,达到克隆大片段DNA 的目的。 装载外源 DNA 片段的重组子导致抑制基因 sup4 插入失活,形成红色菌落; 载体自连形成白色菌落。装载不同外源 DNA 片段的红色重组酵母菌菌落的群体就构成YAC 文库。 YAC 文库装载的 DNA 片段的大小一般可达 200-500kb,有的可达 1Mb 以上,甚至达到 2Mb 。,YAC 载体的缺陷,存在嵌合现象,即一个YAC克隆中插入子可能来

24、自两个或多个不同片段(嵌合克隆约占总克隆的 5%50% ) 。 YAC克隆稳定性差,插入片段会出现缺失 (deletion) 和基因重(rearrangement) 的现象。 YAC 染色体与宿主细胞的染色体大小相近, 插入片段的分离、纯化较困难,转化效率亦较低。,细菌人工染色体(BAC),基于大肠杆菌的 F 质粒构建的,高通量低拷贝的质粒载体。 每个环状 DNA 分子中携带一个抗生素抗性标记,一个来源于大肠杆菌 F 因子(致育因子)的严谨型控制的复制子 oriS ( Shizuya et al. 1992 ),一个易于 DNA 复制的由 ATP 驱动的解旋酶( (RepE) 以及三个确保低拷

25、贝质粒精确分配至子代细胞的基因座 ( parA , parB , 和 parC ) 。 BAC 载体的容量100-350Kb,F 质粒,大肠杆菌的 F 因子是一个约 100kb 的质粒。编码60多种参与复制、分配和接合过程的蛋白质(Willetts and Skurray,1987)。虽然F因子通常以双链闭环DNA(1-2个拷贝/细胞)的形式存在,但它可以在大肠杆菌染色体中至少30个位点处进行随机整合(Low,1987)。携带F因子的细胞,或以游离状态或以整合状态表达三根发样状的F菌毛。F菌毛为供体与受体细胞之间产生性接触所必需。,第一代 BAC 载体 (Shizuya et al. 1992

26、) 不含能用于区分携带重组子的抗生素抗性细菌菌落与携带空载体的细菌菌落的标记物。 新型的 BAC 载体可以通过互补的原理筛选含有插入片段的重组子,并设计了用于回收克隆 DNA 的 Not 酶切位点和用于克隆 DNA 测序的 Sp6 启动子、 T7 启动子 (Kim et al. 1996; Asakawa et al. 1997) 。 Not 识别序列,位点十分稀少。重组子通过 Not 消化后,可以得到完整的插入片段。 Sp6 、 T7 是来源于噬菌体的启动子,用于插入片段末端测序。,BAC 载体空载时大小约 7.5kb ,在大肠杆菌中以质粒的形式复制,具有一个氯霉素抗性基因。 外源基因组 D

27、NA 片段可以通过酶切、连接克隆到 BAC 载体多克隆位点上,通过电穿孔的方法将连接产物导入大肠杆菌重组缺陷型菌株。 装载外源 DNA 后的重组质粒通过氯霉素抗性和 Lac Z 基因的 互补筛选。,BAC载体的优点,以大肠杆菌为宿主,电转化,效率高 BAC载体以超螺旋形式存在于大肠杆菌,提取方便; 复制子源自F质粒,遗传稳定,嵌合、重组少; DNA单拷贝存在,适于传统菌落培养,可采用菌落原位杂交筛选目地基因; 克隆位点两侧有T7和SP6启动子,可制备RNA探针或对插入片段测序。,菌落原位杂交筛选目地基因,三、基因组研究的有关图谱,遗传图谱 物理图谱 基因图谱 序列图谱,1.遗传图谱(genet

28、ic map)/遗传连锁图/连锁图谱(linkage map),显示所知的基因和/或遗传标记的相对位置,而不是在每条染色体上特殊的物理位置。 如果同一条染色体上的两个基因相对距离越长,那么他们减数分裂发生重组的概率将越大,共同遗传的概率也就越小。因此可以根据他们后代性状的分离可以判断他们的交换率,也就可以判断他们在遗传图谱上的相对距离。,以具有遗传多态性(在一个遗传位点上具一个以上的等位基因,在群体中的出现频率皆高于1%)的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1cM)为图距的基因组图。 6000多个遗传标记将人的基因组分成600

29、0多个区域,使连锁分析法可以找到某一致病或表现型的基因与某一标记邻近(紧密连锁)而定位。是定位疾病基因和分析基因是个关键。,遗传图基因的相对定位,遗传标记,有可以识别的标记,才能确定目标的方位及彼此之间的相对位置。 构建遗传图谱就是寻找基因组不同位置上的特征标记。 包括: 形态标记 细胞学标记 生化标记 DNA分子标记,标记具有多态性(polymophism),花色:白色、红色 株高:高、矮 血型:A、B、O型 淀粉:糯、非糯 多态性是基因突变的结果,遗传图谱的 DNA标记,第1代标记:经典的遗传标记,以蛋白质或免疫学多态性位点为标记。标记位点与所研究性状间连锁关系。 ABO血型位点标记,HL

30、A(人类白细胞抗原)位点标记。已知多态性蛋白位点少,技术复杂、准确性差。 70年代,限制性片段长度多态性(RFLP):群体中不同个体DNA序列仅有约1%差异DNA多态性位点,酶切位点的变异(RFLP)。,限制性片段长度多态性,一对等位基因,一个具有某一种酶的酶切位点,而另一个没有,酶切产物DNA片段长度的差异多态性。,第2代标记,80年代,微卫星中心(minisatellite core)、可变串联重复VNTR(variable number of tandem repeats)提供不同长度重复片段(612个核苷酸 1989年微卫星标记(microsatellite marker)系统的发现和

31、建立,结合PCR技术简单序列长度多态性(simple sequence length polymorphism,SSLP) ,扩增片段长度多态性 (Amplified Fragment Length Polymorphism,AFLP)等 。,微卫星(microsatellite)标记,微卫星又称为简单重复序列(simple sequence repeat,SSR)。 这种重复序列的重复单位很短,常常26bp,如(CA)n、(AT)、(GGC)n等重复,重复区大多几十几百bp,分散在基因组中,大多不存在于编码序列内,具有较高的多态性。目前微卫星DNA已经发现了万余个位点。,TTCAGCTAGC

32、TCAGCAGCAGCAGCAGCAGAGCTTGC AAGTCGATCGAGTCGTCGTCGTCGTCGTCTCGAACG,500bp 400bp 300bp 240bp,微卫星DNA PCR扩增结果,该结果显示在所检查的人群中,该位点多态性有4种。,第3代标记,90年代,单核苷酸多态性(single nucleotide polymorphism,SNP):指染色体基因组水平上由单个核苷酸变异引起的DNA序列多态性,具有分布广、密度高(人类基因组中每1000个核苷酸就有一个SNP )、多态性丰富等特点。 不同个体间,基因组DNA某部位的 单核苷酸的变异。,SNP在人类基因组中广泛存在,平

33、均每5001000个碱基对中就有1个,估计其总数可达1700万个甚至更多。,糖尿病基因的个人SNP差别,日本研究人员最近经过研究发现,与糖尿病有关的基因并不是千篇一律,它们之间存在着个人差别,即“单核苷酸多态性”(SNP)。,果蝇连锁图,14号染色体遗传图谱上家系定位示意图,7号染色体上已定位的遗传病,疾病基因的确定,2. 物理图谱,DNA限制性酶切片段排列顺序图 酶切片段在DNA链上的定位 直接检测DNA标记在染色体上的实际位置基因组中基因间顺序显性化 比遗传图谱分辨率更高 是从遗传图到序列图的中间图谱,遗传图谱的缺陷,分别率有限 人类只能研究少数减数分裂事件,不能获得大量子代个体 精确性不

34、够 经典遗传学认为,交换是随机发生的 基因组中有些区域是重组热点 倒位、重复等染色体结构变异会限制交换重组,酵母遗传图与物理图比较,A 遗传图 B 物理图,3.基因图谱,在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。鉴别出全部基因的位置、结构与功能,最主要的方法是通过基因的表达产物mRNA反追到染色体的位置。 能有效地反应在正常或受控条件中表达的全基因组时空图。 可以了解某一基因在不同时间不同组织、不同水平的表达;也可以了解一种组织中不同时间、不同基因中不同水平的表达,还可以了解某一特定时间、不同组织中的不同基因不同水平的表达。,对基因转录表达产

35、物mRNA互补的cDNA(其片段称为表达序列标签,EST)进行大规模测序是序列标签位点的主要来源,并以此构建人类基因组转录图(基因图)。,A portion of the E.coli chromosome showing genes and operons. A dot indicates the promoter for each gene or operon. Arrows and color indicate the direction of transcribtion: dark blue genes are transcribed left to right, light blue

36、 are transcribed right to left.Overlapping gene are shown in green.,4. 序列图谱,包括制备DNA片段化及碱基分析、DNA信息翻译的多阶段的过程。通过测序得到基因组的序列图谱。 大规模测序基本策略: 逐个克隆法:对连续克隆系中排定的BAC克隆逐个进行亚克隆测序并进行组装(公共领域测序计划)。 全基因组鸟枪法:在一定作图信息基础上,不经大片段连续克隆系的构建,直接将基因组分解成小片段随机测序,利用超级计算机进行组装(美国Celera公司)。,四、构建DNA物理图谱的方法,完整的物理图谱包括:人类基因组的不同载体DNA克隆片段重叠

37、群图;大片段限制性内切酶切点图;DNA片段或异DNA序列(sequence tags site,STS)的路标图;基因组中广泛存在的特征型序列(如CpG序列、Alu序列,isochore)等的标记图。 基本原理是把庞大的无从下手的DNA先“敲碎”,再拼接。以Mb、kb、bp作为图距,以DNA探针的STS(sequence tags site)序列为路标。,主要方法,限制性核酸内切酶降解法 部分变性法 DNA聚合酶法 杂交电镜法(环形成法) 末端标记法,1.限制性核酸内切酶降解法,部分酶解法 交叉酶解法,部分酶解法的2个基本步骤,完全降解:限制性内切酶将放射性标记DNA完全降解,经凝胶电泳分离后

38、进行自显影,图谱显示组成该DNA链的酶切片段的数目和大小。 部分降解:末端标记DNA一条链,以相同酶部分降解(控制反应条件使酶量、温度、时间DNA链上该酶的切口随机断裂),电泳分离及自显影。比较2个自显影图谱,根据片段大小及彼此间的差异排出酶切片段在DNA链上的位置片那段重叠。,一线性DNA片断长18.1kb,EcoRI完全消化后电泳,得8个片段,部分消化产生15个片断。,完全消化片断: A (4.6) , B (4.0), C (3.3), D (2.5), E (2.0), F (1.0), G (0.5), H (0.2) 部分消化片断: 6.6 6.5 5.3 4.6 4.2 4.0

39、3.8 3.5 3.3 2.5 2.0 1.0 0.7 0.5 0.2,部分消化大片断是完全消化小片断之和,可推测: 6.6 = 2+4.6(E + A); 6.5 = 2.5+4.0 (D + B); 5.3 = 2+3.3(E + C); 3.8 = 0.5+3.3(G + C); 0.7 = 0.2+0.5(G+H); 4.2 = 0.2+4 (B+H) 或 4.2 =0.2+0.5+1.0+2.5(H + F + G + D); 3.5 =1.02.5 (F + D) 或 3.5 = 0.2+3.3(H + C) 或 3.5 = 0.5+1.0+2.0(G + F + E),A E C

40、 G H F D B,4.6 2.0 3.3 2.5 4.0,0.5 0.2 1.0,EcoR I 在此DNA片段上的酶切图谱,交叉酶解法,DNA片段总长 3kb EcoR: 1.7,0.9,0.4 Hpa: 1.6,1.4 EcoR+ Hpa:1.2 , 0.9 , 0.5 , 0.4,Hpa一个切点 EcoR1.7 kb片段不在末端-无0.2、0.1片段 EcoR 0.9和0.4 kb都在末端,2.部分变性法,DNA分子各区域AT含量不同,部分变性后,富含AT区出现电镜下可见的环状结构。 比较限制酶切DNA部分变性及全分子部分变性结果,确定酶切位点顺序。,3.末端标记法,待测DNA片段的5

41、或3端先用32P标记; 用某限制性内切酶部分酶解; 电泳和放射自显影分析这一组酶解片段的长度。 各相邻片段的长度之差就是二个相邻切点之间的距离,也即它们之间片段的大小。 以足够数量的限制性内切酶分别进行分析,对DNA片段作出比较详细的物理图谱。,G F E D C B A,*,A-G,*,A-F,A-E,A-D,*,A-C,*,A-B,*,A,*,末端标记,*,电泳凝胶上DNA片断的鉴定,人类部分染色体物理图谱,The E.coli genome,五、核酸序列分析,DNA一级结构测定 (DNA sequencing),DNA的一级结构: 多聚脱氧核苷酸链中脱氧核苷酸的排列顺序碱基序列,DNA碱

42、基顺序测定的主要方法,1975年,Sanger 加减法 1977年,Sanger 双脱氧终止法 1977年,Maxam & Gilbert 化学断裂法,1.双脱氧法(dideoxy method)或末端终止法(chain termination),DNA sequencing with chain-terminating inhibitors. Sanger, F. , Nicklen, S. & Coulson, A.R. (1977). Proceedings of the National Academy of Sciences, USA, 74, 5463-7. a second No

43、bel Prize in Chemistry in 1980,DNA的生物合成,参与DNA复制的主要物质 底物: dATP, dGTP, dCTP, dTTP(dNTP) 聚合酶: DNA聚合酶(DNA polymerase) 模板(template): 解开成单链的DNA母链 引物(primer): 互补于模板链的寡核苷酸片段, 提供3-OH末端使dNTP可以依次聚合 子链DNA延长的方向: 53,DNA生物合成的过程,DNA聚合酶催化的反应,双脱氧核苷酸,双脱氧核苷酸的掺入终止DNA链的合成,测序体系,聚丙烯酰胺凝胶电泳检测,变性聚丙烯酰胺凝胶电泳,丙烯酰胺+双丙烯酰胺三维网状孔结构 变性

44、剂: 尿素,电泳装置,放射自显影,利用放射性同位素所发射出来的带电粒子(或粒子)作用于感光材料的卤化银晶体,从而产生潜影,这种潜影可用显影液显示,成为可见的“像“。,2.自动测序,Hood developed a prototype automated DNA sequencer in 1985 Leroy Hood (1938-) earned an M.D. From Johns Hopkins University in 1964 and a Ph.D. in biochemistry from the California Institute of Technology in 1968

45、. He won the 2003 Lemelson-MIT Prize for inventing four instruments: the DNA gene sequence and synthesizer, and the protein synthesizer and sequencer,2004,荧光物质作为标记物,C C G A A T G C T G A C G T A,荧光物质标记双脱氧核苷酸,the Sanger Institute Team 55: Sequencing Facility,3. 碱基序列测定的新方法(“Next generation“ methods),美

46、国国家卫生研究院(NIH)设立 “Revolutionary Genome Sequencing Technologies”基金,目标: 2009年,测定一人全基因组序列只$10万,2014年,费用将降为$1000。 Waston2007年5月31日获赠装有他本人完整基因组图谱数据的DVD光盘。(2个月,$200万) 基因组学先锋J. Craig Venter 、炎黄一号第一个中国人基因组图谱先后完成 2008,首张非洲人全基因组图谱问世 2009,第二个韩国人基因组的测序和注释,目前已完成的完整个人基因组图谱,测序实验流程,高通量,低成本,半自动化 Amersham MegaBACE 100

47、0,全自动化 ABI 3730xl DNA Analyzer,毛细管电泳替代垂直板电泳,Pyrosequencing (焦磷酸测序, Biotage ) 454 Sequencing a brand of sequencing by 454 Life Sciences, that dramatically expands pyrosequencing Sequencing by hybridization Nanopore sequencing Polony sequencing (聚合酶克隆 ),新方法不断涌现,焦磷酸测序基本原理,在每一轮测序反应中,只加入一种dNTP,若该dNTP与模板配

48、对,聚合酶就可以将其掺入到引物链中并释放出等摩尔数的焦磷酸基团(PPi)。 反应体系 :测序引物和单链DNA模板结合,酶混合物(包括DNA Polymerase、ATP Sulfurylase-硫酸化酶 、Luciferase-荧光素酶和Apyrase-三磷酸腺苷双磷酸酶)和底物混合物(包括APS和Luciferin)。,向反应体系中加入1种dNTP,如果它刚好能和DNA模板的下一个碱基配对,则会在DNA 聚合酶的作用下,添加到测序引物的3末端,同时释放出一个分子的焦磷酸(PPi),在ATP硫酸化酶的作用下,生成的PPi可以和APS结合形成ATP;在荧光素酶的催化下,生成的ATP又可以和荧光素结合形成氧化荧光素,同时产生可见光。通过CCD光学系统即可获得一个特异的检测峰,峰值的高低则和相匹配的碱基数成正比。,反应体系中剩余的dNTP和残留的少量ATP在Apyrase的作用下发生降解。,2005年,454公司推出基于焦磷酸测序法的超高通量基因组测序系统Genome Sequencer 20 System,文库制备 :根据样品的种类和实验目的,将基因组DNA/cDNA

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1