2018年分子生物学第1章细胞核基因组课件-文档资料.ppt

上传人:吴起龙 文档编号:1892951 上传时间:2019-01-19 格式:PPT 页数:67 大小:901KB
返回 下载 相关 举报
2018年分子生物学第1章细胞核基因组课件-文档资料.ppt_第1页
第1页 / 共67页
2018年分子生物学第1章细胞核基因组课件-文档资料.ppt_第2页
第2页 / 共67页
2018年分子生物学第1章细胞核基因组课件-文档资料.ppt_第3页
第3页 / 共67页
2018年分子生物学第1章细胞核基因组课件-文档资料.ppt_第4页
第4页 / 共67页
2018年分子生物学第1章细胞核基因组课件-文档资料.ppt_第5页
第5页 / 共67页
点击查看更多>>
资源描述

《2018年分子生物学第1章细胞核基因组课件-文档资料.ppt》由会员分享,可在线阅读,更多相关《2018年分子生物学第1章细胞核基因组课件-文档资料.ppt(67页珍藏版)》请在三一文库上搜索。

1、1.1 核基因组大小,一个物种中所包含的基因就是一个基因组,确切地说,基因组是指一个物种的单倍体的染色体所包含的全部基因。对于只有一个染色体的原核生物来说,它的一个细胞中(一个染色体)的全部基因组成其基因组;对于通常的二倍体生物来说,是指能维持配子或配子体正常功能的最低数目的一套染色体所包含的全部基因。真核生物基因组包括核基因组和细胞器基因组。,衡量基因组大小的单位,一个真核生物的核基因组的大小可以通过化学分析、DNA复性动力学等方法进行测定。如果一个DNA分子(双链)重1pg(1012g),就意味着它长约31cm,含有10 9 bp (base pair,碱基对),分子量为6.11011道尔

2、顿。,C值的概念,一个单倍体基因组的DNA含量是恒定的,它代表着一个生物种的特征,称为物种DNA的C值。C值可以用pg为单位表示,也可以用bp为单位表示。各种生物的C值相差很大,并有随着有机体复杂度增加而C值增大的趋势,说明随着有机体复杂度的增加,对遗传物质DNA量的需要也随之增加。DNA是遗传信息的载体,较复杂的有机体需要较多的遗传信息是好理解的。,表11 一些生物物种的DNA质量,图11 不同有机体的C值大小,C值悖论,一般来说,一种生物的形态学复杂性应该与其C值的大小大致相关,因为一种生物的形态学复杂性必然是它基因复杂性的反映。然而仔细研究有机体复杂度和C值的关系,就会发现难以解释的问题

3、。如人与两栖动物C值的比较。另外,一些密切相关的种属的C值呈现出惊人的差异,如两栖类动物中C值可相差50倍,豆科植物中的蚕豆比百脉根的C值大100倍。只有低等生物的情况符合这种设想。这就是C值悖论。,对基因数目的估计,通过估计不同种类mRNA的数目,可以估计出一个特定哺乳动物细胞中能表达的基因总数约为10,000个,考虑到不同细胞类型有些不同的基因表达,我们可以认为哺乳动物细胞基因组有功能的基因数目在30,00040,000个之间。假设哺乳类基因的平均大小为5,0008,000bp(它们实际上比大多数已知的基因要长些),根据C值计算,哺乳类基因组中的基因数目理论上应在40万60万个之间。,对基

4、因数目的估计,果蝇必需的基因总数约为5000个,由于对昆虫基因大小的合理估计为2,000bp,那么,5,000个基因的总长度为107bp,而果蝇的C值为108bp。这些分析说明,基因组中大部分DNA是不表达的。,DNA变性,在受到加热、高浓度盐处理时,DNA双螺旋碱基配对结合的氢键会断裂,双螺旋链分开成单链,这个过程称为变性(denaturation)或解链作用(melting)。,DNA的热变性,增色效应,核酸中的碱基有很强的紫外吸收,它的吸收峰在260nm。当DNA以双螺旋形式存在时,浓度为50g/ml的A260 = 1.00(光径1cm),变性成单链后,同样浓度的核酸溶液的A260 =

5、1.37,这就是增色效应。,影响Tm值的因素,G-C对含量越高,Tm就越高,G-C对含量每增加1%,Tm大约增加0.4。在近似生理条件下,DNA的Tm一般在8595之间。溶液中的离子强度对Tm有很大影响,在一定的范围内,一价阳离子浓度每增加10倍,Tm增加16.6。若要降低Tm,可加入甲酰胺,因为甲酰胺能降低氢键的稳定性。,复性与杂交,在适宜的条件下,两条分开的互补链可重新形成双螺旋,这个反应称为复性(renaturation)。使两条互补的单链形成双螺旋的过程称为退火(anneal)。两条不同来源的互补单链经退火形成双链的反应称为杂交(hybridization),杂交可以在DNA单链之间进

6、行,也可以在DNA单链和RNA单链之间进行。,复性动力学,复性动力学指的是复性核酸的量随着时间变化的情况。它可以用来检测DNA的复杂性。高度重复序列多则复杂性低,单一序列多则复杂性高。,复性动力学的测定,首先将纯化的DNA通过高速搅拌或小孔喷射,以取得大小均匀的片段;100瞬间处理后(使其变性)迅速冷却到适当温度复性,如温度控制在低于Tm 20左右,在标准的磷酸缓冲液中保温,每隔一定时间测定DNA复性的数量。,复性动力学的测定,测DNA复性的方法有两种,一种是测A260的变化,另一种是用羟基磷灰石柱分离双链和单链DNA,双链DNA吸附而单链DNA流出,再测定流出单链DNA的量。,复性动力学方程

7、的推导,DNA复性取决于两条单链的随机碰撞,因此它遵循二级反应动力学,其反应符合下列方程式: 式中C为时间t时,单链DNA的浓度;k为反应速度常数。,,,,,(2),, ,,,,(1),当复性完成一半时, ,带入(1)式得,,,,,复性动力学方程的推导,复性动力学方程的意义,从(1)式和(2)式可以看出,控制复性反应的参数是单链DNA初始浓度 和复性时间 的乘积,称为 。 越大, 越小。,(1),(2),简单基因组的Co t曲线,横坐标C 0 t,C0t1/2值与基因组大小的比例关系,可以作为衡量一个基因组大小的尺度,但必须注意前提条件(非重复序列)。,真核生物基因组的单一序列和重复序列,当基

8、因组中存在有重复序列时,情况就复杂了。由于重复序列相互碰撞的几率较高,复性速率也就较快。既有单一序列又有重复序列的基因组的 曲线会出现若干个拐点。,假设的真核基因组的Cot曲线,三个部分的表观 分别为0.0013、1.9和630,分别占基因组的百分数为25%、30%和45%。,高度重复序列,中度重复序列,单一序列,重复序列单位长度的计算,为了推算每一部分DNA所对应的bp数,必须把每一部分当成独立的组成来考虑。三个部分的实际 应为0.001325% = 0.00033,1.930% = 0.57,63045% = 283。以大肠杆菌的 = 4.0作为标准,则三个部分的bp数应为(视作单一序列)

9、:,重复频率的计算,以上三个结果为动力学复杂长度。此模式基因组的复杂度记为 “3.01086.0105340 bp”,重复频率(f)=,化学复杂长度 动力学复杂长度,用化学法测得的DNA总长度为7.0108 bp,其中25%为1.75108 bp,30%为2.1108 bp,45%为3.15108 bp。这三个结果为化学复杂长度。代入上式可以计算出三部分的重复频率分别为500,000、350、1。,重复频率的计算,在同一条复性曲线中,任何两个组分的重复频率和它们的表观 成反比关系。因此,如果我们假设非重复组分DNA确实是单拷贝的(f = 1),那么可以用下式计算其它重复组分的重复频率。,(这里

10、的 应为表观 ),非重复序列,在基因组中只有一个拷贝的序列称为单一序列或非重复序列。在原核细胞基因组中,都是非重复序列;而在真核细胞基因组中,非重复序列占有不同的比例。用从烟草叶子mRNA制备的cDNA与不同 部分的烟草基因组变性DNA杂交试验观察到,杂交只在单一序列DNA组分中形成,这表明烟草叶子中表达的基因大部分是单一序列基因。,表达基因的比例,比较单一序列的总bp数和表达的bp数可以发现,表达的基因只占单一序列总量的很少一部分,在烟草中这个比例为5%。单一序列中有很多是非编码序列,如调控序列、内含子等,还有沉默基因。,1.2 重复序列,基因组中具有2个以上拷贝数的序列称为重复序列,其中有

11、些重复序列是有编码功能的,如rRNA基因、tRNA基因、人的珠蛋白基因、组蛋白基因等。大部分重复序列是没有编码功能的。根据重复频率的大小,又将重复序列分为中度重复序列和高度重复序列。,图14 不同生物基因组中 不同序列组分的比例,重复序列家族,基因组中(真核细胞)含有许多重复序列家族,每个家族含有数目不等的成员,各个家族之间成员的大小也不一样。要注意的是。同一家族成员之间的序列不一定完全一样,可以是具有很高的同源性、并具有某些共同特点的序列。人类基因组中有一个Alu序列家族,它有3105个成员,每个成员长300bp;在170bp处均有AGCT序列,此序列是Alu内切酶的识别序列,经Alu内切酶

12、可切割成170bp和130bp两个片段;各成员之间有87%的同源性。在人类基因组中它散布在非重复序列之间(散布重复),它有什么功能还不清楚。,串联重复序列,图15 小麦rRNA基因大转录单位的 串联重复排列,rRNA基因大转录单位 的数目和分布,在典型的作物中,每个基因组含有5000个这样的成员;而在大多数动物基因组中,含有100200个这样的成员。这些串联的成员可以只存在于一个染色体上,也可以存在于两个染色体上。如拟南芥中rDNA串联重复存在于2号和4号染色体上,占核基因组的8%;而玉米中只存在于1个染色体上。转录时三个编码基因合在一起,转录出一个45S的前体rRNA,然后从中剪切出5.8S

13、、18S和25S rRNA,所以三者是等当量产生的。,卫星DNA,当把生物体中提取的DNA进行氯化铯密度梯度离心,达到平衡时,不同浮力密度的DNA形成不同的区带。DNA所含的G+C对比例越高,则浮力密度越大;A+T对比例越高,则浮力密度越小。核基因组DNA的氯化铯密度梯度离心结果显示,在某一浮力密度处有一条DNA的主带,在其上下有一条或几条次带,这些次带称为卫星DNA。对卫星DNA进行复性动力学分析表明,它们是高度重复序列。,Satellite DNA,卫星DNA,卫星DNA一般是串联的重复序列,而中度重复序列(转座子和逆转录转座子)一般是散在分布序列。用原位杂交和放射自显影,发现大部分卫星D

14、NA位于染色体着丝粒附近或其端粒区。卫星DNA常位于分裂间期核的异染色质区,而异染色质区是不表达的区域。,卫星DNA举例,鼠富含A+T的卫星DNA,占鼠总核DNA的10%左右,它由20bp长的重复单位组成,其序列为 AAATTGCATAGATTTTGAAT T TTAACGTATC TAAAACTTA 甜瓜卫星DNA由基本的400bp序列组成,重复次数约10 6。 从拟南芥中分离到3个卫星DNA,即180bp(3100-5600拷贝)、500bp(280-560拷贝)、160bp(875-1750拷贝)。,Mouse satellite DNA forms a distinct band,小卫

15、星DNA,小卫星DNA是更短的串联重复序列,其重复单位的长度为数十个bp,重复次数在相同物种不同个体中是可变的。如人类中存在15-100bp的重复序列,重复次数20-50次。,微卫星DNA的重复单位更短,为1-3个bp,重复次数从数十到数千。,微卫星DNA,复制滑动改变重复次数,端粒重复序列,真核细胞染色体的末端具有端粒重复序列,其重复单位的长度为67个bp,可重复上千次。 人 类 TTAGGG TTAGGG TTAGGG 锥 虫 TTAGGG TTAGGG TTAGGG 拟南芥 TTTAGGG TTTAGGG TTTAGGG 小 麦 TTTAGGG TTTAGGG TTTAGGG,染色体的两

16、端是端粒,端粒是高度重复序列。端粒的作用是维持基因组的正常复制,在基因组复制时,染色体的末端会缩短,通过端粒酶的反转录作用,可维持染色体末端的长度。,散布重复序列,散布重复序列主要是一些可移位的遗传因子,也称为转座子。它们是一些可以在染色体上移动位置的DNA片段。不同的转座子的长度不同,重复次数也有很大差异。如拟南芥基因组中的Tal因子只有约10个拷贝,而百合的del 2因子约有240,000个拷贝。,1.3 基因家族,在真核生物中,相关的基因可以归在基因家族中。具体地说,基因家族是指基因组中许多来源相同、结构相似、功能相关的一套基因。基因家族的成员是从某个原祖基因通过倍增和突变而遗传下来的,

17、它们可以分散在不同的染色体上,也可以成簇地排列在一起,形成基因簇(gene cluster)。各基因家族所拥有的成员数目不等,如大豆球蛋白基因家族有5个成员,玉米醇溶蛋白基因家族有100个左右的成员。,图110 与油菜茉莉酸诱导蛋白基因相似的基因家族,kb,简单的多基因家族,简单的多基因家族是指在家族中有一个或几个基因以串联排列的方式重复,每一个重复由一个启动子控制转录,如前述18S、5.8S、25S rRNA基因,以及5S rRNA基因都是这样。5S rRNA基因之间有间隔序列隔开,这些间隔序列也是重复序列。每一个5S rRNA基因单独进行转录。,图111 简单的多基因家族,复杂的多基因家族

18、,复杂的多基因家族由几个相关的基因组成基因簇,也就是一个重复单位。在这个重复单位中,基因之间被间隔序列隔开。一个重复单位中的各个基因有各自的启动子,分别转录出各自的mRNA。组蛋白基因和tRNA基因就属于这种类型。 一个基因簇中的不同基因可以是按同一方向转录,也可以是按两个方向转录(图1-12)。一个基因簇中的某个基因也可以有若干个拷贝,如果蝇tRNA基因簇,但不是所有的tRNA基因都在一个基因簇中。,图112 复杂的多基因家族,DNA上的基因,在DNA长链上,排列着许多基因 基因之间往往有间隔序列 基因之间也有重叠的现象 就一个基因而言,DNA双链的一条链为模板链, 另一条链为编码链(意义链

19、),但我们不能说基因位于某一条链上。 在一个DNA长链上,不同基因的编码链可以位于不同的单链上 描述一个基因的结构是描述其编码链,DNA链上基因的排列,模板链、编码链与RNA的关系,受发育控制的复杂多基因家族,人及珠蛋白基因簇,The two g genes differ in their coding sequence in only one amino acid; the G variant has glycine at position 136, where the A variant has alanine.,不同发育阶段的血红蛋白亚型,有许多基因家族成员是随发育阶段变化而先后表达的。

20、珠蛋白(脱辅基血红蛋白)由4个亚基组成,两个类亚基和两个类亚基,在人的不同发育阶段中有不同的亚基组合。,不同发育阶段的血红蛋白亚型,图114 人体发育过程中不同类型珠蛋白的浓度变化,假基因的产生,1.4 真核基因的断裂结构,1977年,当时在纽约冷泉港实验室从事研究工作的Richard Roberts发现,单个基因不仅可以由一个DNA片段组成,而且可以由数个受到不相干DNA片段隔离的DNA片段组成。生物体内存在的这种间断的基因,比早期研究的那些基因更加复杂,从而使上述有关遗传物质及其功能的流行概念发生了彻底的改变。,断裂基因的发现,断裂基因的发现,同年,Phillip Sharp在研究腺病毒时

21、,发现腺病毒的基因组由一条很长的DNA分子组成;在DNA分子中,至少有4个完全间断的DNA片段与1个RNA分子相对应。由此得出结论认为,基因遗传信息在基因组内是间断编码的。这一科学发现激励了科研人员的深入研究,不久便证实断裂的基因结构事实上是高等生物最常见的基因结构。,The Nobel Prize in Physiology or Medicine 1993,“for their discoveries of split genes“,Richard J. Roberts New England Biolabs Beverly, MA, USA b. 1943,Phillip A. Shar

22、p MIT, Center for Cancer Research Cambridge, MA, USA b. 1944,断裂基因的外显子和内含子,我们把一个基因中最终出现在成熟的RNA中的序列称为外显子(extron or exon),而把转录后从原初转录本中去掉的序列称为内含子(intron)。 断裂基因可以通过异源双链分析得到检测,即把克隆了的基因组DNA与mRNA杂交,电镜观察未互补的环。,真核基因的断裂结构,鸡卵清蛋白mRNA与其基因DNA杂交形成的异源双链产物的电镜照片,鸡卵清蛋白mRNA与DNA杂交形成的异源双链产物的模式图,外显子、内含子分析法,内含子的特点,在一个基因中,内含

23、子的位置和数目往往是保守的,但内含子的序列十分不同。也有许多真核细胞基因没有内含子。内含子的功能和存在的意义还不清楚。真核生物编码蛋白质的核基因内含子的两端具有保守的5GTAG3序列,称为GT-AG法则。另外还有tRNA基因、rRNA基因、线粒体、叶绿体以及酵母的一些蛋白质基因的内含子,它们不具有5GTAG3序列,而是具有其他一些特点,其中的类内含子和类内含子能够自我剪接。,同源基因举例,类珠蛋白基因和类珠蛋白基因都是由3个外显子和2个内含子组成。脊椎动物肌红蛋白(只有一个亚基)的结构与血红蛋白亚基结构很相似,它们可能有着相同的来源。豆科植物中的豆血红蛋白,从蛋白质一级结构、内含子数目和位置上看,似乎与珠蛋白起源于同一祖先基因。,珠蛋白基因与豆血红蛋白基因内含子位置的比较,两种玉米乙醇脱氢酶 内含子的比较,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1