4章基因与基因组.ppt

上传人:本田雅阁 文档编号:3017015 上传时间:2019-06-25 格式:PPT 页数:105 大小:9.43MB
返回 下载 相关 举报
4章基因与基因组.ppt_第1页
第1页 / 共105页
4章基因与基因组.ppt_第2页
第2页 / 共105页
4章基因与基因组.ppt_第3页
第3页 / 共105页
4章基因与基因组.ppt_第4页
第4页 / 共105页
4章基因与基因组.ppt_第5页
第5页 / 共105页
点击查看更多>>
资源描述

《4章基因与基因组.ppt》由会员分享,可在线阅读,更多相关《4章基因与基因组.ppt(105页珍藏版)》请在三一文库上搜索。

1、第一节 基因概念 第二节 细菌基因组 第三节 真核生物的基因组 第四节 病毒基因组及细胞器基因组,第四章 基因与基因组的结构与功能,1、目前的定义:蛋白或RNA的编码序列及其调控区序列。 基因是遗传的功能单位,以DNA分子中排列顺序决定基因的功能;,第一节 基因的概念,基因概念的历史演变: (1)Mendel提出基因的存在 (2)Morgan证实基因在染色体上 (3) “一个基因一个酶”修正为“一个基因一个多肽链” “基因”一词的创立: 1909年,丹麦遗传学家约翰逊 “基因”(gene)。,Gregor Mendel,Thomas Hunt Morgan,1941年 G W Beadle 和

2、 E L Tatum 红色链孢霉各种突变体的异常代谢是一种酶的缺陷,产生这种酶缺陷的原因是单个基因的突变。,Beadle and Tatum: 一个基因 - 一种酶 One Gene - One Enzyme,用X射线诱导处理红色面包霉,筛选出突变体,证实基因发生突变,就可能导致酶活性的丧失。,红色链孢霉实验 (1),突变品系 基本 基本培养基加 培养基 鸟氨酸 瓜氨酸 精氨酸 arg cit orn 精氨酸 (Arginine),瓜氨酸(Citrulline) 鸟氨酸 (Ornithine),红色链孢霉实验 (2),突变品系 基本 基本培养基加 培养基 A C O arg cit orn A

3、, C, O 分别为arg ,cit 和 orn突变品系的细胞提取物,人类酶缺陷症,半乳糖血症(Galactosemia),Gal-1-P-UT半乳糖-1-磷酸尿苷转移酶,白化病(albinism) 酪氨酸酶 酪氨酸酶 酪氨酸 多巴 多巴醌 多巴色素 5,6 二羟吲哚 +蛋白质 吲哚 5,6 醌 黑色素 黑素蛋白,苯丙酮尿症(phenylketonuria, PKU) 蛋白质 苯丙氨酸羟化酶 苯丙氨酸 酪氨酸 苯丙酮酸,莱一尼二氏症(Lesch-Nyhan syndrome) (自毁容貌综合征) 鸟苷酸 次黄苷酸 HGPRT 鸟苷 次黄苷 鸟嘌呤 次黄嘌呤 HGPRT :次黄嘌呤鸟 黄嘌呤 嘌

4、呤 磷酸核苷转移酶 尿酸,一个基因一条多肽链,本世纪50年代, Yanofsky 有些蛋白质不只由一种肽链组成,如血红蛋白和胰岛素,不同肽链由不同基因编码,因而又提出了“一个基因一条多肽链”的假设。,基因的顺反子(Cistron)概念,1955年,由美国本兹尔(Benzer)提出: 指编码一个蛋白质的全部组成所需信息的最短片段,即一个基因。 基因是一个功能单位,其中的碱基序列是重组和突变的结构基础。,一对同源染色体上两突变(a和b)在同一染色体上时,为顺式构型, 在两个染色体上时,为反式构型; 顺反互补测验(cis-trans test):比较顺式和反式构型个体的表型判断两个突变是否发生在一个

5、基因(顺反子)内的测验。,测验时,如果两个位点突变发生在同一基因上,后代杂合体中将有一个基因型是野生型,另一个为突变型致死; 如果两突变在两个不同的基因上,后代杂合体均为野生型而存活,突变型与野生型具有互补关系。 若为对应表型的突变,则后代中野生型与突变型的表型可能不同。,反式排列:用于互补测验中所用的两个突变型,如果分别位于两条染色体上,这种组合方式称为反式排列, 顺式排列:如果两个突变同时位于一条染色体上,则称为顺式排列。 顺反子:是功能水平上的基因。,2、遗传信息流,中心法则 遗传信息沿着从DNA到RNA到蛋白质单向传递,即DNA转录RNA,RNA翻译蛋白质。反转录病毒能将RNA反转录为

6、DNA,很多病毒能直接以RNA为模板复制RNA,还有很多生物能编辑信使RNA序列,因此蛋白质编码序列不仅仅直接由特异的DNA序列决定,原核基因表达 单个基因或操纵子的转录从启动子开始,结束于终止子,产生单顺反子或多顺反子的mRNA;核糖体从起始密码子(靠近核糖体结合位点)到终止密码子翻译mRNA的编码区。tRNA据遗传密码把aa递送到延长的蛋白链上。,真核基因表达 转录多起始于启动子,单顺反子mRNA从一个基因转录而来。产生的前体RNA在5端有帽子结构、3端多聚A尾巴。在成熟mRNA释放到细胞质中翻译之前,其中的内含子通过剪接去除。, 可转录、可翻译的(乳糖操纵子结构基因 Z,Y,A ), 可

7、转录但不翻译 (tDNA, rDNA, promoter, operator ), 不转录、不翻译 (沉默基因),3 基因的类型,DNA中的编码区与间隔区 1)编码区:与蛋白质中氨基酸序列相应的核苷酸序列。 2 )间隔区:基因序列外,没有编码功能的序列。 3)转录单位的组成: 启动子,上游调控区,基因编码区,转录终止序列 4)假基因:在序列上与有活性的基因相似,但不能转录或翻译出mRNA或蛋白质,或产生过早终止的无活性肽链,或由于错误的阅读框架形成无活性的蛋白质。,断裂基因 重叠基因 跳跃基因,3.1、断裂基因(interrupted gene) 即割裂基因(splitting gene) 不

8、连续基因(discontinuous gene ), 本世纪70年代,Chambon 和 Berget。通过成熟mRNA(或cDNA)与编码基因的DNA杂交试验发现。,割裂基因:基因的编码序列在DNA上不是连续的,而是被不编码的序列隔开。 外显子Exon :基因中编码的序列,与mRNA的序列相对应。 内含子Intron :基因中不编码的序列。,鸡的卵清蛋白基因DNA与其mRNA杂交图,剪接: 前体RNA中将内含子转录的序列去除,并把外显子转录的RNA序列连接起来的过程。,割裂基因的普遍性,a) 真核生物中:,绝大部分结构基因,tDNA, rDNA,mtDNA, cpDNA叶绿体DNA,b) 原

9、核生物 中:,SV40 大T 抗原gene,小t 抗原 gene,1984 Dr. Chu,T4 phage 的胸苷合成酶 gene,1017 bp intron,Splitting gene 并非真核生物所特有,酵母成熟酶合成受 intron II 的自动控制,maturase 过剩,利用intron II 编码成熟酶,maturase 减少,提前剪切 intron II,a) Intron 并非“含而不露”,Yeast 细胞色素b基因 Intron II 编码成熟酶(Maturase ),割裂基因概念的相对性,c) 并非真核生物所有的结构基因均为splitting gene,不是split

10、ting gene,b) Exon 并非“表里如一”,人类尿激酶原基因 Exon I 不编码 氨基酸序列,Histone gene family,干扰素,Yeast 中多数基因(ADH),(果蝇 ADH(乙醇脱氢酶)基因为间隔基因),3.2 重叠基因,1977年 维纳(Weiner) 1978年 费尔(Feir)和桑戈尔(Sanger) 噬菌体G4、MS2和SV40中都发现了重叠基因,基因的重叠,原核生物的重叠基因,果蝇蛹上皮蛋白质基因位于另一个基因的内含子之中 人I型神经纤维瘤(NF1)基因的第一个内含子中有三个编码蛋白质的基因, 线虫基因组中每个基因平均有5个内含子,有的内含子中包含tRN

11、A基因, 以上这些重叠基因的转录方向不一定与包含它的基因的转录方向一致两个重叠基因的转录是各自独立、互不依赖。,真核生物的重叠基因,3.3 跳跃基因,即转座子,在哺乳动物体内一般含有几十万个跳跃基因DNA;目前正在研制利用转座子进行基因治疗。转座酶可促进基因的跳跃,二,调控区包括复制起始区和终止区,转录启动子和终止区等,动物学报,2003,1:DNA / HindIII EcoR I marker 2:重组质粒/Hind III 3:pBluscriptS.K /Hind III,香猪生长激素基因克隆及结构功能研究,GenBank no. DQ086832 1903 bp,编码前体:216AA

12、(190) 相似性:97%99% 差 异:外显子4中的替换A1358G,1321 cttcaccaac agcctggtgt ttggcacctc agaccgcATC,Val 108 Ile:于GH与GHR结合区(site2粉色),将减弱GH与受体的亲和力,香猪生长激素V108I替换对功能的影响,Asp106红 -Arg107蓝-Ile108黄,Val108黄,香猪 杜洛克猪,香猪GH重组蛋白的表达,克隆cDNA( 719bp ),亚克隆得成熟肽编码区(573bp),M: DL2000 marker 1: GH 719bp 2: CDS of GH (573bp),香猪生长激素成熟肽的原核表

13、达及纯化 M protein mark 1 ER2566 2 ER2566/pTYB11 3 GH protein,细菌基因组特点续三 也有转座子元件 除了染色体外,多含有线形或环形的质粒,大肠杆菌质粒DNA电镜,2、质粒plasmid,定义: 染色体外能进行自主复制的遗传单位。常指细菌、酵母菌和放线菌等染色体以外的单纯 DNA分子。 天然质粒种类: 1、F因子:最先发现的质粒,有 F因子的大肠杆菌相当于雄性,否则为雌性 2、大肠杆菌素:质粒产,可杀死其它细胞。 3、抗药因子 (R因子),可种间、属间转移,大肠杆菌-痢疾志贺氏菌,变形杆菌-伤寒杆菌 4、 SCPI:自天蓝色链霉菌,产次甲基霉素

14、,酵母菌中发现2质粒 已发现有质粒的细菌有几百种。绝大多数细菌质粒是共价闭环DNA分子(cccDNA),分子量约为细菌染色体的0.53 质粒的大小:据分子量分成大、小两类 按质粒拷贝数分为两类: 严紧型质粒(染色体复制一次质粒复制一次,每个细胞内仅1-2个) 松弛型质粒(染色体复制停止后仍能继续复制,每个细胞内约有20个)分子量大的质粒多为严紧型,分子量较小的质粒属松弛型。 质粒的消除:多数质粒可以通过吖啶类染料、溴化乙锭、十二烷基磺酸钠、利福平以及高温处理而使它从细胞中消除。 质粒的编码功能:限制性内切酶、复制-转移和重组等因子,特殊因子(抗药性质粒上编码 -内酰胺酶的青霉素抗性基因等),基

15、因工程质粒,大肠杆菌质粒pBR322的电镜图 上:开环构型; 下:超螺旋,pBR322 常用基因载体,双抗检测重组质粒,pUC18,lacZ:-半乳糖苷酶基因,穿梭质粒,用重组 DNA技术将两种宿主细胞的质粒连接而成的嵌合质粒,它能分别在两种宿主细胞中进行复制。,腺病毒载体系统的滴度高、容量大、不整合到染色体中、对人致病性低等,是应用最广泛的病毒载体,穿梭质粒。CMV巨细胞病毒,无明显症状,成人抗体均阳性,重组穿梭质粒,腺病毒骨架质粒,3、原核染色体组成:,以骨架蛋白、RNA构成核心, 双链闭环的超螺旋DNA于外围,大肠杆菌当色体,第三节 真核生物的基因组,基因组(genome)定义: 物种单

16、倍体的染色体携带的一整套基因,基因组:遗传信息的总和。或者说是细胞或生物体全套遗传物质。,1、 举世瞩目的人类基因组研究计划,遗传图谱:某一物种的染色体图谱,显示所知的基因或遗传标记的相对位置,通过遗传重组所得到的基因在具体染色体上线性排列图。 物理图谱 染色体上每个DNA片段的实际顺序 。利用限制性内切酶将染色体切成片段,再根据重叠序列确定片段间连接顺序,以及遗传标志之间物理距离碱基对(bp)或千碱基(kb)或兆碱基(Mb)的图谱。 序列图谱是在遗传图谱和物理图谱的基础上建立起来的。 基因图谱:在人类基因组中鉴别出占具2% 5%长度的全部基因的位置、结构与功能。,基因组研究的具体内容,由人类

17、基因组计划所得的新发现,1、人类基因组约2.91Gbp,约39000多个基因;平均基因27kbp;G+C仅38%,2号染色体G+C最多;仍有9%的碱基对序列未定,19号染色体含基因最丰,13号染色体含最少 2、已定位26000多个功能基因,其中42%基因的功能未知;已知基因中酶占10.28%,核酸酶7.5%,信号传导12.2%,转录因子6.0%,信号分子1.2%,受体占5.3%,调节分子3.2% 3、总基因数量太少:Celera公司定在2.6383万到3.9114万间,小于40,000,仅为线虫或果蝇基因数量的两倍,人有而鼠没有的基因只有300个。 4、人类单核苷酸多态性的比例约为1/1250

18、bp,不同人群仅有140万个核苷酸差异,人与人之间99.99的基因密码是相同的。不同人种比同一人种在基因上更相似,人与人间的变异仅为万分之一,说明人类不同“种”之间并没有本质的区别。 5、人类基因组中存在“热点”和大片“荒漠”。 基因组上约14没有基因。全部基因组中的1-1.5 % DNA可编码蛋白,在人类基因组中98%以上序列“无用”,300多万个长片断重复序列LINE。这些重复序列可能包含人类演化和差异的信息。 6、男性的基因突变率是女性的两倍,大部分人类遗传疾病在Y上。男性更重要。 7、人类基因组中大约有200多个基因来自细菌基因。这种插入基因在无脊椎动物中很罕见,说明这些细菌源基因是在

19、人类进化的晚期才插入的,可能发生在免疫防御系统建立前。 8、发现了大约140万个SNP单核苷酸多态性,其中30多种致病基因。 9、人类基因组编码的全套蛋白质(蛋白质组)比无脊椎动物编码的蛋白质组更复杂。人类和其他脊椎动物重排了已有蛋白质的结构域,形成了新的结构。也就是说人类的进化和特征不仅靠产生全新的蛋白质,更重要的是要靠重排和扩展已有蛋白,以实现蛋白质种类和功能的多样性。推测一个基因平均编码2-10种蛋白,以适应人类复杂的功能。,2 功能基因组学研究,研究内容: 人类基因组多样性的研究、 基因组表达调控的研究、 模式生物的研究、 生物信息学的研究,人 3 X 109 39000 2001、2

20、006(99.99%),与编码蛋白质的基因数相比,基因组的DNA过多,例:人类与E.coli编码基因数目的比较研究 E.coli. 4.2 X 106bp DNA 约3000种编码基因 人类 3.3 X 109 bp 的DNA 是大肠杆菌的700多倍 有上百万个基因?,根据不同细胞中的 mRNA数目来估算表达基因, 人类编码基因约为3-4 万个,持家基因(housekeeping gene):在所有细胞类型中都表达,即这些基因的功能为所有细胞所必须(或称组成型基因 constitutive gene), 奢侈基因(luxury gene): 仅在某种特定类型的 细胞中表达的基因,人类基因组中9

21、0以上的DNA功能何在??,果蝇基因组的基因,DNA复性过程遵循二级反应动力学 DNA复性过程中单链消失的速度用公式表示: -dC/dt=kC2,3 DNA的复性动力学,反应初始 t = 0,单链 DNA浓度 = C0,反应达 t 时,单链DNA浓度 = Ct,K复性速度常数,DNA复性的影响因素: DNA序列的复杂性、初始浓度、片段大小、温度、离子强度,- dCt / dt = KC02 积分,Ct / C0 = 1 / (1+KC0t ),当 Ct / C0 = 1/2 时的Cot值定义为Cot1/2,Ct / C0 = 1/2 = 1 / (1+ KC0t(1/2),K = 1 / Co

22、t(1/2),C0t(1/2)值对DNA的意义:与DNA的碱基对数成反相关,即复性反应完成一半时,K复性速度常数,Ct/C0是C0t的函数, 按此公式作图得C0t曲线,Cot曲线:用以表示复性速度与DNA顺序复杂性的关系。,不同DNA的Cot(1/2)值不同,与K值相关 DNA序列的复杂性影响K值:在控制反应条件(初始浓度、温度、离子强度、片段大小)相同的前提下, 两种DNA分子的C0t(1/2)值, 取决于核苷酸的排列复杂性 。 DNA序列的复杂性(complexity) X:最长的不重复序列的bp数 X= K Cot1/2,AAAAAAAA X = 1,ATCGATCGATCG X = 4

23、,Cot(1/2) = 1/K,复杂性X 1,形状相似(跨越2-3个数量级),Cot(12)不相同 单一序列 只是复杂性不同 高度重复序列Cot(1/2)值小 单一序列Cot(1/2)值大 poly(A) X=1 Cot(1/2)=2x10-6 T4 X=1.7x105 Cot(1/2)= 0.3,不同原核生物的Cot曲线 MS2噬菌体,复性分数(1-c/c0),P74图16,真核生物复性动力学研究 复性曲线的模式图 复性反应分为三相,每相代表不同复杂长度的序列类型,Cot1/2,所占比例,复杂性X,重复频率,重复序列(repetitive sequences),真核生物复性动力学研究发现了重

24、复序列 单拷贝序列 轻度重复序列 中度重复序列 高度重复序列,重复序列比例: 原核生物无重复序列 低等真核生物 10-20% 高等植物 80% 高等动物 50%,4 基因家族,4.1.1 基因家族和基因簇 基因家族(gene family):真核生物基因组中来源相同,结构和功能相关的基因聚集在一起形成基因家族。可能由共同祖先经多次重复和突变产生 根据分布形式分基因簇和散布的基因家族: 1)基因簇(gene cluster) 基因家族的各个成员紧密成簇排列成大段的串联重复单位,分布在某一条染色体的特殊区域; 它们可同时发挥作用,合成某些蛋白质。,假基因(pseudo gene):在多基因家族中,

25、某些成员并不产生有功能的基因产物。 假基因与有功能的基因同源。 2)散布的基因家族(interspersed gene family) 概念:一个基因家族的不同成员成簇地分布不同染色体上,各成员在序列上有明显差异。 这些不同成员编码一组功能上紧密相关的蛋白质,如珠蛋白基因家族。,4.1.2 广义的基因家族,根据基因家族成员序列的相似程度分类: 1)经典的基因家族,家族成员序列有高度的同源性,序 列一致,拷贝数高,非转录间隔区短而一致。 2) 基因家族各成员的编码产物保守(大段的高度保守氨基酸序列);只是DNA序列的相似性低。 3)基因家族各成员的编码产物之间只有很短的保守氨基酸序列,DNA序列

26、的相似性更低。 4)超基因家族,各基因序列之间无同源性,但其基因产物的功能相似。编码产物之间也无明显的保守氨基酸序列,但也有一些共同特征。,有间隔区,如人类主要组织相容性抗原复合体HLA和免疫球蛋白重链及轻链基因都属于超基因。超基因可能是由于基因扩增后又经过功能和结构上的轻微改变而产生的,但仍保留了原始基因的结构及功能的完整性。,卫星DNA用于制作DNA指纹图谱,4.2.2 散布的重复DNA,重复单位不成簇,分散在染色体的各个位点上。 1)短分散片段 2)长分散片段,1)短分散片段(short interspersed repeated segments, SINES),特点: 长度约为300

27、bp, 与长度约1000bp的单拷贝顺序间隔排列。 拷贝数可达10万左右。 如人的Alu家族。,Alu家族: Alu家族是哺乳动物包括人基因组中含量最丰富的一种中度重复顺序家族,在单倍体人基因组中重复达30万-50万次,约占人基因组的3-6。 长度约300bp, 含有限制性内切酶Alu的切点(AGCT)。 具有种的特异性。 相近的生物体中存在相似性, Alu顺序很象转座子,每个Alu顺序两侧为6-20bp的正向重复顺序。,功能: 可能参与hnRNA的加工与成熟。 与遗传重组及染色体不稳定性有关。 有形成Z-DNA的能力。 可能具有转录调节作用。,还有许多其它家族如: Kpn家族、 Hinf家族

28、、 多聚d-d家族等。,2)长分散片段(long interspersed repeated segments, LINES),重复顺序的长度大于1000bp,平均长度为3500-5000bp, 与平均长度为13000bp(个别长几万bp)的单拷贝顺序间隔排列。 在基因组中的比例随不同种属差异大,为10-40。,第四节 病毒和细胞器基因组,一、病毒基因组 寄生生活 DNA病毒、RNA病毒 动物病毒、植物病毒、噬菌体,病毒基因组的特点,基因组小,编码的蛋白少;寄生 多顺反子mRNA,间隔区很短,2真核的线粒体和叶绿体基因组 1)线粒体的基因组mtDNA : 脯乳动物的mtDNA为16.5Kb 为核DNA的1%。 2)叶绿体的基因组cpDNA 植物的cpDNA是动物的8-9倍 一般为121-155Kb;,3 细胞器中的蛋白合成系统,tRNA、rRNA、RNA聚合酶、核糖体等。,有些生物的细胞器基因一部分是自身合成,一部分是核基因组编码的,如细胞色素氧化酶; 还有一些基因在某些生物中是自我合成的,在别的生物中由核基因组编码,如ATP酶基因;,名词解释 基因组 C-值矛盾 基因家族 基因簇 割裂基因 卫星DNA 简答题 1. 根据复性动力学曲线判断真核生物各种序列类型 2. 真核、原核生物的结构基因的主要组成特点。,思考题,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1