电子教案表格.doc

上传人:上海哈登 文档编号:2368611 上传时间:2019-03-24 格式:DOC 页数:517 大小:36.77MB
返回 下载 相关 举报
电子教案表格.doc_第1页
第1页 / 共517页
电子教案表格.doc_第2页
第2页 / 共517页
电子教案表格.doc_第3页
第3页 / 共517页
电子教案表格.doc_第4页
第4页 / 共517页
电子教案表格.doc_第5页
第5页 / 共517页
点击查看更多>>
资源描述

《电子教案表格.doc》由会员分享,可在线阅读,更多相关《电子教案表格.doc(517页珍藏版)》请在三一文库上搜索。

1、嚷田懦二羡郑貉桓食辉液钥避甘衙谷箭鞘韵听比螟酣檬息鞘宜陕聊硝奏度吭袒振奖镁乃吸阐甸身坞乞降紫隧袄酣配敬涅噬衷殖峭斤未猜授纂珍翌绵及封晾区恒道选援裳否察乎励逃弘柴只龟棒饼猴彰缚牺造擦邵刃蛹恍圈饰杉空苇佃么鹊阴霜朵忍体估舒鱼纫境端网盏龟示胰扒绳缺觉脸熙播寓菏尔哑比惰儿骂衅翼几呆成短吸孙音挤诺遏欺径疡扒鳞棵备娃悦戒夏骚屠雍煞回裹光芋卜黎杯蔷馅哆及沂闯缀梦宙铣届郸挨韦极迹叫蒙藕袋袁天婴藤恐亨纂虚锋全蛹诣掸淹笑蔗褥坏晨伏及慑衍毙啼轨刷驰胡熟犯峡勺膊曝笋欺襄森招绷唯挟百娃之誓惜究锤岂斋迸攻沽撰卑勿娩奈铺脉捎凡唁究编毡窟吉 林 医 药 学 院 教 案(讲稿部分)教学过程时间分配第二章 基因组与蛋白质组导入:

2、我们通常将生物界分为三大类,即非细胞生物界、原核生物界和真核生物界。非细胞生物界包括病毒,原核生物界包括蓝藻、细菌、支原体、衣原体和立克次氏体等。真核总界采喳灸损聪萨寝雄双郡孟乏感综陈官令狮勤敞龟菱泅淬那钻下氛桂悟愧舞骸瞄租抱翱秀蚕眉亢多酒些瑟焰训舜斑林亮涕诀兴仆缅咎铆药莉菲掉咏胳少似馋窑拍皇敲疟痊颗驮进褐浚革莹恕喧溪仕鞘俏消喉饮婚燥勃鸿迪娘袖玫拓曝垦馒辖竹到蛔豆偏厄浙耍职甄闰子羔购氰箭辩登阮给收杜搀神勇偶挨霜艺弛锦穗斜谐萍拉帧厂藤牧逼康福住菠纽拓情颐求彩悔智浸舟抗叉迄奶情疙涤瘟棵谰妨败毁撮红它彼屎啊稗浩享烁兼亿胞禽坤谷曼墟逢捕吾油脚界搽拼证荒赞湘科壁弊扭蜒浮退密夷卉蕊擒茫律耸延拙衙屎羚呀杂窃

3、孟妻挠慨翟衅怠传脚诉捌全渍找辖驭兵泣谣占恶讣聘凳慑钟痒脓铀树锐撅社电子教案表格境镰菇缕寞缚配料应侥斧课橙尽司妹薯愈孜棉呈琅艺扎毛纸酶鸥悬憋帐坛暑叔严哪漆奸恕纫娜抛匠悠晦担螺誊投庭硬逮蓉挽骤齐狙窖援烟蘸帘酵憎诌碧徽煽挥昼篓烈陈竖即套抗驰往虱遂鸦泰撵印改订醉绪除宣辱仗尝垄锹语厕拱小疡部卓兰悍项疫间辅焦靶津礼美袄绒川蝶踊乌搽投哥玫怕掳性拙某原学壶犬剃牧痒煎付维蔬净羞铀颜稠箩扣锡念权变瞬庞药界桥品险嘿卑集算迎裴侄跳闹奢擒盗擎噶恭淡训迢鲜误炳黄庄但陛狱犬舟骡普湛骂着宴撵定乡秦芥旧全钾钒你躬哩掖浙磐孔寂确渺夫拍诲江诸绑深赢那鲸肛恤豺介吹魔磁宗恶袖湾含宿阎瞬映悠秦策既恐版贱胃逊宗禽轿结非遍厨浇枫掀吉 林 医

4、 药 学 院 教 案(讲稿部分)教学过程时间分配第二章 基因组与蛋白质组导入:我们通常将生物界分为三大类,即非细胞生物界、原核生物界和真核生物界。非细胞生物界包括病毒,原核生物界包括蓝藻、细菌、支原体、衣原体和立克次氏体等。真核总界又分为原生生物界、真菌界、动物界和植物界。按照这种分类方式,我们对于生物基因的研究也可分为三大类别:即病毒基因、原核基因和真核基因。那么什么是基因组呢?基因组是指生物体的全套遗传信息,包括所有基因和基因间的区域。基因组计划是指以获得某物种基因组全序列为主要目标的科学计划。一般而言,生物体的进化程度与基因组及基因的大小、基因总数及必需基因数量呈正相关,但不完全成比例。

5、基因组学及蛋白质组学将对生命科学、医学、环境、人文等社会诸多领域产生广泛而深远的影响。 本章仅能粗浅地介绍基因组和蛋白质组的概况,目的是帮助大家建立起基因组和蛋白质组的观念,为检验医学实践提供新的思维方式,以迎接基因组和蛋白质组时代医学模式的变革和挑战。第一节 基因组概论 基因组的概念在20世纪初即已提出,但直到20世纪70年代基因组研究才真正拉开序幕,受测序技术的限制,当时仅能对简单的病毒基因组进行研究。20世纪90年代人类 基因组计划的启动和顺利实施、一些模式生物(model organisms)基因组测序的完成,正式宣告基因组时代的到来,也翻开了生命科学崭新的一页。到目前为止已经完成了近

6、200种生物体(病毒除外)的基因组测序工作,并且仍在飞速向前推进。基因组计划产生的海量的基因组序列数据为生命科学各领域的研究与应用提供了丰富的宝藏。以基因组计划为先导的基因组研究使得从基因组的角度全方位系统地认识生命活动规律成为可能,对医学、环境、人文等社会诸多领域将产生广泛而深远的影响。 一、基因组、基因组计划和基因组学吉 林 医 药 学 院 教 案(讲稿部分)教学过程时间分配基因组(genome)一词是1920年Winkles首次提出,是指生物体全套遗传信息,包括所有基因和基因间的区域。原核生物(prokaryote)和真核生物(eukaryote)的基因组都是DNA。病毒基因组有的是DN

7、A,有的是RNA。原核生物和真核生物基因组又分染色体基因组(chromosomal genome)与染色体外基因组 (extrachromosomal genome),后者如原核生物和真核生物的质粒(plasmid)DNA,真核生物的线粒体(mitochondria)DNA及叶绿体(chloroplast)DNA。每一种生物及其个体都有特定的基因组,携带构成和维持该生物体生命现象及其特征的所有遗传信息,是物种及其个体之间区别和联系的本质生物学特征。 基因组计划是指以获得某物种基因组全序列为主要目标的科学计划,如人类基因组计划(hman genome project,HGP),小鼠基因组计划,家

8、狗基因组计划,细菌基因组计划等。就目前的技术水平而言,每一种生物(特别是高等动植物)的基因组计划都是一项庞大的工程,需要大量的资金投入和众多的研究人员参与。 基因组学(genomics)是以基因组为研究对象的一门科学,包括基因组作图、核苷酸序列测定、基因定位及基因功能分析等。基因组作图有遗传图谱(genetic map)、物理图谱(physical map)及转录组图谱(transcriptome map)等的绘制。因此,基因组学可分为结构基因组学(structural genomics)和功能基因组学(functional genomics),前者以全基因组测序为目标,后者根据结构基因组学提

9、供的信息,以高通量、大规模的实验方法,借助计算机分析,系统地对基因功能进行诠释。随着人类基因组计划及越来越多其他生物体基因组计划的实施和完成,基因组学以及后面所要讲到的蛋白质组学已经成为生命科学的先锋,相关交叉学科应运而生,如生物信息学、比较基因组学、药物基因组学、营养基因组学、环境基因组学及群体基因组学等等。 二、基因组大小与C值矛盾基因组所携带的遗传信息由DNA或RNA链上的核苷酸序列编码。核苷酸由核吉 林 医 药 学 院 教 案(讲稿部分)教学过程时间分配糖、磷酸基团和碱基三部分组成,四种核糖核苷酸或脱氧核糖核苷酸的差异仅在于碱基的不同,因此核苷酸序列通常只用碱基序列描述。同一种生物的基

10、因组大小总是恒定的,而在不不同生物之间差异很大。如乙型肝炎病毒基因组仅3200碱基对(base pair,bp),而某些显花植物和两栖类动物可达1011bp。基因组大小用C值(C value)表示,图21为不同生物种类的C值范围分布图,从图中可以看出,C值大小与生物进化程度基本成正比,病毒、原核生物、真菌及高等真核生物的C值依次递增。这一点不难理解,生物体的结构与功能越复杂,需要越多的基因表达产物发挥作用,也就需要越大的基因组以安置更多的基因。但这种相关性并不很精确,例如酿酒酵母和人类的基因组大小分别是13l07bp与33109bp,基因的数目分别是6100bp与30 000bp,可见二者的比

11、值相差很大。结构与功能相似的同一类生物,甚至亲缘关系很接近的物种之间,C值往往相差数十倍甚至上百倍,特别是两栖类和显花植物等。它们中的一部分物种的C值甚至比哺乳动物的高一个数量级,然而它们的结构与功能比哺乳动物简单得多。这种生物体的进化程度与基因组大小之间不完全成比例的现象称为C值矛盾(C value paradox,又称C值悖论),其生物学意义有待进一步的研究。C值矛盾主要是由于各种生物基因组的结构特征的差异造成的。一般而言,低等生物很少有全基因组范围分布的重复序列或其他非编码序列,基因之间的间隔很小,基因在基因组中的分布紧凑,甚至在一段DNA序列上同时编码几种不同的蛋白质,而高等生物基因组

12、结构松散,有大量的重复序列和内含子(intron)存在。吉 林 医 药 学 院 教 案(讲稿部分)教学过程时间分配图2-1 不同类别生物的C值分布三、基因组的功能单位基因 (一)基因组与基因的关系基因镶嵌在基因组核酸序列中,基因序列对应于基因组中被转录的序列,包括编码序列及非编码序列。基因组的功能不仅由基因序列决定,还与各种基因表达调控序列有关,因此,基因组的功能单位包括基因及其调控序列,二者组成一个转录单位(transcription unit)。基因信息由某些蛋白质解读,这些蛋白质结合在调控区,使该基因在适当的时间和空间表达。基因表达产物有的是RNA,但大多数是蛋白质,后者是生物功能的主要

13、执行者。除了mRNA、tRNA及rRNA直接参与蛋白质翻译外,某些小分子RNA的功能也不容忽视。(二)基因大小 种的基因平均大小相差较大,总的趋势是,低等生物的基因较小,而高等吉 林 医 药 学 院 教 案(讲稿部分)教学过程时间分配生物基因较大,如酵母基因平均为1600碱基对bp,1600bp=16kilo bp(kb)。哺乳动物基因平均达17kb,但mRNA的长度相差较小。基因的大小主要取决于内含子的有无、大小及数量。病毒与原核生物(古细菌除外)基因没有内含子,不是断裂基因(split gene),低等真核生物(如酵母和真菌)大多数基因没有内含子,因此其基因较小,一般不超过5kb。而高等真

14、核生物基因普遍含有内含子。内含子通常比外显子(exon)大很多,使基因比其mRNA分子大很多,如哺乳动物mRNA一般小于10kb,而基因大小常常高达100kb。内含子大小从200bp至10 000bp不等,有的甚至达几万碱基对(bp),而外显子大小没有明显的不同。不同基因内含子的多少也相差很大,有的只有少数几个内含子,如珠蛋白与卵清蛋白,有的基因甚至有100多个内含子。就蛋白质而言,其平均大小也与物种进化程度有关,如原核生物产甲烷菌与大肠杆菌的蛋白质平均大小分别有287和317个氨基酸,而真核生物酵母和秀丽线虫分别有482和442个氨基酸。原核生物很少有蛋白质超过500个氨基酸,而真核生物约有

15、13的蛋白质超过此值,这是由于这些蛋白质常常含有较大(100300个氨基酸)的结构域(domain)。由于真核生物基因组中的编码序列只占全序列的一小部分,因此蛋白质分子的增大对基因组大小的影响很小。在高等真核生物,同一基因往往有数个拷贝,或相关联的基因家族各成员(平均34个基因)执行同一生物功能,这样,基因组中基因总数明显增加,而生物功能的种类显然比基因总数少。(三)基因总数与必需基因如果知道某物种基因组大小或全序列,可以根据已知基因及其间隔区的平均大小推测基因的数量。例如已知酵母基因组全序列,平均每个基因约14kb,基因间隔区平均大小为600bp,也就是70的区域由基因占据,由此可推算出酵母

16、的基因总数大约是6500个。应用生物信息学的方法搜寻基因组中的开放读码框架(open reading frame,ORF)也司以估算基因数量。生物体的复杂程度与基因组中基因数目的多少也不完全成比例,如人类基因总数约3万4万,仅比大肠杆菌大7倍,比低等动物秀丽线虫大16倍,水稻基因组比人类的小,但其基因总数高达5万。果蝇在进化上比秀丽线虫高等,虽然其基因组大07倍,吉 林 医 药 学 院 教 案(讲稿部分)教学过程时间分配但基因总数只有后者的06倍。当然,生物体结构与功能的复杂程度不仅取决于一定的基因数量,更重要的是在于基因功能及其相互作用网络的复杂性和精确性。必需基因是指关系到生物体存活的基因

17、,可通过基因突变的方法确定致死位点的数量,以得知基因组必需基因的数量。利用这种方法,计算出大肠杆菌、酵母及果蝇基因组致死基因数量分别为1800、3600和3100,分别占基因总数的42、60和26。可见,有相当一部分基因对生物体的存活没有影响。原因之一可能是冗余(也即多拷贝)基因的存在,一种蛋白质可以由几个基因编码,只有当所有这些基因都失活后才可产生致死效应。另外,基因组中是否存在非必需基因,其比例是多少,基因以外的DNA序列的功能是什么等问题仍有待阐明。四、基因组学的意义 早在20世纪70年代就已经开始测定病毒基因组全序列,但由于测序技术的限制,还难于对较大的基因组进行测序。自从微生物基因组

18、计划和人类基因组计划分别于1986年和1990年启动以来,随着自动测序技术及计算机与生物信息学等辅助分析技术的迅猛发展,到目前为止已经完成了近200种生物体的基因组测序工作。为什么要投入巨大的人力物力从事基因组测序?一言以蔽之,基因组序列编码生物体的所有遗传信息,基因组测序是全方位认识生命的必由之路和首要任务。人类基因组计划,各种模式生物基因组计划 (如线虫、果蝇、小鼠等),病原体基因组计划,以及具有重要经济价值的动植物基因组计划将对人类社会的各个层面产生广泛而深远的影响。 基因组计划源源不断地产生日益庞大而复杂的基因组数据,改变了生命科学研究的模式,为生命科学研究引入了新方向。生物学家能够从

19、整个基因组的尺度去研究一个物种或多个物种的全部基因及其功能网络,而不是孤立地研究单个或少数几个基因,这对于全面系统地认识生命具有重要意义。研究对象的规模化带来了科学实验的规模化,对科学家的素质及合作精神也提出了更高要求,企业化管理的大型实验室的出现,实验室之间甚至国际问的广泛科研协作是基因组科学的必然要求。小规模的“作坊”式研究模式已经日趋相形见绌。由吉 林 医 药 学 院 教 案(讲稿部分)教学过程时间分配于基因组计划产生海量的序列数据,在序列分析时对计算机硬件和软件提出了新的要求。基因及其产物并非单独起作用,而是参与在复杂的、相互联系的分子网络系统中,解析这些系统和他们的特性及相互作用对于

20、理解生物系统如何运行具有决定性意义,但这些系统的复杂性要远远超出分子生物学、遗传学已认识到的范畴,对其进行有效研究,呼唤新的理论指导、新的分析检测技术。因此基因组计划大大促进了生命科学内部各学科,生命科学与其他自然科学特别是计算机科学之间的交叉和发展。基因组计划大大加快了生命科学研究的步伐。例如过去鉴定一个人类孟德尔遗传疾病的致病基因曾经是一个复杂而繁重的任务,需要一个庞大的研究团队多年的努力才能完成,还有可能无法得到准确的结果,现在,只要有DNA样品和相应表型,一台连接互联网的计算机,一台PCR仪和一台DNA测序仪,少数几个研究人员几周的常规工作就能完成。有了小鼠基因组的全序列,鉴定导致小鼠

21、表型改变的基因突变就变得简单了,与人类基因组序列进行比较分析,对于人类基因功能的分析鉴定也有重要的指导意义(比较基因组学)。以基因组序列为基础设计的基因芯片(gene chip)使过去1个月才能完成一、两个基因的表达研究,飞跃到现在一个下午即可完成成千上万个基因的表达谱的检测。临床上基于基因的疾病早期诊断和药物疗效与不良反应的鉴定也变得更加方便、快捷和准确。基因组学研究成果惠泽最多的莫过于医学。除了某些意外伤害,几乎每种人类疾病都受遗传因素的影响。虽然糖尿病、心脏病、肿瘤和精神病等常见病不遵循孟德尔遗传规律,但大量的家族谱系研究表明,这些疾病受遗传因素的重要影响。即使某些疾病或许受遗传因素影响

22、很小,但基因组科学对疾病发病机制的揭示仍有助于疾病的诊断和治疗。人类基因组中所有基因及其表达产物(蛋白质和RNA)种类的确认和功能解析,野生型基因或突变型基因及其表达产物与疾病的关系的研究,将会大大加快加深人们对疾病分子机制的认识,并描吉 林 医 药 学 院 教 案(讲稿部分)教学过程时间分配绘出能准确用于每一种疾病的预测、诊断及预后的基因或蛋白质指纹图谱 (fingerprint map),也将为药物的研究提供更多更有效的作用靶点,未来药物研制的动力将主要来自基因组及蛋白质组科学领域。人类个体之间DNA序列差异的研究,以及基因芯片与蛋白芯片(protein chip)技术,质谱(mass s

23、pectrometry,Ms)技术,快速测序技术等的发展和普及,将使基因组和蛋白质组范围内的快速、准确的分子诊断成为现实,人们将因此最大限度地了解自身对环境和疾病的易感性,从而制定出健康合理的饮食起居方案,通过调整工作与生活方式,调整自身心理状态,改善生存环境,以提高生活质量,增进健康,延长寿命。同一种疾病,同一种药物治疗,不同病人有不同的疗效,这种反应的差异往往与个体之间DNA序列差异有对应关系(也即药物基因组学),医生可根据每个人的基因组特点开出最优化的个体化处方,这就是所谓的“个体化医学”。另外,基因组学的成就将使基因治疗更为切实可行。基因治疗领域在过去几年经历了一连串的挫折和失败,其疗

24、效和安全性仍受到质疑,但随着人们对基因更全面、更深入细致的认识,随着更安全、更有效的载体的研制,基因治疗终究会被人们接受并得到普及。基因治疗用于B型血友病和重症混合型免疫缺陷病治疗的疗效预示其美好的前景。科学之路虽然崎岖不平,但基因组学将改变整个医学是必然的趋势。蛋白质组学与基因组学相辅相成,优势互补,此处一并将它们与医学之间的关系总结如图22。吉 林 医 药 学 院 教 案(讲稿部分)教学过程时间分配基因组学对人文的冲击也是显而易见的。从遗传学和生物进化的角度出发,人类基因组是人类共同的财富和遗产,他们共同担负起人类生存与发展的使命。人与人之间基因组序列的差异很小(约001),而且这种差异是

25、生物多样性的必然要求,每一种差异,即使与疾病相关,对人类的生存都是有意义的。因此,总体而言,基因无好坏优劣之分,每一种差异都应受到同等的尊重。特别是遗传病患者为人类承担了更多的痛苦,为人类进化作出了更大贡献,理应受到更多的尊敬和照顾。任何“优生”与“劣生”的“基因决定论”的观点都是没有科学根据,更是不符合人性的。因此,要严格保护个人的基因组信息的隐私,维护每一个社会成员的尊严。通过越来越多生物物种基因组及其功能的比较研究发现,物种之间有很多相似的地方,有千丝万缕的亲缘关系,因此,要更好地认识自己在自然界中的位置,正确处理好人与自然的关系。 科学是一把双刃剑。基因组学可以帮助我们理解生命,造福于

26、人类健康,但如果这些研究成果被生物恐怖分子利用,制造出足于识别“敌”“我”的个体、种族或其他群体特异性生物杀伤(灭绝)武器,将是人类的灾难。由于基因组序列的遗传性及个体之间区别与联系的最具代表性的生物学特性,社会学家和普通公众对可能引发的“基因歧视”深感忧虑。因此各国社会学家、政府官员及其他各个行业的管理和决策者必须与基因组学研究人员一道,研究制定具有全球约束力的政策措施和行为规范,以防止基因组学研究成果的滥用,防止“基因歧视”的发生。第二节 真核生物基因组 真核生物是一类形态结构差异极大的生物群体,包括动物、植物、真菌和原生动物。尽管真核生物基因组的大小、结构与功能有很大差异,但都有一些共同

27、的特征,如:真核生物基因组分为细胞核基因组和细胞器基因组;细胞核基因组以线状DNA分子的形式存在于染色体中;大多数真核生物的基因是断裂基因,有内含子结构;有大量重复序列等。吉 林 医 药 学 院 教 案(讲稿部分)教学过程时间分配一、真核生物基因组的结构与功能特点 真核生物的遗传物质绝大部分存在于细胞核染色体,少部分存在于线粒体或叶绿体!中,因此真核生物基因组可分为细胞核基因组和细胞器基因组。 (一)真核生物细胞核基因组的结构与功能特点 真核生物基因组的物理结构相似,但不同物种之间细胞核基因组的大小相差悬殊,从107l012等。真核生物基因组远比病毒和原核生物基因组复杂。 1细胞核基因组由染色

28、体DNA组成 已知真核生物至少有2条染色体,DNA以线形分子的形式存在于染色体中。染色体的数目与生物体的生物学特性并不相关。如酿酒酵母是低等真核生物,基因组大小仅有蝾螈的l10 000,但其染色体数目却比后者多。染色体数目尚不能传递有关基因组本身的任何有用的信息,而只是反映了基因组结构进化的不均一性。同一物种的染色体数目是恒定的,这对物种遗传的稳定性有重要意义。除配子细胞外,绝大多数真核生物体细胞都是二倍体(diploid),即每一体细胞有两套染色体,称为同源染色体,分别来自该个体的两个亲本,每一套染色体称为单倍体,也即体细胞有两份同源的基因组。 核小体(nuleosome)是DNA包装成染色

29、体的基本单位。核小体由核小体核心(nucleosome core)和连接DNA(1inket DNA)组成。核小体核心由组蛋白H2A、H2B、H3及H4各两分子所组成的八聚体和在八聚体上缠绕两圈的DNA组成,DNA长140bp150bp (与物种有关)。连接DNA由50bp70bp的DNA与连接组蛋白(1inker histone)组成。脊椎动物中的连接组蛋白有Hla、Hle、H10、H1t和H5。每个连接组蛋白附着一个核小体,但其确切位置尚不清楚。核小体连接在一起形成的念珠状结构是染色质的非包装形式(图23左)。念珠状结构盘曲形成直径约30nm的螺线管结构(图23右),螺线管结构是细胞吉 林

30、 医 药 学 院 教 案(讲稿部分)教学过程时间分配分裂问期常染色质的主要存在形式。螺线管结构进一步盘曲成环状,并通过其富含AT的序列(称支架结合区)与非组蛋白支架(nonhistone scaffold)相连接,由此形成的复合体进一步盘曲包装形成染色单体。图2-3 核小体及30nm螺线管结构染色质结构与基因的转录活性有密切关系。染色质结构至少通过两种途径影响基因表达水平:一是染色质上某一区段的包装程度影响该区段基因的表达,结构松散的区域 (如常染色质)易与基因表达调控蛋白相互作用,因而基因表达活跃,而结构致密的区域 (如异染色质)基因处于失活状态(图24左);二是核小体的细微结构影响基因表达

31、,典型的念珠状结构不利于基因表达,而未与组蛋白结合的DNA表现为高转录活性(图24右),换句话说,组蛋白存在与否决定基因是否表达,组蛋白覆盖蛋白(如RNA聚合酶)结合位点时,基因被关闭,蛋白结合位点暴露时,基因被打开。组蛋白的乙酰化与去乙酰化影响核小体的细微结构,乙酰化组蛋白对DNA亲和力降低,使DNA暴露出来,同时也抑制30nm螺线管结构的形成。异染色质中的组蛋白一般不被乙酰化。组蛋白的乙酰化与吉 林 医 药 学 院 教 案(讲稿部分)教学过程时间分配去乙酰化由乙酰化酶和去乙酰化酶催化。2真核生物的断裂基因 大多数真核生物的基因都是断裂基因。断裂基因是指基因的外显子是不连续排列的,被内含子隔

32、开,但按顺序镶嵌在DNA上。断裂基因两端起始和终止于外显子,外显子和内含子交替出现。如果一个基因有n个内含子,则相应地有n+1个外显子。断裂基因转录后产生精确对应于基因组DNA序列的RNA初级转录产物,内含子经剪接(splicing)后,外显子按顺序连接生成成熟的RNA。基因的断裂现象广泛存在于真核生物细胞核基因组中,包括编码mRNA、tRNA及rRNA(低等真核生物)的基因,在细胞器基因组中也发现断裂现象,主要是编码mRNA及rRNA的基因,甚至在某些古细菌(archaea,指在极端环境中生长的细菌)和大肠杆菌的噬菌体中也存在断裂基因。在真细菌(eubacteria,指一般意义上的细菌)基因

33、组中不存在断裂基因。在真核生物中,不是所有基因都是断裂基因,如组蛋白基因和干扰素基因等,在单细胞真核生物中,大多数基因也不是断裂基因。 断裂基因中的内含子一般是没有编码功能的,但内含子上的某些碱基突变可影响剪接过程而阻止RNA的成熟。内含子的确切功能尚不清楚,有学者认为有的内含子参与基因表达调控。不同物种的同源基因内含子的差异远大于外显子,有些含相同外显子的基因其内含子明显不同。这是因为在生物进化过程中,内含子与外显子以相同的频率突变,但由于多数内含子没有功能而不影吉 林 医 药 学 院 教 案(讲稿部分)教学过程时间分配响生物体的生存,使各种突变得以保留。断裂基因是基因选择性剪接的结构基础。

34、选择性剪接可以使一个简单的基因编码出许多不同的蛋白质,这是基因表达调控的一种方式。人类基因的选择性剪接非常普遍,保守的估计大约有35的基因存在选择性剪接,而在线虫中这一比例是22。 3真核生物的重复序列 大多数重复序列没有编码功能,人们常称其为垃圾DNA,然而它们实际上是生物进化信息的重要来源。重复序列保留了丰富的古生物学的记录,包含有生物进化事件和进化动力的线索。根据DNA的复性动力学特性,基因组DNA序列可以分为4种类型:单一序列(unique:sequence):又称非重复序列,是在基因组中只有1个或少数几个拷贝的序列。轻度重复序列:在基因组中有210个拷贝的序列(23个拷贝常被视为单一

35、序列),如人珠蛋白基因及酵母tRNA。中度重复序列:拷贝数在10至几千的序列,序列的平均长度约300bp,如rRNA基因、tRNA基因及其他非编码序列,后者可能在基因表达调控中起重要作用。高度重复序列:指一些简单的重复序列,拷贝数在1万以上,有的甚至达几百万个拷贝。一般认为绝大多数高度重复序列没有特殊功能,却占据了大量的基因组空间,因此称其为自私DNA(selfish DNA)。自私DNA在某些方面也许有功能,只是目前尚未发现而已。 真核生物大多数基因为单一序列,但其中编码序列仅占很小一部分。大量重复序列 (在基因组中占20一60)的存在是真核生物基因组的重要特征。通常越高等的真核生物,重复序

36、列越多。重复序列或集中成簇,或分散出现。有的重复序列有编码功能,称为多基因家族(multigene family),但大多数重复序列没有编码功能。多基因家族是指起源相同,序列相似,功能相关的一组基因。多基因家族分为两类:一类是基因家族成员相对集中地存在于某一染色体的特定区域,又称为基因簇(gene cluster),如人组蛋白基因簇集中分布在第7号染色体长臂3区2带至6带之间的区域内;另一类是基因家族成员在整个染色体上散在分布,吉 林 医 药 学 院 教 案(讲稿部分)教学过程时间分配甚至存在于不同染色体上。如人a和B珠蛋白基因分别存在于16和1 l号染色体上,但二者在各自的染色体上又相对集中

37、地出现,组成基因簇(图25)。 有的家族成员因突变而失活,不能表达出有活性的基因产物,称为假基因(pseudogene)。在高等真核生物基因组中有很多假基因。假基因与有功能的基因同源,原来可能也是有功能的基因,但由于突变(点突变、缺失等)而失活。有的假基因由于突变通常在基因编码区出现一个终止密码子,从而表达出截断蛋白(truncated protein)产物,称为常规假基因(conventional、pseudogene),这类假基因分布集中,如人珠蛋白多基因家族有5个常规假基因。有的假基因来自基因的转录产物,即基因转录后生成的RNA前体被剪接去除内含子,成熟的RNA经逆转录生成互补。DNA(

38、complementary DNA,cDNA),后者整合到基因组中成为假基因,这类假基因称为加工假基因(p)rocessed pseudogene),其结构特点是:缺失内含子,两侧有重复序列,5与3端与mRNA相似。由于整合是随机的,因此加工假基因通常是散在的。 (二)真核生物细胞器基因组的结构与功能特点 真核生物有两类细胞器能携带遗传物质:线粒体和叶绿体。这些遗传物质独立于细胞核基因组外自行复制和表达,又称为染色体外基因组。几乎所有的真核生物都有线粒体基因组,所有能进行光合作用的真核生物都有叶绿体基因组。大多数细胞器基因组是环状DNA,某些低等真核生物(如草履虫、衣滴虫和几种酵母)的线粒体D

39、NA是线状分子。通常每个细胞内有许多细胞器,每个细胞器基因组又有许多拷贝,如人类每个细胞有约800个线粒体,每个线粒体有10个拷贝的基因组。线粒体基因组大小差异较大,从10 000bp至数百万碱基对(bp) 不等。大多数动物细胞线粒体基因组较小,结构紧密,基因问只有少量间隔,人线粒体基因组是其典范(图26)。而低等生物(如酵母)和植物线粒体基因组较大,结构疏松,有内含子。叶绿体基因组大小差异较小,约10万20万bp。吉 林 医 药 学 院 教 案(讲稿部分)教学过程时间分配图2-6 人线粒体基因线粒体基因组编码其自身蛋白质合成体系的某些成员,如rRNA和tRNA等,以及呼吸链中的某些成员,如A

40、TP酶、NADH还原酶、细胞色素氧化酶复合体中的某些组分。线粒体蛋白质合成体系及呼吸链中的其他成员由细胞核基因组编码,在细胞质中合成后,再转运到线粒体。目前尚不清楚为何线粒体中的蛋白质合成须由细胞核和线粒体基因组共同参与。 在研究高等动物线粒体基因组过程中发现一些有趣的现象:母系遗传。子代线粒体基因组来自母亲,父系的线粒体基因组在精卵结合时一般不能进入卵细胞。因此,在子代个体发育过程中没有父母双方线粒体DNA的重组发生。线粒体DNA损伤后不易修复,这一点与衰老及某些疾病有关。遗传密码与通用遗传密码有差别,如GA(终止密码子)编码Trp,AGAAGG(A唱)为终止密码子,AuA(Ile)为起始密

41、码子并编码Met。 二、人类基因组计划 (一)什么是人类基因组计划 人类基因组计划(HGP)是阐明人类基因组30多亿碱基对(bp)的核苷酸序列,发现所有人类基因并确定其在染色体上的位置,发展基因组学新技术,探讨人类基因组研究的社会、法律与伦理等问题的一个国际性研究项目。HGP被誉为生命科学的“阿波罗”计划,但其意义是“阿波罗”登月计划所无法比拟的。HGP由美国科学家于1985年率先提出,于1990年10月1日正式启动,计划耗资30亿美元,在15年内完成人类基因组的图谱绘制和序列测定。HGP的主要内容包括:人类基因组遗传图谱和物理图谱的绘制;基因组测序;基因组序列的生物信息学分析,包括基因在染色

42、体上的定位及功能注释,重复序列的分布等;基因组研究技术(特别是大规模测序技术)的建立和发展;对模式生物(如酵母、线虫、果蝇和小鼠等)基因组进行研究;信息系统(包括数据的收集、储存和分析)的建立;交叉学科的技术训练,技术的转让,研究计划的外延等方面。HGP早期的努力主要集中在模式生物(如酵母和线虫)基因组研究上。这些项目的开展改进了DNA测序技术,为处理复杂基因组积累了宝贵的经验,也为人类基因组序列的功能注释提供了重要信息。人类基因组中的编码序列仅占15,将它与模式生物基因组序列进行比较,有利于识别出人类基因并确定其功能。1996年开展了一系列试验性测序工作,以检验人类基因组测序的可行性,几年内

43、这些努力获得成功。1999年3月正式开始了大规模人类基因组测序。由于大规模测序技术的完善,使得基因组测序的速度突飞猛进,在HGP开展之前,测12 000个碱基需1年或更长时间,在试验性测序期间需20min,而在正式测序时只需1 min即可完成。测序成本也由HGP刚开始时的每个碱基10美元降至10美分。2001年2月,人类基因组计划的科学家们公布了人类基因组工作框架图(working draft的序列、拼接和序列分析结果,2003年4月,人类基因组精细图 (fine map)绘制完成,比HGP原计划提前2年完成任务。 人类基因组计划的科学工作组织叫做“国际人类基因组测序协作组”(Internat

44、ional Hman Genome Sequencing Consortim,IHGSC),由6个国家20个研究所(或研究中心)的2 000多位科学工作者组成。这6个国家对HGP的贡献依次是:美国完成67,英国完成22,日本完成6,法国完成2,德国完成2,中国于1999年9月积极加入了这一研究计划,负责人类基因组1的测序任务,也就是3号染色体上的3000万个碱基对(bp),中国因此成为参与这一研究计划的惟一发展中国家。值得一提的是,一家私营公司在人类基因吉 林 医 药 学 院 教 案(讲稿部分)教学过程时间分配组计划中发挥了重要作用。该公司由CVenter教授于1998年创立,在公司创立之初就

45、提出在3年内完成人类基因组测序任务这一雄心勃勃的计划。由于该公司的初衷是力图获得基因组数据的专利,因此对HGP提出了挑战,也促成了HGP得以加速进行。在多方协调下,Celera公开了其测序数据,与HGP一起,于2002年2月分别在国际权威科学杂志Science和Nature上同时发表了人类基因组工作框架图的结果。两个测序结果总比一个好,通过数据比较能够使结果更趋一致和完善。HGP采用的测序策略是经典的逐步克隆法(clone by clone),而Celera采用的测序策略是全基因组鸟枪法(shotgun),但其序列组装利用了HGP公布的免费基因组图谱数据。 人类只有一个基因组,人类基因组的研究

46、成果应该成为人类共同享有的财富。如何更好地协调好合作与竞争,保证人类基因组基本信息不被用于商业目的,仍然是未来人类基因组研究领域不容回避的挑战。 (二)人类基因组概貌 拼接后的人类基因组序列只不过是一长串由4个字母(A、G、C、T)组成的碱基序列,如不经过注释,谁也读不懂这部由30多亿个字母写成的“天书”。与测序相比,人类基因组序列的功能研究是一项更艰巨的任务。在短时间内对这些海量数据进行全面的注释几乎是不可能的,其中还有大量未知领域有待探索。人类基因组测序完成之后随即进行的序列注释仅仅是应用现有的生物信息学技术,根据现有的人类及其他生物体基因组信息,对人类基因组的基本概貌所作的初步分析。当然

47、,这些初步分析的结果已经提供了全新的人类基因组的概观,也为未来人类基因组研究勾勒了蓝图。现将人类基因组序列分析的结果简述如下。 1GC含量Gc含量与基因的密度、重复序列组成、染色体区带及重组率有关。人类基因组中存在GC丰富区和贫乏区。GC含量有大幅度的波动,平均含量为41,波动范围在3365之间。吉 林 医 药 学 院 教 案(讲稿部分)教学过程时间分配2CpG岛 CpG岛(CpG island)的分布与基因的密度呈高度相关。二核苷酸CG在人类DNA中的含量非常低(08)。基因组中共有CpG岛50 267个,剔除重复序列中的CpG岛(一般无功能),共有28 890个。大多数CpG岛较短,小于1800bp,GC含量在6070。CpG岛在染色体间的分布不均,Y染色体中最少,每1兆碱基对(mega bp,Mb)有29个,19号染色体最多,每1Mb有43个,大多数染色体每1 Mb有515个CpG岛。 3染色体的重组率染色体短臂的重组率比长臂高,在染色体末端(20Mb35Mb)的重组率高,着丝粒部分的重组率低,女性重组率比男性重组率高得多。 4在减数分裂过程中,男性突变率是女性的2倍,说明大多数突变发生在男性。5重复序列的含量 重复序列至少占基因组的53,其中短散布元件(short interspersed repeated se

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1