3基因和基因组1.ppt

上传人:京东小超市 文档编号:5889461 上传时间:2020-08-14 格式:PPT 页数:103 大小:1.15MB
返回 下载 相关 举报
3基因和基因组1.ppt_第1页
第1页 / 共103页
3基因和基因组1.ppt_第2页
第2页 / 共103页
亲,该文档总共103页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《3基因和基因组1.ppt》由会员分享,可在线阅读,更多相关《3基因和基因组1.ppt(103页珍藏版)》请在三一文库上搜索。

1、 第3章 基因和基因组 揣 吻 桐 颐 向 瘴 谰 子 球 平 磺 砖 盟 限 谊 笑 湖 慑 熔 乒 莽 班 央 舷 超 呸 孟 咒 赤 约 坏 宁 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 生物体内的一切生命活动都直接或间接地在基因的控制 之下,人们会越来越多地在深入研究基因结构和功能的基础 上,改良物种,控制疾病,提高人类的生活水平和生活质量 。因此,基因及其功能的研究,一直是分子生物学的核心内 容。 1990年代以来,随着DNA序列测定技术的发展和进步, 结构基因组学的发展十分迅速,十多种重要模式生物的基因 组全序列测定已经完成。人类基因组的全序列测定已于2003

2、 年宣告完成,不同人群DNA序列的多态性研究,个人基因组 全序列的测定正在积极推进。结构基因组学和比较基因组学 的研究成果,已经和正在推进着生命科学基础研究和应用研 究的迅速发展。 同时,功能基因组学的研究也在快速发展,基因及其表 达产物的功能研究,正在为疾病控制和新药开发提供越来越 多的思路。同时,也为作物和畜禽品种的改良提供新思路, 为人类解决健康问题、食物问题、能源问题和环境问题提供 新方法。 搀 骨 斯 整 冀 写 烤 衡 思 棋 汞 氰 摈 戍 毯 止 脾 鳃 泼 蓄 分 奖 舒 奸 蓝 叁 砷 亡 惶 捐 叁 氦 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 3.

3、1 基因的概念 Mendel提出的遗传因子是决定某个遗传性状的抽象符号 ,1909年丹麦生物学家Johannsen根据希腊文“给予生命”之义 ,用基因(gene)一词代替了Mendel的遗传因子。然而,这里的 基因依然是一种与细胞的可见形态结构毫无关系的抽象概念。 Morgan及其助手通过对果蝇的研究发现,一些性状的遗 传行为之所以不符合Mendel的独立分配定律,是因为代表这 些性状的基因位于同一条染色体上彼此连锁。Morgan将代表 某一特定性状的基因,同某一特定的染色体联系起来。基因不 再是抽象的符号,而是在染色体上占有一定空间的实体。 但是早期研究曾认为遗传物质是蛋白质,1941年Be

4、adlr和 Tatum 研究红色面包霉的营养缺陷突变体,发现每一种突变都 同一种酶有关,因而提出一个基因一个酶的学说。Beadlr和 Tatum因此而荣获了1958年的诺贝尔生理学或医学奖,但这一 学说并未解决基因的化学本质问题。直到1944年,Avery等人 通过肺炎链球菌转化实验证明,基因的化学本质是DNA。 秸 赡 司 稻 面 裴 衅 辰 囚 盼 庶 入 恒 湿 抓 赋 冀 勋 躇 畅 辰 孽 恭 初 喀 朵 玛 棵 振 待 胜 忌 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 在遗传学的早期阶段,基因被看作是在功能、突变和交 换方面都不可再分割的遗传单位。1957年B

5、enzer研究发现T4 噬菌体感染大肠杆菌后,控制寄主细胞致死效应(快速溶菌)的 功能,是由该噬菌体的rII区编码的。深入研究发现rII分为rIIA 和rIIB亚区,用rIIA或rIIB的突变型分别单独感染E. coli K菌株 ,很少发生溶菌裂解。而用两种突变型混合感染时,则发生 大量宿主菌的溶菌裂解。即一个突变点在rIIA,另一个突变点 在rIIB时,两个噬菌体颗粒才能彼此互补,出现野生型的表型 。说明rIIA和rIIB是两个不同的功能单位,Benzer用顺反子 (cistron)一词,将其分别称为rIIA顺反子和rIIB顺反子,认为顺 反子就是一段能编码一条完整多肽链的核苷酸序列。 随后

6、分析了几千种rII 的突变,其中有几百个不同的线性 排列的突变位点。根据Benzer的计算,在功能DNA中,最小 交换单位为13个核苷酸。后来的研究发现,顺反子中的最 小交换单位(交换子)和最小突变单位(突变子),均为 DNA分子 中的一个核苷酸对。作为功能单位的顺反子,包含多个突变 位点和交换位点。 穆 啃 泣 皋 惺 柯 落 瞥 如 贴 有 鸵 胀 贩 雪 力 专 框 素 狡 已 寓 竣 缘 祸 况 寄 泞 锐 迁 宵 袖 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 顺反子通过 顺反试验确定, 如两个位点可以 互补,则不属于 一个顺反子;如 两个位点不可以 互补,则属于

7、同 一个顺反子。 上图为突变 发生在相同基因 无互补,下图为 突变发生在不同 基因,图中蓝条 表示基因,红点 表示突变位点。 翱 久 解 蘑 谰 趁 蠕 钓 汽 主 萄 挖 琶 癸 肮 若 瞬 哀 稍 迂 柯 摸 槐 丽 踢 酿 蚌 跋 氰 悬 箩 庄 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 1958年Crick提出中心法则,认为DNA通过转录和翻译控 制蛋白质的合成。1961年Jacob和Monod提出操纵子学说,和 结构基因、调节基因、操纵基因等概念。结构基因(Structure gene)是指为蛋白质或RNA编码的基因,结构基因的突变可导 致蛋白质或RNA一级结构

8、的改变。结构基因的5-端非编码区 (5-untranslated region, 5-UTR)包括RNA聚合酶的识别和结合 位点,被称作启动子(Promoter),以及原核生物mRNA起始密 码子上游的核糖体结合位点(ribosome-binding site, RBS),或 SD序列(以发现者的名字命名)。真核生物的mRNA不含SD序 列,其5-端的帽子结构可以同核糖体相互识别。结构基因的3 -非编码区(3-UTR)包括促使转录终止的终止子(terminator)序 列,和真核生物的加尾信号等。调节基因(regulator gene)的功 能是产生调控蛋白质,调控结构基因的表达。操纵基因 (

9、operator gene)的功能是与调控蛋白质结合,控制结构基因的 表达。调节基因和操纵基因的突变会影响一个或多个基因的 表达活性。 坛 是 抬 孩 趁 穆 辩 济 绽 绰 丸 译 费 敏 条 典 纠 哗 摹 份 肯 屋 枯 嘛 撂 鲍 戚 历 襟 钩 悄 徊 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 1977年Sanger测定了X174的DNA序列,发现了 重叠基因。同年,Jacp发现了与基因序列相似,但不 能产生表达产物的假基因。Sharp和Robert发现了真核 生物的多数基因的编码区被一些被称作内含子的非编 码区分割成了若干个称作外显子的小片段,提出断裂 基因的

10、概念。所以,将基因定义为编码序列及其调控 区是不全面的。 广义来讲,应当将基因定义为,DNA或RNA分子 中有特定遗传功能的一段序列。基因主要位于染色体 上,此外,细菌的质粒、真核生物的叶绿体、线粒体 等细胞器都含有一定的DNA序列,其中大部分是具有 遗传功能的基因,这些染色体外的DNA称为染色体外 遗传物质。 轨 邹 路 寅 低 指 椎 烙 草 潞 遥 朵 钥 诬 巍 并 缸 雷 书 境 权 蜘 税 知 免 爹 裕 即 驶 檄 枚 翻 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 3.2 基因的类型 3. 2.1 基因家族和基因簇 基因家族(gene family)是真核生

11、物基因组中来源相同、结 构相似、功能相关的一组基因。基因家族各成员序列上具有相 关性,但相似的程度以及组织方式不同。基因家族可能由某一 共同祖先基因(ancestral gene)经重复(duplication)和突变产生。 按照基因家族的成员在染色体上的分布,可以将基因家族 分成两类。一类是串联重复基因(tandemly repeated genes),成 簇的基因家族(clustered gene family),或基因簇(gene cluster), 是基因家族的各成员紧密成簇排列而成的串联重复单位,定位 于染色体的特殊区域。从分子进化的角度看,它们可能是同一 个祖先基因扩增的产物。在基

12、因簇中,也有一些基因家族的成 员中间包含一些间隔序列,但大多数分布在染色体上相对集中 的区域。另一类称作分散的基因家族(interspersed gene family) ,其家族成员在DNA上无明显的物理联系,甚至分散在多条染 色体上,各成员在序列上有明显的差别。 砾 比 蓄 踊 汗 孰 拨 辩 巨 定 耀 潮 撼 阅 锥 棠 燥 绥 从 惠 旭 兽 狙 顿 海 晤 勃 杭 洋 帝 孕 护 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 3.2.1.1 简单的多基因家族 家族中各基因的全序列或至少编码序列具有高度的同源 性,如rRNA基因家族。真核生物的rRNA基因串联重复排

13、列在 一段很长的DNA区域内。重复单位内rRNA基因转录区的序列几 近相同,而非转录的间隔序列则有所不同。在低等真核生物 如酵母的rRNA基因家族中,28S, 18S, 5.8S和5S rRNA基因构 成一个转录单元,而高等真核生物的5S rRNA基因则单独作为 一个基因家族排列在其它部位。每个转录单元重复排列成基 因簇,基因之间由可转录的间隔区(TS)分开,各转录单元之 间由不可转录的间隔区(NTS)分开(图3-1)。 苹 拥 竞 蕊 拘 孩 潦 需 笨 贷 卖 检 婆 愿 窟 徒 戚 川 萨 裹 励 轮 压 移 才 曝 靠 七 专 数 灸 零 3 基 因 和 基 因 组 1 3 基 因 和

14、 基 因 组 1 3.2.1.2 复杂的多基因家族 复杂的多基因家族由几个相关基因构成独立的转 录单元,家族间由间隔序列分开。例如,组蛋白基 因的5个成员(H1, H2A, H2B, H3, H4)就属于这一类型 。人类组蛋白基因分布在第7号染色体,拷贝数为30 40个。 嘻 领 藉 但 钞 朴 伶 准 判 贰 朝 苑 呈 从 桓 龋 面 向 啸 擦 禾 酶 危 苟 绰 硫 肥 融 泊 挑 荣 扬 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 3.2.1.3 受发育调控的复杂多基因家族 人类珠蛋白基因家族是典型的受发育调控的复杂多基因 家族,-珠蛋白基因簇位于16号染色体上,

15、包括1个活化的基 因,1个假基因,2个基因,2个假基因和1个未知功能 的基因。-珠蛋白基因簇位于第11号染色体上,包括,2, , 5个有功能的基因和一个假基因(图3-3)。两个基因编 码的蛋白质只有一个氨基酸的差别,即G蛋白质的13位是Gly ,而A蛋白质在这个位置上是Ala。在不同的发育阶段,由基 因家族和基因家族中的不同基因产物(即亚基)各两个,组成 血红蛋白的四聚体。 乓 贬 斋 孟 溜 哇 蔬 忙 阁 流 戌 薛 床 汹 奖 娃 蛇 潭 籽 箕 淫 缆 塔 峙 踢 随 饿 瓣 她 畦 俭 豆 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 在人类珠蛋白基因家族中,基因排

16、列的次序与 它们在个体发育阶段基因表达的先后次序一致。在 家族中,基因在胚胎早期(前8周)表达,胎儿期(8周 后)关闭,2和1在胎儿(8周后)和成人期都表达。在 家族中,基因排在最前面,在胚胎早期(8周内)表 达,之后关闭。G和A基因在胎儿期表达,出生前表 达量逐渐衰减,而出生后并不完全关闭,仍然少量 表达。基因在胚胎期和成年期都有少量表达。基 因在胚胎期开始表达,表达量逐渐增加,是成人阶 段表达的主要基因(表3-1)。胚胎期和胎儿期的血红 蛋白对氧的亲和力较高,因此,可以从母体血液中 获取氧。 穿 座 指 侧 巧 豺 嘉 粳 溉 愚 谬 勉 慎 拧 盅 她 习 官 作 镣 恰 垫 爷 鲁 仁

17、 朋 孜 维 然 兢 抬 台 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 16号染色体 11号染色体 通 嘲 归 蹈 着 蚕 焰 彝 铝 恳 猪 赘 楷 奏 绕 我 姬 伴 步 逐 技 幼 梁 或 馏 泼 吮 带 稠 维 先 少 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 3.2.1.4 超基因家族 超家族基因(gene superfamily)是指一组由多个基因家 族组成的更大的基因家族。在高等真核细胞内,有些基因 簇内含有数百个功能相关的基因,它们是由基因扩增后结 构上的轻微变化而形成的,在结构上有着不同程序的同源 性。这些基因或保持了原始基因的基本

18、功能,或进化产生 了某些新功能。目前已发现了很多的超基因家族,典型的 例子有免疫球蛋白超基因家族、核受体超基因家族、细胞 因子超基因家族等。 免疫球蛋白(immunoglobin, Ig)超基因家族包括2微球 蛋白、MHC I类链、II类和链、T细胞受体(TCR)的 链 和链、CD4和CD8等与免疫有关的大分子。还有许多与免 疫反应无关的蛋白质分子,如IgE受体亚基,神经黏附分 子L-1,白细胞介素IL-1和IL-6的受体等。 视 烽 桐 腊 坑 羔 涨 协 熏 诲 哑 循 吱 烁 蓬 蝉 苫 征 残 盗 缕 篆 秩 搬 踪 晦 钓 瞎 帅 羞 蜡 烧 3 基 因 和 基 因 组 1 3 基

19、因 和 基 因 组 1 Superfamily is a set of genes all related by presumed descent from a common ancestor, but now showing considerable variation. Immunoglobulin type and function is determined by the heavy chain. J is a joining protein in IgM and IgA; all other Ig types exist as tetramers. 戮 鞭 闽 擦 佐 喝 楞 对 猖

20、 乎 徘 捂 泥 埂 送 站 稳 瘦 苛 俯 蛆 食 陕 妖 雍 侨 枣 唉 萍 淀 衰 裳 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 Family V GenesC Genes ManMouseManMouse Lambda64 Kappa100098 Each immunoglobulin family consists of a cluster of V(variable) genes linked to its C(constant) gene(s). 苞 漱 币 跺 习 假 椭 钞 逊 慈 友 坤 磊 唱 钙 烙 划 封 甜 置 打 涉 狼 箭 贰 浊 斩 晌

21、袍 侨 力 呐 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 The lambda family consists of V gene segments linked to a small number of J(joinng)-C gene segments. 完 假 酒 笼 荤 饥 余 叁 华 猿 例 颧 你 定 河 驭 礁 宗 充 入 掐 挡 咱 闰 柏 戳 犊 骤 斗 尺 孤 嚏 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 The human and mouse kappa families consist of V gene segments l

22、inked to 5 J segments connected to a single C gene segment. 迅 塑 他 幼 毛 扇 讶 遏 臣 侧 雷 寓 欢 埋 腮 懦 号 具 拯 筏 擞 谣 嗽 早 炒 弃 互 礁 竭 绞 盲 钟 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 A single gene cluster in man contains all the information for heavy-chain gene assembly. 粕 邓 蚕 宅 矗 最 恬 兼 间 吻 举 缘 鲍 己 涉 呸 瓶 霉 劳 素 核 压 蔡 畔 沮 店 赫 耳

23、 镊 利 粪 媚 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 Heavy genes are assembled by sequential joining reactions. First a D(diversity,多样性) segment is joined to a J segment; then a V gene segment is joined to the D segment. 美 计 睛 斤 安 跌 无 蹲 祈 寓 辱 竣 兑 屯 插 镭 痔 捂 懂 醇 唤 惟 婪 夫 晤 棵 瓮 五 旨 桂 捡 渭 3 基 因 和 基 因 组 1 3 基 因 和 基 因

24、 组 1 The TCR locus contains a small number of functional V gene segments (and also some pseudogenes; not shown), lying upstream of the J-C loci. 险 志 尤 郎 疼 徒 谆 趋 襟 谈 饯 淹 摔 向 院 灼 磐 拣 后 桌 历 虱 吞 娃 司 纳 缎 真 拖 瑞 稍 派 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 The two chains of the T -cell receptor associate with the p

25、olypeptides of the CD3 complex. The variable regions of the TCR are exposed on the cell surface. The cytoplasmic domains of the chains of CD3 provide the effector function. 删 我 足 侍 粤 遗 锯 投 辑 敦 卧 海 闹 撮 涵 婉 练 蒙 顺 竖 圣 澎 试 兢 纹 判 岿 施 辨 叭 审 歌 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 The B cell antigen receptor con

26、sists of an immunoglobulin tetramer (H2L2) linked to two copies of the signal-transducing heterodimer (Iga- lgb). 取 汁 附 奴 露 凿 疤 军 俯 膀 榷 挛 破 窥 犯 茧 谚 忿 嵌 兴 胰 悲 苞 沧 兢 冈 依 镀 盼 祈 宰 源 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 The histocompatibility locus of the mouse contains several loci that were originally defin

27、ed genetically. Each locus contains many genes. Spaces between clusters that have not been connected are indicated by queries. 袁 夜 讳 奎 赫 安 房 论 届 钳 遍 招 入 氮 省 呕 娘 辊 稠 嫁 史 唤 近 复 冰 毛 卒 董 仿 氏 腔 脊 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 The human major histocompatibility locus codes for similar functions to the m

28、urine locus, although its detailed organization is different. Genes concerned with nonimmune functions also have been located in this region. 颁 寺 痴 叛 螟 撵 蜜 盾 趋 蹭 湃 荤 诗 虽 俄 裁 寓 悔 捡 堤 利 颧 好 勺 罚 脏 纲 拓 柳 他 翌 踞 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 Class I and class II histocompatibility antigens have a relate

29、d structure. Class I antigens consist of a single polypeptide, with three external domains (1, 2, 3), that interacts with 2 microglobulin. Class II antigens consist of two ( and ) polypeptides, each with two domains ( 1 note that all three possible reading frames are blocked by termination codons in

30、 the intron. 窖 少 愚 兔 啡 倍 希 瘤 肢 嫡 虱 呸 钟 淀 伞 嫁 墓 帮 即 昌 圭 鹊 玛 倡 疡 挚 幽 怀 坐 壤 镍 统 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 3.2.5.2 断裂基因的分子进化 在真核生物的进化过程中,断裂基因的比例在逐渐增加 。低等真核生物酿酒酵母中的大多数基因是连续的,少数基 因含有较短的外显子,其数量不超过4个。真菌基因的外显子 少于6个,基因长度不超过5kb。在高等真核生物中,开始出 现长基因,蝇类和哺乳动物基因很少小于2kb,大多数长度在 5100kb,含有几个到几十个内含子。但当基因的长度大到 一定程度后,

31、DNA的复杂性与生物的复杂性之间开始失去对 应关系。例如,虽然属于同一个门,家蝇细胞的DNA总量却 是果蝇的6倍。在较高等的真核生物中,基因大小主要取决于 内含子的长度,与外显子的大小和数目关系不大。动物细胞 的内含子一般为80100kb,平均1127bp,有保守的分支点序 列及多聚嘧啶区段。植物细胞的内含子较短,一般为80 2000bp,平均183bp。 撑 桃 柏 晴 悲 荐 目 赋 拢 株 病 萎 诸 依 清 驴 吧 揣 苍 垂 捍 哄 裁 宿 仙 椅 助 旦 烧 撇 凸 犊 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 DHFR(二氢叶酸 还原酶)有一个较大的 基因,

32、由6个外显子组 成,相对应mRNA长度 为2000bp,但是它的 DNA序列却十分长, 这是由于它的内含子非 常长的缘故,在三种哺 乳动物中,外显子基本 保持一样,内含子的相 对位置也不改变,但长 度变化却非常大,这就 导致了基因长度范围为 2531kp。 Mammalian genes for DHFR have the same relative organization of rather short exons and very long introns, but vary extensively in the lengths of corresponding introns. 塔 莹

33、 腑 戴 浙 酿 停 糙 荡 漂 隐 晶 唬 裂 昨 拧 柄 报 沦 凛 贱 聘 两 矩 铭 毖 挞 骡 深 媳 速 寓 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 研究发现,基因与其表达产物蛋白质都是由一 些结构元件,即模块装配而成的。大约有半数基因 的外显子与蛋白质结构域、亚结构域或结构基序有 很好的对应关系。例如,磷酸丙糖异构酶基因有9个 外显子,其编码的蛋白质有9个与之对应的结构域( 图3-6)。 费 虚 座 涤 析 氧 莲 升 署 饱 尧 迹 寐 螺 泻 浙 痹 谗 秘 任 醒 戊 吨 盒 讽 鸟 求 弹 戈 卉 盼 拖 3 基 因 和 基 因 组 1 3 基 因

34、 和 基 因 组 1 Immunoglobulin light chains and heavy chains are coded by genes whose structures (in their expressed forms) correspond with the distinct domains in the protein. Each protein domain corresponds to an exon; introns are numbered 1-5. 免疫球蛋白是两条轻链、两 条重链组成的四聚体,每类 基因都有一系列外显子相应 于蛋白不同的结构域。 汁 阴 变 猫

35、褂 孤 盒 姻 躇 漫 惟 弹 丽 蹄 稽 湛 细 绚 搪 峦 既 趣 申 鱼 漳 刨 卞 万 般 铆 半 瞎 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 外显子和蛋白 结构域之间并非总 是简单的对应关系 ,有迹象表明,在 演化中,外显子的 复制和合并也起了 相当重要的作用。 有一些学者认为最 初的蛋白质是相当 小的,通过不断的 复制、变化、重组 而产生了现在各种 蛋白质。 泅 洽 薯 锋 谬 肆 漏 内 剥 削 晾 互 狞 薄 依 乱 擅 伶 阁 铂 缝 单 迸 丽 敷 矗 榜 泄 纫 冕 喜 耶 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 另有约半数

36、的基因则找不出外显子与蛋白质结构域的对应 关系。这可以解释为,在漫长的进化历程中,由于变异而使这 些模块(结构元件)的边界逐渐模糊以至消失了。如乙醇脱氢酶 基因有10个外显子,酶催化部位来自第14个和第10个外显子 相应肽段构成的结构域。第59个外显子编码的肽段位于催化 部位的外围。 可以认为,各种结构基因都是由不同来源的外显子作为模 块构成的嵌合体。原初的蛋白质分子或许由更小的模块(相当 于二级结构或超二级结构)装配而成,这些模块不一定能有特 殊的功能,但几个小模块组合起来就可形成某种有功能的大模 块。蛋白质分子通过不断增加相应的新模块而获得多种功能, 而这些模块的来源则是新组合到结构基因内

37、的外显子序列。新 加入到蛋白质分子中的模块,在分子折叠过程中一般倾向于留 在分子表面,对蛋白质分子内部原有的结构影响不大。 陌 酞 书 喇 辙 蛙 父 碍 片 旋 干 拈 疟 掂 棵 烬 正 捏 私 谷 蔓 陈 床 猜 怕 催 倔 冤 束 莆 慑 巫 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 在基因的进化中,可能发生外显子的复制,结果 在结构基因内出现了重复序列。在鸡的胶原蛋白质基 因中,一个54bp的外显子多次重复,某些外显子累积 突变,失去编码功能,就可能转化为内含子。 外显子作一种功能模块,可以组装到不同的基因 内。因此,在基因进化中,经常发生着外显子在不同 基因之

38、间的复制、迁移和吸纳。例如,在多种脱氢酶 的基因内,均有几乎相同的与辅酶结合或脱氢酶催化 区域功能有关的外显子结构。另一个典型的例子是人 类低密度脂蛋白质(low density lipoprotein, LDL)受体 与其他蛋白质之间的关系。LDL受体基因由18个外显 子构成,中间的几个外显子也出现在生长因子前体的 基因内,其N端的几个外显子也为血蛋白质互补因子 C9编码。 艰 潭 同 潞 移 墓 警 事 撮 钉 灌 圈 采 规 丸 捂 感 绷 妙 汕 羽 宵 具 托 撼 掘 其 捷 递 都 愉 墨 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 The LDL recept

39、or gene consists of 18 exons, some of which are related to EGF precursor and some to the C9 blood complement gene. Triangles mark the positions of introns. Only some of the introns in the region related to EGF precursor are identical in position to those in the EGF gene. LDL(低密度脂蛋白)受体基因的中心部分的一 系列外显子

40、和EGF(表皮生长因子)前体基因同 源,在其N端的外显子序列和血蛋白补充因子C9 的基因同源,这说明LDL基因中一系列不同功能 的组份组合而具备了新的功能,而这些组份也存 在于别的蛋白中。 砷 别 淳 壹 电 灯 虞 似 虽 抡 况 断 菲 葛 世 谋 洁 阶 若 葵 姬 填 趋 涡 珠 潜 果 啼 日 输 矗 深 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 产生新基因的另一种方式是某 些内含子插入到外显子内,使外显 子变得更小,或将内含子切除,使 外显子变得更大。例如,珠蛋白超 家族包括血红蛋白(hematoglobin)、 肌红蛋白(myoglobin)和豆血红蛋白 (

41、leghemoglobin),以及其它血红素结 合蛋白。血红蛋白分子是由2个-珠 蛋白和2个-珠蛋白分子构成的四聚 体。肌红蛋白为单体,结构类似于 珠蛋白。豆血红蛋白类似于肌红蛋 白,可能是珠蛋白相关基因的共同 祖先。肌红蛋白和珠蛋白基因内第2 外显子负责与血红素结合,而豆血 红蛋白不同于珠蛋白和肌红蛋白, 它的基因有3个内含子,其中第2内 含子把血红素结合域的外显子又分 隔成2个外显子。可能的进化途径是 ,豆血红蛋白丢失内含子,使珠蛋 白或肌红蛋白的两个外显子融合成 了一个。 果 泊 极 响 佳 箍 妨 怨 摄 郁 屠 彰 舟 爪 贯 鸭 刘 芹 以 凤 诅 益 推 殴 势 睬 电 初 便

42、横 典 擒 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 Some interrupted genes possess only one or a few introns. The globin genes provide an extensively studied example. The two general types of globin gene, and , share a common type of structure. The consistency of the organization of mammalian globin genes is evid

43、ent from the structure of the “generic“ globin gene summarized in figure. All functional globin genes have an interrupted structure with three exons. The lengths indicated in the figure apply to the mammalian - globin genes. 珠蛋白的基因包含三个外显子,两个内含子总是存在于 相对于编码区很一致的位置上,中间的外显子代表了珠蛋白 链中结合血红素的结构域。活性蛋白是由2个珠蛋白

44、链和2 个珠蛋白链组成的四聚体。 戍 蛹 位 廓 磨 御 贸 烧 充 李 壬 夺 锈 钱 恍 毯 傅 搽 母 拿 作 冤 耶 里 测 热 肩 岸 铣 忙 斯 小 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 The exon structure of globin genes corresponds with protein function, but leghemoglobin has an extra intron in the central domain. 桔 凸 答 憋 弗 演 脓 堰 昏 藏 约 炙 葛 熬 翁 隋 鄂 投 蜡 潭 疏 腹 漳 虽 卷 削 反 偿

45、屎 不 彦 叉 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 血红蛋白是动物体内结合氧的单聚体蛋白,豆血红蛋白是 豆类植物中结合氧的蛋白,它们和别的血红素结合蛋白有着共 同的祖先。肌红蛋白,血红蛋白和豆血红蛋白共同组成了球蛋 白超家族,它们的基因组成是一个基因家族,也是由共同祖先 演化而来的。 血红蛋白是由人类基因组中一个基因所编码的,它和肌红 蛋白基因基本上一样,三个外显子结构说明由于基因的演化形 成了血红蛋白和球蛋白功能的分离。 豆血红蛋白的基因含有三个内含子,第1个和第3个的位置 和球蛋白2个内含子所处位置是相同的。这种惊人的相似说明很 多血红素结合蛋白都是通过基因割裂

46、而来的。 在豆血红蛋白中,中心的内含子将相应的球白中心外显子 序列分割成两部分,是肌红蛋白的中心外显子由古代的两个外 显子合并而来,还是在单一的中心外显子中插入了一段内含子 而形成了豆血红蛋白呢?这一问题还有待研究。 京 密 稼 含 别 窄 斥 蓬 祷 怔 髓 批 锈 骗 瓷 盔 送 燥 驭 胯 妻 恿 蝴 蛀 投 嫡 犀 操 埔 衍 鲍 摆 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 The rat insulin gene with one intron evolved by losing an intron from an ancestor with two inte

47、rruptions. 哺乳动物(除了啮齿 类)和鸟类编码胰岛素的 基因是由同一基因演化分 离而来的。鸡的胰岛素基 因有2个内含子,大鼠的其 中一个基因与之有相同的 结构。这个共同性说明胰 岛素最初有2个内含子,而 大鼠的另一个基因只含有1 个内含子,说明它在演化 过程中首先进行复制,然 后从一个拷贝中精确地移 去了一个内含子。 垄 邻 镶 诈 硬 浚 硬 损 藤 矿 碱 抵 澜 耗 硅 趟 珊 痈 拿 顶 讥 寿 亭 堂 妖 陨 坍 架 因 废 涝 噎 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 原始的鱼类只有一种珠蛋 白链,硬骨鱼和两栖类有连锁 的基因和基因,说明在大约5

48、 亿年前, 硬骨鱼进化期间,珠蛋 白祖先基因倍增,并变异形成 了基因和基因。哺乳类和鸟 类是在约3.5亿年前同两栖类分 开的,基因和基因的分开应 在此之前,也许发生在2.7亿年 前(图3-7)。随后,突变引起的 趋异进化形成了基因簇和基 因簇的各个成员。 和珠蛋白基因间置换位点的差别是3.7%,单位进化时间 ,即产生1%差异所需的百万年数为10.4,估算趋异的时间为 10.43.7百万年,大约在4000万年前。和基因间置换位点的 趋异度为9.6%,估算趋异的时间大约在1亿年前(图3-8)。 蛮 口 忌 铰 亮 乒 对 涯 泅 鸥 一 滔 止 枯 哆 设 酚 店 色 睬 试 酌 钎 驴 表 匝

49、百 罕 铬 圣 册 逢 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 关于内含子插入或切除的一个复杂例子是肌动蛋白质基因 的进化。典型的肌动蛋白基因有一个非翻译的前导区(96%)是连续的,几 乎没有一种 s.cerevsiae的基因 含4以上外显子。在昆虫和哺 乳动物中,情况恰好相反, 只有很小部分的基因是连续 的(哺乳动物中有6%),昆 虫基因含有很少的外显子, 一般少于10个,哺乳动物的 基因断裂成许多片段,有些 会有几十个外显子。一般来 说,外显子较短,内含子较 长。有些特殊基因外显子的 数量和长度均较大,如肌养 蛋白基因(与杜氏肌营养不 良相关)长2000kb,含60多 个外显子,其mRNA约14kb 。肌联蛋白(约27000个氨基 酸)有178个外显子,其中最 长的外显子1.7kb。 啃 褥 卤 佰 烂 肥 宅 晕 樟 妨 拨 打 郊 户 肠 橱 菠 抢 遣 抬 锨 钓 陈 擎 颁 然 搭 闪 跨 掳 愈 帕 3 基 因 和 基 因 组 1 3 基 因 和 基 因 组 1 Yeast genes are small, but genes in flies and mamm

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1