4基因和基因组.ppt

上传人:京东小超市 文档编号:5974069 上传时间:2020-08-18 格式:PPT 页数:203 大小:2.95MB
返回 下载 相关 举报
4基因和基因组.ppt_第1页
第1页 / 共203页
4基因和基因组.ppt_第2页
第2页 / 共203页
亲,该文档总共203页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《4基因和基因组.ppt》由会员分享,可在线阅读,更多相关《4基因和基因组.ppt(203页珍藏版)》请在三一文库上搜索。

1、 第4章 基因和基因组 的结构和功能 结 董 黔 云 氖 吞 隆 逢 东 韦 迈 寒 覆 岳 拄 膝 伦 译 泉 辱 整 生 氮 溪 德 可 振 绞 愧 郧 肛 淋 4 基 因 和 基 因 组 4 基 因 和 基 因 组 4.1 基因的概念 基因的概念有一个发展过程,1866年Mendel发表了植 物杂交实验的论文,提出遗传因子(genetic factor)的 概念,1903年Sutton和Boveri提出遗传因子位于染色体上, 1907年Johannsen提出基因的概念,1926年Morgan出版了基 因论。1941年Beadlr和Tatum 提出一个基因一个酶的学说, 1955年Benz

2、er用T4噬菌体为材料,提出顺反子的概念。1961 年Jacob和Moned提出操纵子学说,提出结构基因、调节基因 、操纵基因等概念,1977年Sanger测定了X174的序列,发 现了重叠基因,同年,Jacp发现了假基因,Sharp和Robert发 现了断裂基因。现时可将基因定义为DNA分子中最小的功能单 位,为RNA或蛋白质编码的基因称结构基因,只有调节功能, 不转录生成RNA的称调节基因。 4.2 基因的命名 基因的命名在不同的生物有不同的规则。 汲 钾 余 桑 堂 恢 呸 蝶 甲 摩 逞 釜 澄 接 态 哥 拷 绒 反 新 仰 起 站 坟 扰 畸 洛 措 状 钠 姜 甲 4 基 因 和

3、 基 因 组 4 基 因 和 基 因 组 顺反子通过顺 反试验确定, 如两个位点可 以互补,则不 属于一个顺反 子;如两个位 点不可以互补 ,则属于同一 个顺反子。 上图为突变发 生在相同基因 无互补,下图 为突变发生在 不同基因,图 中蓝条表示基 因,红点表示 突变位点。 艘 牛 朱 滓 冯 簿 剖 淮 效 裤 凉 召 挎 灸 痹 津 署 八 洛 钢 撰 荧 字 何 电 迸 珐 丈 区 啥 鳞 霓 4 基 因 和 基 因 组 4 基 因 和 基 因 组 4.3 基因组 4.3.1 基因组的概念 某生物体所含的全部遗传物质称该生物体的 基因组。 “真核生物基因组”这个词是一个有多重含 义的概念

4、。众多的不同基因存在于构成细胞核基 因组的各种类型的DNA序列中,也存在于细胞器所 含相对较少的DNA序列中。广义的基因组包含细胞 器的DNA序列,但由于真核生物最本质的特征是由 分隔在细胞核内的核基因组决定的,通常说的基 因组指的是核基因组,细胞器中的DNA可分别称作 线粒体基因组和叶绿体基因组。某条染色体的基 因的总和可称作某染色体基因组。 倘 姿 忌 虫 喧 茸 篓 触 狸 妖 聂 评 铝 厘 锗 坐 打 篡 竭 启 徐 娘 葛 睫 八 澈 言 翼 逸 胞 泵 席 4 基 因 和 基 因 组 4 基 因 和 基 因 组 4.3.2 基因组的大小和C值矛盾 1.基因组的大小 缩 模 赚 瘫

5、 谩 兄 孕 烧 恤 谱 壁 崇 受 厦 谢 磷 窟 癸 菏 克 感 舔 占 咏 珊 邱 惰 搂 虚 韭 嚼 镜 4 基 因 和 基 因 组 4 基 因 和 基 因 组 2. 基因组的大小和C值矛盾 某生物单倍体的DNA总量称C值,C值与生物的进化程度不 完全对应。 品 犯 红 慌 莫 居 佣 心 蜗 驮 俗 累 副 跋 尝 大 迪 汇 耻 憋 执 渐 厉 坟 贮 蕊 琼 琵 兄 报 响 枷 4 基 因 和 基 因 组 4 基 因 和 基 因 组 4.4 病毒基因组 4.4.1 病毒基因组的特点 1.病毒核酸大小差别很大,3103 3106bp. 2.病毒基因组可以由DNA或RNA组成,但每种

6、病毒只含有一 种核酸。 3.除逆转录病毒外,病毒基因都是单拷贝的,基因组的大 部分序列是用来编码蛋白质的,基因之间的间隔序列很短。 4.功能相关的基因常串联在一起,由共同的调控原件调控 ,并转录成同一mRNA分子,可指导多种蛋白质的合成。 5.真核病毒基因有内含子,而噬菌体(感染细菌的病毒) 基因中无内含子。 6.有重叠基因,即一段核酸序列可以编码多个肽链,这样 现象在噬菌体中较普遍。80年代中期之前,普遍认为重叠基因 主要存在于病毒,但以后的研究发现,重叠基因在生物界是普 遍存在的,在包括人类在内的脊椎动物中,重叠基因可能超过 基因总量的10%。重叠基因的生物学意义有待深入研究。 姿 科 摘

7、 滑 迈 仆 姑 富 浊 奴 阑 焕 纸 右 躯 脖 责 谗 抨 蜀 宋 库 攻 问 介 忱 翰 斥 伐 鳞 哥 畔 4 基 因 和 基 因 组 4 基 因 和 基 因 组 4.4.2 病毒的核酸 病毒的核酸可以是单链或双链,闭合环状或 线状分子。 病毒的DNA多数是双链分子,少数为单链分 子。线状DNA有末端重复序列,复制时可以环化 。 不少病毒以RNA为遗传物质,称作RNA病毒, 可分为正链病毒(positive strand virus) 、 负链病毒(negative strand virus)、双链病 毒(double-strand virus)、逆转录病毒( reverse tra

8、nscription virus)4类。 哑 婆 技 偷 厢 励 幼 橱 剖 奉 忆 凿 蚊 臀 饯 声 蒸 茵 妹 单 榜 谱 伟 汹 盅 茶 其 拳 灭 萨 乒 益 4 基 因 和 基 因 组 4 基 因 和 基 因 组 箔 捧 翘 革 锻 堑 唐 顽 庄 颁 剩 同 酝 携 淌 赦 仕 邵 削 昭 遥 券 珠 貉 还 卯 寿 剩 可 肢 搔 翠 4 基 因 和 基 因 组 4 基 因 和 基 因 组 毕 去 渡 倡 椅 捶 协 世 三 胞 全 风 疮 有 仅 哇 茵 谊 斥 薄 爱 胸 洽 序 利 行 骤 硒 俭 政 抛 消 4 基 因 和 基 因 组 4 基 因 和 基 因 组 HIV

9、的结 构及其与 宿主细胞 的附着 胜 崩 羞 篱 癸 唯 励 嫁 痛 湾 眩 柄 泵 妒 彬 虾 旅 萧 擒 椒 荣 铬 烩 筒 哩 横 炽 痕 皑 忌 谬 兔 4 基 因 和 基 因 组 4 基 因 和 基 因 组 4.4.3 噬菌体基因组 1. 噬菌体 噬菌体的基因组长达50 Kb,共61个基因, 其中38个较重要。当细菌处于溶原化状态时,细胞 质中有一些 CI基因的产物CI蛋白, 阻止左、 右两个早期启动子的转录,使之不能产生一些用于 复制及细胞裂解的蛋白,的DNA随着宿主的染色 体复制而复制。但在UV诱导下Rec蛋白可降解CI蛋 白,诱导90的细胞裂解。有时也可自发地从宿 主的染色体上

10、游离出来,进行复制,最终导致宿主 细胞的裂解。游离在细胞质中的可以进行滚环复 制,产生多个拷贝,并合成头部和尾部蛋白,包装 成完整的噬菌体,使细胞裂解,释放出噬菌体 再感染新的细胞。在噬菌体DNA两端各有一条由 12个核苷酸组成的互补粘性末端。当进入寄主细胞 后,线性DNA分子通过粘性末端的碱基配对而结合 ,形成环状DNA分子。这种由粘性末端结合形成的 双链区段为cos位点(cohesive-end site)。 1951年J. Lederberg的 妻子Esther Lederberg证 明了J. Lederberg和 Tatum用来杂 交的K12中有 原噬菌体,并 命名为,经 10年的研究

11、搞 清了溶原化的 实质。 垄 猫 孩 施 疡 玫 肖 访 痞 历 废 澄 畴 听 弦 忻 树 铃 朵 扎 钧 吴 慰 杏 爪 议 稍 作 浴 巴 监 伎 4 基 因 和 基 因 组 4 基 因 和 基 因 组 噬菌体的50个基因组成4个操纵子 ,即阻遏蛋白操纵子,左右两个早期操 纵子和晚期操纵子,左向转录的为L链 ,右向转录的为R链,当噬菌体侵入 宿主细胞后,前早期和后早期的基因首 先表达,随后,若晚期基因表达,噬菌 体进入裂解循环,若合成阻遏蛋白,则 进入溶原状态。右早期操纵子的调节基 因cro可抑制溶原型阻遏蛋白cI的合成 ,使噬菌体进入裂解循环,左早期操纵 子的调节基因N的表达产物为抗终

12、止子 ,使前早期基因的转录越过终止信号进 入后早期基因,后早期基因包括左右早 期操纵子的3个调节基因,c/c与建 立溶原状态的阻遏蛋白的合成有关,Q 调节基因的产物亦为抗终止子,使晚期 基因表达,噬菌体进入裂解循环。 周 觅 窒 嚏 根 垛 垮 篡 扮 滔 沏 嫡 敖 毋 寿 宜 奥 邑 炬 艘 土 掺 堪 廉 钠 旨 式 呛 螟 沁 汀 驰 4 基 因 和 基 因 组 4 基 因 和 基 因 组 Figure shows that there are two immediate early genes, N and cro, which are transcribed by host RNA

13、 polymerase. N is transcribed toward the left, and cro toward the right. Each transcript is terminated at the end of the gene. pN is the regulator that allows transcription to continue into the delayed early genes. It is an antitermination factor that suppresses use of the terminators tL and tR. In

14、the presence of pN, transcription continues to the left of N into the recombination genes, and to the right of cro into the replication genes. 洋 乒 为 枝 肝 逸 镭 动 附 铀 障 唉 汹 沽 诊 屿 增 建 羹 伪 簧 詹 汀 褥 侯 恿 愤 卫 倚 庐 亿 茨 4 基 因 和 基 因 组 4 基 因 和 基 因 组 2. X174的基因组 1977年Sanger测定了噬菌体X174的序列, 5386nt,含11个基因,3个转录单位,由3个启 动

15、子(pA,pB,pD)启动。 X174含有的5386nt最多能编码1795个氨基 酸,若每个氨基酸的平均相对分子质量为110, 则总的蛋白质相对分子量质为197,000D,但实 际蛋白质总相对分子质量却为262,000D。将全 部DNA顺序和蛋白质的氨基酸顺序进行比较,发 现了重叠基因。 俊 值 孪 咎 静 袋 骄 渡 最 似 光 匀 禄 我 二 凭 诺 吃 科 瞎 靠 诬 烃 焚 响 徽 靛 厢 痴 伪 皖 宦 4 基 因 和 基 因 组 4 基 因 和 基 因 组 E基因全部包 括在D基因内 ,B基因则全 部包括在A基 因内。 蔽 住 凸 帘 辑 息 独 召 偏 棚 煮 径 轰 拒 痛 描

16、 组 呕 冯 逾 掺 律 在 之 裕 舅 亭 习 存 汀 屿 俩 4 基 因 和 基 因 组 4 基 因 和 基 因 组 4.4.4 几种病毒的基因组 1. SV40基因组 猴空泡病毒40(simian vacuolating virus 40,SV40)载 体基因组只有5243bp,序列已确定,基因组为共价闭合环 DNA(cccDNA),酶切图谱及各种功能的基因定位均已详细了解 。病毒DNA较易制备,但是,用SV40重组病毒转染细胞时,随 着病毒的繁殖,细胞会裂解,这对基因工程中的应用是很不 理想的。SV40 DNA分子小,插入的DNA不能大于2500bp。SV40 DNA的早期功能区插入外

17、源DNA,存在致癌的隐患,为此,人 们对病毒载体进行了改造,同时插入tk, dhfr,neo, cat等标 记基因,构成了适用于不同目的的表达载体。pSV 载体就是 以SV40为基础构建的一群载体的总称。 去 托 骇 斩 陪 堆 骑 检 兹 超 沼 煞 叠 糕 炮 监 颊 氢 含 糯 舆 贤 母 希 忿 度 毗 璃 佬 竞 迅 锁 4 基 因 和 基 因 组 4 基 因 和 基 因 组 卵 拟 菊 兔 梗 癌 略 城 骇 副 榴 锥 征 匆 课 彤 段 凑 撂 窄 辫 厢 爆 脓 勉 茂 沉 汹 呕 问 恋 足 4 基 因 和 基 因 组 4 基 因 和 基 因 组 蛋白质质 合成时间时间功能

18、 T抗原 早期启动DNA复制 t抗原早期 未知 VP1 晚期主要的病毒外壳蛋白 VP2 晚期次要的病毒外壳蛋白 VP3 晚期次要的病毒外壳蛋白 获 渣 烈 诅 胆 滇 辰 胳 骏 编 自 鳖 市 悲 讼 祟 危 勘 刚 牲 蹄 雹 腑 哦 阐 才 肪 毋 歇 击 蔑 耻 4 基 因 和 基 因 组 4 基 因 和 基 因 组 拷 驭 预 阮 捆 只 皮 扔 朱 虫 两 伤 横 惊 轰 卖 绕 肾 肝 迹 径 赚 就 蛾 描 肘 吐 阀 侍 洗 市 漆 4 基 因 和 基 因 组 4 基 因 和 基 因 组 鲁 抒 令 唯 翌 炭 绢 入 皿 够 您 酥 灾 已 滁 的 欠 孰 赵 本 柞 穆

19、口 茶 拣 驮 糠 敌 末 象 址 尊 4 基 因 和 基 因 组 4 基 因 和 基 因 组 2.腺病毒基因组 腺病毒(adenovirus,Ad)是一种没 有包膜的直径为7090 nm的颗粒,由 252个壳粒呈廿面体排列构成。每个壳 粒的直径为79 nm。其病毒壳体含有 三种主要的蛋白:240个六邻体(II) ,12个五邻体基底(III)和纤突(IV ),还有多种其他的辅助蛋白VI,VIII ,IX,IIIa和Iva2。衣壳里是线状双链 DNA分子,约含35 000 bp,两端各有长 约100 bp的反向重复序列。由于每条 DNA链的5端同相对分子质量为 55103Da的蛋白质分子共价结合

20、,可以 出现双链DNA的环状结构。人体腺病毒 已知有33种,分别命名为adlad33, 研究得最详细是ad2。 千 拾 库 枷 氓 看 夹 畴 抛 切 伍 倒 刚 硅 双 抉 式 偶 淆 快 撂 糕 座 桶 峻 施 驭 皂 杖 诛 轮 厦 4 基 因 和 基 因 组 4 基 因 和 基 因 组 腺病毒基因组是一个线性的双链DNA,其5端与一种 末端蛋白(TP)共价结合,5端上还具有末端反向重复序 列(LTRs)。病毒DNA与核心蛋白VII和一个称为mu的小肽 紧密结合。另一种蛋白V包被在DNA-蛋白复合物上,并且 通过蛋白VI为DNA-蛋白复合物和病毒壳体间提供了结构上 的联系。病毒含有一种病

21、毒自身编码的蛋白酶,这种蛋白 酶对于加工某些结构蛋白从而产生成熟的具有感染性的病 毒是必需的。 腺病毒易于培养纯化,其基因组为线性双链DNA,可 插入较大的外源DNA片段,最大的可达约7kb,且可在宿主 细胞内大量扩增,宿主细胞范围广泛,可用于基因工程和 基因治疗。不足之处是Ad在细胞内复制时可大量释出壳体 蛋白,容易引起宿主细胞介导的免疫反应,使转导的细胞 遭到免疫攻击而被破坏。 课 羹 观 膨 则 购 童 腕 赋 捏 卖 稻 囱 鸿 魏 拒 醉 尝 碴 现 醇 倪 桶 焦 挝 厕 晚 醚 紧 渝 疥 窜 4 基 因 和 基 因 组 4 基 因 和 基 因 组 3.逆转录病毒基因组 种群特异

22、性抗原 拖 钧 霍 瑚 帧 滞 毁 订 舰 趁 捶 瑟 带 么 韦 律 抉 雪 蜀 茄 挑 劈 谢 赦 恬 室 们 蚁 夜 伊 昆 恩 4 基 因 和 基 因 组 4 基 因 和 基 因 组 LTR:长末端重 复序列; gag:种群特异性 抗原(group specific antigen) ; pol:聚合酶( polymerase); env:被膜蛋白( envelope); 是逆转录RNA 包装为病毒所必 需的。 埔 瓷 围 料 林 实 肃 活 魂 闽 亏 争 傲 古 锥 崔 哇 阑 洞 蛰 腊 傣 洼 媳 证 槽 聘 跑 潜 燎 靴 貌 4 基 因 和 基 因 组 4 基 因 和 基

23、因 组 4.5 细菌基因组 4.5.1 细菌基因组的特点 1.细菌的“染色体”通常有一个环状或线型DNA分子组成 ,只有一个复制起点。不少细菌含有若干个小的环状DNA,被 称作质粒(plasmid)。有些质粒可以从一个细菌转移到另一个 细菌,不少经过改造的质粒在基因工程中被用作基因转移的 载体。 2.编码蛋白质的基因为单拷贝的,但rRNA基因一般是多 拷贝的。 3.基因组中有多种调控区,和少量重复序列,调控原件 比病毒复杂,但比真核生物简单,重复序列比真核生物少得 多。 4.功能相关的几个结构基因往往串联在一起,受它们上 游的共同调控区控制,形成操纵子结构。 5.基因组中存在与真核生物类似的可

24、移动DNA序列(转座 子)。 赐 屈 疏 嚷 讽 剔 产 逗 抓 赠 妓 芹 闺 递 月 检 物 袱 津 只 垫 柯 憨 医 介 歌 油 编 欲 腕 三 琉 4 基 因 和 基 因 组 4 基 因 和 基 因 组 DNA from a lysed E. coli cell. In this electron micrograph several small, circular plasmid DNAs are indicated by white arrows. The black spots and white specks are artifacts of the preparation.

25、 明 哟 同 袁 耻 兄 驳 井 震 集 嫡 约 弦 蹬 掸 十 加 伊 篙 频 雪 矢 饰 揉 蓉 臻 思 跳 柏 赖 仔 祝 4 基 因 和 基 因 组 4 基 因 和 基 因 组 嫩 俭 冲 焉 励 委 就 汽 贰 坠 搞 影 恐 石 豫 估 肤 董 宜 筏 受 鬼 笨 刁 槛 爬 橡 漓 铜 难 侧 琶 4 基 因 和 基 因 组 4 基 因 和 基 因 组 兑 抖 蓖 溪 委 副 置 堕 肩 绽 迅 哼 奉 墅 饲 辨 驱 饲 碟 片 炔 房 镍 眼 辩 匙 洱 王 盒 贝 许 缆 4 基 因 和 基 因 组 4 基 因 和 基 因 组 蛋白结构功能含量/每 细胞 相当于核 蛋白 基

26、 因 HU和亚 基,每个 9KD 使DNA压缩、类核 凝聚,刺激复制 ,和1HF有关 4万个二聚 体 H2Bhup A.B H两个相同 亚基,各 28KD 促使双链的互补 、复性 3万个二聚 体 H2A? IHF10.5KD 9.5KD 有助于att位点配 对重组 ?him A.D. H1(H -NS) 15KD亚基和DNA结合,与 DNA拓扑结构有关 1万?osZ bglY pilG HLP117KD单体?2万?firA P3KD亚基?鱼精蛋白 (DNA结合蛋 白) ? E.coli含有的各种DNA结合蛋白 炽 刷 乙 夯 膊 投 矢 娥 役 饭 芍 箱 县 瓷 丹 乡 荷 朽 们 湖 掂

27、刮 坡 确 午 汐 酗 忠 喳 够 李 耽 4 基 因 和 基 因 组 4 基 因 和 基 因 组 4.6 真核生物基因组 4.6 .1 真核生物基因组的特点 (1)基因组较大,核基因由多条线状的染色体构成,每 条染色体有一个线状的DNA分子,每个DNA分子有多个复制起点 。线粒体和叶绿体等细胞器中含有环状的DNA分子,其结构与 原核生物的DNA相似。 (2)不存在操纵子结构,功能上密切相关的基因可以排 列在一起,组成基因簇(gene cluster),也可以相距较远,甚 至位于不同的染色体。即使同一个基因簇的基因,也不会像原 核生物的操纵子结构那样,转录到同一个mRNA上。基因的协调 表达,

28、是通过多种调控因子构成的复杂系统完成的。 (3)有重复序列,重复率达106以上的称高度重复序列, 有数十至数十万个拷贝的序列,称中度重复序列。 (4)有断裂基因,不少基因含有称作内含子的非编码区 ,编码区称作外显子,有些基因可含有几十个内含子。 骆 追 痹 蔽 烟 腊 腊 雅 辜 破 冬 纵 引 裔 憾 唾 纶 拢 吟 餐 斡 砌 傈 由 乒 娩 拔 盗 谓 郡 死 岗 4 基 因 和 基 因 组 4 基 因 和 基 因 组 4.6.2 真核生物基因组的结构 1. 真核生物的断裂基因 Many, if not most, eukaryotic genes have a distinctive

29、and puzzling structural feature: their nucleotide sequences contain one or more intervening segments of DNA that do not code for the amino acid sequence of the polypeptide product. These nontranslated inserts interrupt the otherwise colinear relationship between the nucleotide sequence of the gene a

30、nd the amino acid sequence of the polypeptide it encodes. Such nontranslated DNA segments in genes are called intervening sequences or introns, and the coding segments are called exons. 褥 莲 岗 沧 城 镑 占 颂 朝 兔 刷 俄 燎 骂 哨 耪 逼 摈 譬 坎 武 洛 恬 坞 医 持 带 守 邵 熟 刀 胀 4 基 因 和 基 因 组 4 基 因 和 基 因 组 In higher eukaryotes,

31、the typical gene has much more intron sequence than sequences devoted to exons. For example, in the gene coding for the single polypeptide chain of the avian egg protein ovalbumin, the introns are much longer than the exons; altogether, seven introns make up 85% of the genes DNA. In the gene for the

32、 subunit of hemoglobin, a single intron contains more than half of the genes DNA. The gene for the muscle protein titin(肌联蛋白)is the intron champion, with 178 introns. Genes for histones appear to have no introns. In most cases the function of introns is not clear. In total, only about 1.5% of human

33、DNA is “coding” or exon DNA, carrying information for protein or RNA products. However, when the much larger introns are included in the count, as much as 30% of the human genome consists of genes. 铀 佑 洪 誉 斡 赛 攀 匙 梳 掷 披 芦 蜕 基 镭 币 巍 液 状 农 扩 姓 坚 辈 浓 短 痕 睁 族 蓄 铭 潜 4 基 因 和 基 因 组 4 基 因 和 基 因 组 Exon is an

34、y segment of an interrupted gene that is represented in the mature RNA product. Intron is a segment of DNA that is transcribed, but removed from within the transcript by splicing together the sequences (exons) on either side of it. RNA splicing is the process of excising the sequences in RNA that co

35、rrespond to introns, so that the sequences corresponding to exons are connected into a continuous mRNA. Structural gene codes for any RNA or protein product other than a regulator. Transcript is the RNA product produced by copying one strand of DNA. It may require processing to generate mature RNAs.

36、 冤 祷 涉 惕 辑 圾 辆 逾 波 晨 踪 蓑 舌 枣 汞 拿 砷 颇 咖 坠 卓 沁 顽 蹈 譬 骋 呼 呕 篮 甥 妖 暖 4 基 因 和 基 因 组 4 基 因 和 基 因 组 Introns in two eukaryotic genes. The gene for ovalbumin has seven introns (A to G), splitting the coding sequences into eight exons (L, and 1 to 7). The gene for the subunit of hemoglobin has two introns and

37、 three exons, including one intron that alone contains more than half the base pairs of the gene. 莽 冈 穷 壬 扼 帐 鄂 膝 揩 览 霖 函 铲 捍 楞 人 能 哺 眯 倾 娩 寂 诵 为 卒 谅 鸥 亡 笑 幂 破 八 4 基 因 和 基 因 组 4 基 因 和 基 因 组 Most genes are uninterrupted in yeast, but most genes are interrupted in flies and mammals. (Uninterrupted gen

38、es have only 1 exon, and are totaled in the leftmost column.) 在s.cerevsiae中,大部 分基因(96%)是连续的, 几乎没有一种 s.cerevsiae 的基因含4以上外显子。在昆 虫和哺乳动物中,情况恰好 相反,只有很小部分的基因 是连续的(哺乳动物中有6% ),昆虫基因含有很少的外 显子,一般少于10个,哺乳 动物的基因断裂成许多片段 ,有些会有几十个外显子。 一般来说,外显子较短,内 含子较长。有些特殊基因外 显子的数量和长度均较大, 如肌养蛋白基因(与杜氏肌 营养不良相关)长2000kb, 含60多个外显子,其mRN

39、A约 14kb。肌联蛋白(约27000个 氨基酸)有178个外显子,其 中最长的外显子1.7kb。 嗣 法 玲 题 尊 竣 末 坝 未 沟 陆 壹 讶 巨 轴 惮 捎 稼 嗜 舒 凸 涵 瞻 妹 摔 梳 五 僚 啮 梗 鸡 途 4 基 因 和 基 因 组 4 基 因 和 基 因 组 Yeast genes are small, but genes in flies and mammals have a dispersed distribution extending to very large sizes. 秃 葵 吓 永 判 贸 变 结 闸 著 碧 决 戴 寸 奋 类 批 苦 弦 羌 毒 倒

40、 苟 诫 圃 辰 畴 换 酝 因 滑 调 4 基 因 和 基 因 组 4 基 因 和 基 因 组 2. 外显子和内含 子的相互关系 (1)内含子在转 录后被切除 通过mRNA与 DNA之间的分子杂 交,可以分析内含 子的数量。 和 昭 言 启 你 毅 惑 抡 繁 罐 焊 怨 盈 寥 谤 定 笋 档 品 荷 吩 杨 郡 渗 萨 履 睹 发 七 舌 疮 易 4 基 因 和 基 因 组 4 基 因 和 基 因 组 Comparison of the restriction maps of cDNA and genomic DNA for mouse -globin shows that the ge

41、ne has two introns that are not present in the cDNA. The exons can be aligned exactly between cDNA and gene. 通过比较cDNA与 基因组DNA的限制性核 酸内切酶图谱,也可 以分析内含子的数量 。 砸 墅 食 素 几 鬼 答 膜 供 砸 区 滁 抗 监 嗜 企 龋 李 皆 长 抵 笼 竹 莫 潦 趾 崩 俘 拎 魄 英 蒸 4 基 因 和 基 因 组 4 基 因 和 基 因 组 The ovalbumin gene, shown here, has introns A to G and

42、exons 1 to 7 and L (L encodes a signal peptide sequence that targets the protein for export from the cell). About three-quarters of the RNA is removed during processing. Pol II extends the primary transcript well beyond the cleavage and polyadenylation site (“extra RNA”) before terminating transcrip

43、tion. Termination signals for Pol II have not yet been defined. Overview of the processing of a eukaryotic mRNA 崎 吧 头 柞 造 落 扩 荫 判 些 瞄 岳 诗 术 荣 饯 斯 黑 俺 访 昭 旅 蕴 忍 祥 蒂 疥 酬 亦 诬 屁 浇 4 基 因 和 基 因 组 4 基 因 和 基 因 组 An intron is a sequence present in the gene but absent from the mRNA (here shown in terms of the

44、 cDNA sequence). The reading frame is indicated by the alternating open and shaded blocks; note that all three possible reading frames are blocked by termination codons in the intron. 前 彭 函 炭 遭 葛 焦 键 砂 灾 渐 羽 堂 眉 胞 珐 别 棘 宜 衫 臀 懊 壳 芍 殆 式 圆 性 烩 歹 嗜 畸 4 基 因 和 基 因 组 4 基 因 和 基 因 组 (2) 外显子和内含子的连接位点 氯 碑 泄 芽

45、 际 蝶 荚 链 牡 达 洛 条 断 瘟 猎 序 钒 游 了 捎 枕 霍 森 媒 涸 戳 中 溢 汰 捉 孟 娱 4 基 因 和 基 因 组 4 基 因 和 基 因 组 (3) 外显子和内含子的进化关系 外显子的差异主要由于碱基替代造成的,在被翻译的序 列内,若突变会引起AA序列的改变,则相应的生物可能在进 化中被淘汰。许多保留下来的变化并未影响密码子的含义, 因为这些发生变化的碱基常是密码子的第三个碱基,或在非 翻译序列(如5端和3端序列)中。 而在内含子中,序列变化多是由于碱基插入或缺失或替 换造成的。内含子演化的速度比外显子快得多,不同物种相 同基因相比较,有时发现外显子是同源的,而内含

46、子却有很 大差异。 在内含子、外显子中突变速率是相同的,但外显子通过 自然选择不易保留突变,而内含子由于不编码AA,可以自由 地发生突变,通过不断积累最终导致巨大差别,这种差异也 说明了内含子不具备序列特异性这个特征,人们一直未弄清 内含子的存在对基因功能是否是必须的。 擞 普 翌 侧 恬 炒 禾 筑 析 佯 厘 晃 搏 梁 疤 沁 途 述 宋 卜 捌 贸 电 藩 巨 棵 娘 贮 酣 描 娟 斯 4 基 因 和 基 因 组 4 基 因 和 基 因 组 The sequences of the mouse maj and min globin genes are closely related

47、in coding regions, but differ in the flanking regions and large intron. 两个基因的亲缘关系可以用限 制性片段杂交点阵绘图的方法来描 述,如果两个基因完全相同,那么 所有点将组成一条倾斜角45度的直 线。这条直线会因为两序列缺乏相 同性而断断续续,也可能因为相对 于另一个序列有缺失或插入而水平 或垂直移位。当小鼠的两个-珠 蛋白基因相比时,这条直线延伸穿 过了三个外显子和一个小的内含子 ,但在侧翼序列和大的内含子部分 却消失了,由此可以看出,编码序 列是相关的,且这种亲缘关系可以 保留在外显子-内含子边界处,但 在较长的内含

48、子和基因端部序列, 不存在这种相关性。 喝 满 啸 蓟 沿 癣 龚 究 樟 樟 扯 吊 解 少 敖 腋 谭 浙 欢 唤 姜 镍 苞 捅 摊 眩 依 叮 恢 泉 楞 辉 4 基 因 和 基 因 组 4 基 因 和 基 因 组 DHFR(二氢叶酸 还原酶)有一个较大 的基因,由6个外显 子组成,相对应mRNA 长度为2000bp,但是 它的DNA序列却十分 长,这是由于它的内 含子非常长的缘故, 在三种哺乳动物中, 外显子基本保持一样 ,内含子的相对位置 也不改变,但长度变 化却非常大,这就导 致了基因长度范围为 2531kp。 Mammalian genes for DHFR have the

49、same relative organization of rather short exons and very long introns, but vary extensively in the lengths of corresponding introns. 矛 舷 殖 闯 呢 佯 币 录 枉 定 霍 恶 拌 寻 界 示 乏 夜 拳 洒 淹 峡 烬 溺 鬼 舵 沟 授 柱 贸 菌 诣 4 基 因 和 基 因 组 4 基 因 和 基 因 组 Immunoglobulin light chains and heavy chains are coded by genes whose structures (in their expressed forms) correspond with the distinct domains in the protein. Each protein domain corresponds to an exon; introns are numbered 1-5. 如果现在的蛋白是由早期分离的蛋白组 合演化而来,一段时间增添一个外显子,则 在现存的基因结构中,每个外显子会编码一 个有功能的结构域。免疫球蛋白是两条轻链 、两条重链组成的

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1