第一讲基因组测序与序列组装.ppt

上传人:京东小超市 文档编号:5910988 上传时间:2020-08-15 格式:PPT 页数:81 大小:841.50KB
返回 下载 相关 举报
第一讲基因组测序与序列组装.ppt_第1页
第1页 / 共81页
第一讲基因组测序与序列组装.ppt_第2页
第2页 / 共81页
亲,该文档总共81页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第一讲基因组测序与序列组装.ppt》由会员分享,可在线阅读,更多相关《第一讲基因组测序与序列组装.ppt(81页珍藏版)》请在三一文库上搜索。

1、私 业 冯 蚌 媚 棍 砌 按 惑 秽 购 游 祸 治 准 座 狂 瞳 耪 症 普 谋 溯 喀 盆 狞 慷 亚 僚 曰 幸 圆 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 第一讲 基因组测序与序列组装 任科教师: 余爱丽 生命科学院 分子生物 学与生物信息学系 糠 配 肤 虽 怨 瘁 吴 限 碰 侄 息 犬 笨 水 舍 袱 煽 纤 尺 虞 畴 铂 串 慑 呛 亡 轻 磕 膳 笋 敢 车 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 主要内容: n什么是基因组 n什么是基因 nD

2、NA测序的方法 nDNA序列的组装 n人类基因组计划 n水稻基因组计划 n后基因组学 咬 舵 望 蝴 螺 容 雪 振 叼 穴 胎 僳 博 够 泡 赖 棋 楷 溶 椿 逼 臀 欠 好 扫 写 俗 绢 坑 兽 忘 令 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 1. 什么是基因组 基因组就是一个物种 中所有基因的整体组 成。 基因组有两层意义: 遗传物质和遗传信息 。 要揭开生命的奥 秘,就需要从整体水 平研究基因的存在、 基因的结构与功能、 基因之间的相互关系 。 蛊 勃 祟 合 驼 本 汲 憋 疡 仕 殉 毗 局 艇 炙 浓 主 罕

3、懂 熟 芽 芦 钮 牟 蔑 畜 键 祝 舀 铜 巢 沤 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 Zea mays 8,000 Homo sapiens 3,000 Oryza sativa 400 Drosophila melanogaster 165 Arabidopsis thaliana 100 Saccharomyces cerevisiae 12 E.coli 4.6 Genome Size (Mb) 礼 猖 擒 捧 迅 妈 常 困 掘 哨 竿 战 踢 钠 绣 佑 苫 社 幼 芜 梅 荚 村 扁 深 竿 电 网 澡 圾

4、弹 搏 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 什么是C 值? 通常是指一种生物通常是指一种生物单倍体基因组单倍体基因组DNADNA的的 总量总量. . 在真核生物中,在真核生物中,C C值一般随着生物的进化而值一般随着生物的进化而 增加,高等生物增加,高等生物C C值一般大于低等生物。值一般大于低等生物。 C值悖理: 生物的复杂性与基因组的大小并不完全成比 例增加 诀 淀 哭 峨 袋 待 蹬 俘 褥 牺 那 吏 柒 循 碱 爬 洞 烦 欠 箭 嗜 警 如 嫌 羌 伎 卡 曲 母 衡 肖 没 第 一 讲 基 因 组 测 序 与 序

5、 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 细菌 真菌 等 动物 阴影部分为一个门内C-值的范围 陵 轩 羹 磕 藐 僵 备 红 约 脾 牡 吱 榷 肆 鬃 钝 炸 惋 震 阶 峪 匈 托 怨 咨 弦 猛 蔚 彦 键 激 吏 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 重复顺序 高度重复顺序: 长度:几个几千个bp 拷贝数:几百个上百万个 首尾相连,串联排列 集中分布于染色体的特定区段(如端粒,着丝粒等) 也称卫星DNA 中度重复顺序: 一般分散于整个基因组中; 长度和拷贝数差别很大 单一顺序: 基因主要位于单一

6、顺序 动物中单一顺序约占50 植物中单一顺序约占20 蠕 尔 娜 应 贮 醋 柯 将 缴 疽 衍 低 佳 俺 怕 厚 砒 祝 进 驼 卿 窍 静 形 砍 审 梭 猖 漆 省 类 咆 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 DNA 的复性 遵循二级反应动力学,可表述为 : dCt / dt = -KC02 反应达 t 时,单链DNA浓度 = Ct C0 = 单链 DNA起始浓度 K 复性速度常数 顺序复杂性 篙 娜 柞 弓 邑 矢 祷 今 喊 队 点 邱 局 获 饯 慎 知 鲜 怯 妮 韧 泊 额 困 妈 拦 凌 切 厕 睬 势 享

7、 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 Cot(1/2) = 1/K (mol. Sec / L) 常数 Ct/C0 0 1 0 1 C0t(1/2) C0t(1/2) C0t(1/2)值与基因组复杂性成正比。 甄 迹 悯 哄 裳 赃 逝 艘 兜 恐 饶 贸 幕 岿 芦 状 史 喝 哪 浦 拟 萨 痒 堰 钟 顾 岸 钢 韩 拇 木 河 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 是遗传信息的物理和功能单位,包含产生 一条多肽链或功能RNA所必需的全部核苷酸 序列。 基

8、因分类: 编码RNA的基因,如rRNA基因,snRNA 基因等; 编码蛋白质的基因 2. 什么是基因? 坦 蔡 拷 闻 遂 肢 草 喘 艘 锌 唐 忿 育 逻 诲 吊 俘 烯 德 穿 凉 扼 争 狰 埔 剪 掖 咏 称 桥 勋 袋 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 基因的不连续性 Intron 和Exon: 大多数真核生物蛋 白质基因的编码顺 序(Exon)都被或长 或短的非编码顺序 (Intron)隔开 圣 乍 眩 卓 冷 犹 菇 往 币 宠 栏 饼 诚 板 香 箍 党 阁 膀 秤 狞 庐 既 查 受 娇 傲 破 谤 致

9、昂 沏 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 基因家族 一群具有一致的或相似顺序的基因,有的还担负 类似的生物学功能, 可以相互补偿, 比如:E2f transcription factor Mouse symbolHuman Ortholog E2f1E2F1 E2f2E2F2 E2f3E2F3 E2f4E2F4 E2f5E2F5 E2f6E2F6 米 迹 绸 毡 琳 故 萧 肃 婪 伯 诀 检 身 咬 渝 殴 黎 叔 触 祟 贪 姨 传 拳 杭 臻 盖 秸 谎 亢 最 讳 第 一 讲 基 因 组 测 序 与 序 列 组 装

10、第 一 讲 基 因 组 测 序 与 序 列 组 装 假基因(Pseudogene) 来源于功能基因 但已失去活性 的DNA序列 产生假基因的原因有: 1. 由重复产生的假基因; 2. 加工的假基因, 由RNA反转录为cDNA 后再整合 到基因组中; 3. 残缺的基因(Truncated gene) 饼 保 跟 颇 品 链 别 艘 蜂 腺 乡 薄 阔 临 是 酗 盈 连 池 跃 驼 耕 之 纳 序 澈 册 曰 眨 泉 柠 坍 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 重叠基因重叠基因: : 同一段同一段DNA DNA 能携带两种不同蛋

11、白的信息能携带两种不同蛋白的信息. . 重迭基因有以下几种情况: *一个基因完全在另一个基因内部 *部分重叠 * 两个基因共用少数碱基对 蜜 怪 莹 俱 嘛 背 血 泅 仓 食 您 蝗 值 疏 梨 扰 松 窜 戍 抬 鸥 小 倡 窒 球 撒 巷 苍 巾 柔 临 讳 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 *一个基因完全在另一个 基因内部 如:B和A, E和D 其读码结构互不相同 -ATG-/-AATGCC -/-ATAACG-/-TAA- A* B ATGCCN-NNATAA 湿 刻 呸 曼 紫 抉 潮 驹 懒 曹 伎 泅 横 裴

12、 族 鹰 盐 凿 换 剂 佑 眠 弃 线 为 绚 健 柿 盼 否 甸 椎 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 *部分重叠 如: K和C *两个基因共用少数 碱基对 如: D和J -TAATG- D 终止密码子 J 起始密码子 删 柏 哼 含 便 烷 仰 浇 域 阵 责 田 凶 缝 乘 脯 殴 案 詹 廓 唁 佰 乎 内 遏 趾 熏 检 潜 相 盟 敝 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 3. DNA测序的方 法 n链终止法测序 n化学降解法测序 n自动化测序

13、n非常规DNA测序 波 笔 岳 乞 苯 怠 治 濒 塌 怕 占 满 掌 雁 郑 琳 甜 菠 炒 泻 腆 雍 排 廉 眷 犯 揍 洪 醛 难 酿 印 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 3.1 链终止法测序(the chain termination method) 基本原理: 通过合成与单链DNA互补的多核苷酸链, 由于合成的互补链可在不同位置随机终止反 应,产生只差一个核苷酸的DNA分子,从而 来读取待测DNA分子的顺序。 邑 猾 俐 贤 祷 骚 啦 烙 粥 桨 巡 掐 萍 馈 思 误 罪 葵 淳 湍 般 淬 炒 旧 它 蓬

14、 腻 夺 凹 奴 请 务 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 技术路线与要求 制备单链模板 将将单链单链 模板与一小段引物退火模板与一小段引物退火 加入加入DNADNA多聚多聚酶酶 4 4种脱氧核苷酸种脱氧核苷酸 分分别别加入少量加入少量4 4种双脱氧核苷酸种双脱氧核苷酸 将将4 4种反种反应产应产 物分物分别别在在4 4条泳道条泳道电电泳泳 根据根据4 4个碱基在个碱基在4 4条泳道的条泳道的终终止位置止位置读读出基因序列出基因序列 A 克隆于质粒中DNA用碱或热变性 B M13克隆单链DNA C 噬粒克隆DNA D PCR

15、产生单链DNA A 高酶活性 B 无53外切酶活性 C 无35外切酶活性 ddATP/ddCTP/ddGTP/ ddTTP 的3碳原子连接 的是氢原子,不是羟基 蔫 骋 纤 赁 整 董 瞅 悦 正 煎 网 竟 蹄 侦 羡 隙 崭 肪 达 煞 鹏 佑 皮 犬 勘 焚 陇 醋 款 些 能 铱 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 恩 凤 素 憨 建 格 憋 酸 挫 磊 脸 熙 蒂 占 闭 汪 罢 据 验 码 冤 号 迅 耪 淡 走 腹 狱 都 栓 墅 碴 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测

16、 序 与 序 列 组 装 导 妒 酒 愁 嗓 模 氯 裁 坠 酮 艇 领 劈 夜 狞 团 明 獭 沂 既 滔 彦 还 厄 欧 掀 铰 户 夷 悠 蓬 监 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 3.2 化学降解法测序 n基本原理: 在选定的核苷酸碱基中引入化学集 团,再用化合物处理,使DNA分子在被修 饰的位置降解. 浇 盐 陇 牙 桔 肆 彰 掺 裁 鄂 疲 淑 势 迷 才 蝶 巴 币 昆 唱 晦 矩 圃 膘 鬼 凹 斜 缚 瑟 效 萍 胡 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与

17、序 列 组 装 技术路线 将双链DNA样品变为单链 每个每个单链单链 的同一方向末端都用放射性同位素的同一方向末端都用放射性同位素 标记标记 , ,以便以便显显示示DNADNA条条带带 分分别别用不同方法用不同方法处处理理, ,获获得只差一个核苷酸的得只差一个核苷酸的 降解降解DNADNA群体群体 电电泳泳, ,读读取取DNADNA的核苷酸的核苷酸顺顺序序 缅 继 家 芒 亥 洒 扫 番 踞 脊 撅 叼 轰 咏 梗 拧 可 答 棺 免 肌 辫 平 苏 遭 腆 筑 沁 峭 汾 刹 戏 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 Maxa

18、m-Gilbert 法所用的化学技术 碱基特异修饰方法 GPh8.0,用硫酸二甲酯对 N7进行甲基化,使 C8-C9键对碱基裂解有特殊敏感性 A+GpH2.0 哌啶甲酸可使嘌呤环的N原子化,从 而导致脱嘌呤,并因此消弱腺嘌呤和鸟嘌呤 的糖苷键 C+T肼可打开嘧啶环 ,后者重新环化成五元环 后易除去 C1.5mol/L NaCl存在时,可用肼除去胞嘧啶 馁 牡 拙 雨 杠 彰 信 畸 崩 恳 监 逼 咽 鸿 框 伯 戈 狐 纤 秦 绪 世 泊 页 范 萍 泄 燥 偏 坑 箔 苛 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 化学法测序实例

19、 哌啶 旗 盯 到 纷 坞 唐 般 拒 千 漂 昏 禁 疑 肋 长 尼 目 胃 诧 掺 炳 泞 叛 旭 捂 帧 聘 察 鲁 躲 友 缅 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 3.3 自动化测序 n基本原理 与链终止法测序原理相同,只是用不同 的荧光色彩标记ddNTP,如ddATP标记红 色荧光,ddCTP标记蓝色荧光, ddGTP标 记黄色荧光, ddTTP标记绿色荧光.由于 每种ddNTP带有各自特定的荧光颜色,而 简化为由1个泳道同时判读4种碱基. 海 裔 摘 擎 班 醇 箍 懒 仍 岳 惭 椿 蝴 向 寺 紫 撵 脱 僧

20、赃 抖 尊 佃 飘 响 戳 券 疏 再 傈 笺 厕 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 素 仙 酋 烫 煞 娥 亩 笛 寇 臭 馆 粤 饵 去 旺 剿 读 冈 之 企 齿 棠 阻 灌 卖 青 劝 昆 怂 毁 晦 袜 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 3.4 非常规测序 n 毛细管电泳 用毛细管电泳取代聚丙烯凝胶平板电泳,节省时 间,加快测序进程,其他程序同链终止法或化学测序法. n 光点测序 脱氧三磷酸核苷酸连接到DNA 3-末端时会释放1 个焦磷酸(PPi

21、) ,焦磷酸在磷酸化酶的作用下转化为化 学能,并发出光亮.由此,往反应液中每次只加入1种核 苷酸,当加入的核苷酸结合时,反应液发出亮点,并记录 核苷酸种类;当核苷酸未结合时,反应液中的核苷酸酶 迅速分解此核苷酸,由此来测定DNA序列. 愉 拾 必 聘 驳 馅 砸 玖 网 秋 距 癣 寨 倚 寅 粕 预 煤 胆 蜀 娇 绕 眷 蛋 厨 用 蝉 嫉 舆 贵 庭 楷 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 nDNA芯片测序 基本原理 将各种排列顺序的寡核苷酸点播在芯片上, 每个点 播的寡核苷酸在排列的方阵中都有指定的位置.待检测 的DN

22、A分子与芯片温浴,凡是能杂交的寡核苷酸都会在 确定位置发出信号,然后根据获取的信息将寡核苷酸的 顺序进行对比组装,拼接成完全的DNA顺序. 擅 梭 暴 篙 绘 磨 采 森 便 励 炒 劲 秃 客 殃 导 瘴 巍 锤 耽 潭 晨 扛 端 癌 眩 伤 笔 邹 佃 随 舷 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 利用基因芯片进行杂交测序的原理 却 醋 瘦 标 破 葛 搐 任 带 络 摘 氏 量 扒 疵 箭 临 滩 抵 夏 钵 露 钩 晋 厕 设 互 蒲 炮 盗 邵 蚀 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基

23、因 组 测 序 与 序 列 组 装 4 序列的组装 4.1 随机测序与序列组装 随机测序也称”鸟枪法”. 序列组装原理:直接从已测序的小片段中寻找彼 此重叠的测序克隆,然后依次向两侧邻接的序列延伸. 优点:不需预先了解任何基因组的情况. ABC ABC ABC ABC 小片段测序 计算机拼装 扯 姥 缴 皆 定 蓑 缮 焊 爪 教 驮 伺 背 捎 潦 蜕 栏 怠 项 绍 缉 却 锯 椰 爵 咀 淮 掠 牛 矛 徐 翠 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 ABC 小片段测序 计算机拼装 鸟枪法(Shotgun)测序的问题 CAA

24、TGCATTA GCAGCCAATGC GAP 错装 怪 硷 靡 斤 灰 危 伸 廓 绕 返 锋 慢 表 乒 尘 辰 瞻 汐 窃 鲤 胡 颖 恋 淡 盒 甘 取 绦 蠢 羞 蜘 吸 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 实例:流感嗜血杆菌基因组的测序及 顺序组装 超声波打断纯化的基因组DNA 琼琼脂糖脂糖电电泳收集泳收集1.61.6 2.0Kb2.0Kb的区段、纯化的区段、纯化 构建到质粒载体中构建到质粒载体中 随机挑选随机挑选 1968719687个克隆个克隆 , ,进行进行 2864328643次测序次测序 , ,得到可读得

25、到可读 顺序为顺序为 11 631 485 bp11 631 485 bp 组装成组装成 140140个覆盖全基因组范围的独立的顺序重叠个覆盖全基因组范围的独立的顺序重叠 群群, , 焦 缕 还 卤 龄 递 瘴 笨 窖 吩 嘲 冻 钨 妈 叫 研 瞩 药 雇 些 敛 抵 诧 钎 桩 匣 茸 杀 垂 肉 镶 养 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 各重叠群间仍有间隙 顺序间隙 物理间隙 载体或宿主菌载体或宿主菌 选用不当而被丢失选用不当而被丢失 的顺序的顺序 测序时遗漏的测序测序时遗漏的测序 解决办法:通过相邻已知 顺序作为探针

26、筛选已有 的基因组文库 解决办法:利用其它宿主菌与 载体重新构建文库 榆 衰 鳃 绸 拴 歹 柏 爹 叭 尾 淘 优 横 作 噎 煎 镜 巳 对 沥 铲 且 骆 堆 掂 嗣 辙 咐 突 嚣 肢 罢 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 4.2 限制测序 n 限制测序:是指将一段染色体区段的DNA 顺 序进行组装. 一些已绘制了遗传图与物理图的微生物基 因组测序中也采用这一方法. 如高等植物拟南芥基因组的测序完全依据 克隆重叠群,先进行各个BAC克隆的随机测序, 再进行序列组装; 水稻基因组测序计划采取得策略与此相同 . 吓 烹

27、凿 纤 租 磋 致 找 奶 驯 柳 镶 桌 鼠 挝 产 栅 艇 访 惹 臃 坎 潘 颗 竟 姥 侯 瘩 丘 险 宾 诵 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 4.3 指导测序与序列组装 建立在基因组图谱基础上的”鸟枪法”,即所谓”指导 鸟枪法”或”指导测序”。 在人类基因组进入测序组装阶段就采用此方法, 其基本步骤如下: A 构建平均为2Kb的人类基因组质粒文库,进行双向 测序; B 构建平均10Kb的人类基因组质粒文库,进行双向测 序,读取2个端部顺序; C 参考人类基因组图,特别是大量的STS位标作为基点 ,进行序列组装,排

28、成重叠克隆群. 拾 绪 闰 蒋 咽 怀 期 对 旨 南 苍 双 贼 铝 铅 君 企 拿 伤 挝 蘸 暑 器 积 烁 晴 坎 连 勉 板 傀 脐 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 先将染色体打成比较大的片段(几十-几百Kb), 利用 分子标记将这些大片段排成重叠的克隆群(Contig), 分别 测序后拼装. 这种策略叫基于克隆群(contig-based)的策 略. ABC ABC 大片段contig 小片段测序拼装 潦 惩 敖 磨 卓 址 液 彭 嗜 子 侈 索 潞 追 顽 野 拂 妄 催 代 庄 粱 蓖 署 晓 籽 巢 雨

29、 伪 扮 脊 挤 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 两种策略的比较 鸟枪法策略 指导测序策略 不需背景信息 构建克隆群 (遗传、物理图谱) 时间短 需要几年的时间 需要大型计算机 得到的是草图(Draft) 得到精细图谱 蚂 兵 耪 恕 讥 趋 盖 育 犬 络 慰 病 柄 根 陕 慑 掖 蟹 龄 嫉 积 攻 塞 锹 激 蛋 险 卯 亭 宰 借 菌 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 4.5 其他测序路线 n重要区域优先测序 人们对感兴趣的基因或与疾病相关 的

30、基因优先测序. 如:人类主要组织相容性复合区位于第6 号染色体,与人类免疫系统有关,因而 优先测序. 臣 舌 踌 匝 膜 旗 玉 讫 俏 士 泌 敲 疗 喻 沥 躇 梭 凸 慧 芋 涧 孤 邵 观 叮 吊 礁 继 袒 光 轧 参 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 nEST (Expressed sequence tag) 测序 EST是一种重要的基因组图分子标记,以EST为探 针很容易从 cDNA文库中筛选全基因,又可从BAC克隆 中找到其基因组的基因序列. 优点: A mRNA 可直接反转录成cDNA,而且cDNA文库也比

31、 较容易构建; B 对cDNA文库大量测序,即可获得大量EST的序列; C EST为基因的编码区,不包括内含子和基因间区域, 一次测序的结果足以鉴定所代表的基因; 折 础 唇 厅 请 着 糠 晚 豆 稳 猿 人 苹 掐 看 樟 卒 馈 亩 酿 及 加 乎 程 湃 胚 篙 奇 斑 令 弯 桥 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 5.人类基因组计划 人类基因组计划 (Human genome project)于1990年 启动,我国于1999 年加入该计划,承 担其中1%的任务, 即人类3号染色体短 臂上约30Mb的测序 任务。

32、衍 累 墟 践 西 存 莹 愤 珐 蔓 思 盗 粪 嘴 厢 迟 趋 僳 锰 身 醋 越 棚 吟 麻 赊 痕 陶 摩 怜 吞 锭 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 5.1 人类基因组计划的目的 n阐明人类基因组30亿个碱 基对的序列,发现所有人 类基因,并搞清其在染色 体上的位置; n破译人类全部遗传信息, 使人类第一次在分子水平 上全面地认识自我; n解码生命、了解生命的起 源、了解生命体生长发育 的规律; n认识种属之间和个体之间 存在差异的起因、认识疾 病产生的机制以及长寿与 衰老等生命现象、为疾病 的诊治提供科学依据。

33、 苞 侥 镇 梳 佛 尚 腿 量 痹 骗 蛇 牺 盏 绩 涝 梯 习 迟 水 观 董 送 轿 皇 汕 秤 绕 柿 仿 落 曝 狠 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 5.2 人类基因组草图的完成 2000年6月26日是人 类历史上值得纪念的 一天。人类基因组的 工作草图已经绘制完 毕并于这天向全世界 公布。最终完成图要 求测序所用的克隆能 忠实地代表常染色体 的基因组结构,序列 错误率低于万分之一 。 迭 讨 金 甚 践 中 缀 墒 则 痢 卤 逼 苗 懒 艘 仓 谣 矫 五 措 喜 惯 涟 决 挞 镶 倒 氟 站 沧 粱 戈

34、 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 A. A. Celera Genomics Celera Genomics 人类基因组的测序人类基因组的测序 策略策略 5.3 5.3 人类基因组测序策略人类基因组测序策略 悠 渗 只 食 洼 构 漳 掷 拘 蛇 堂 镭 夷 撂 视 鞠 炙 悉 乃 秩 举 障 兵 罢 炬 给 稍 惭 抓 仓 汛 诺 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 采集采集5 5个自愿者的个自愿者的DNADNA样品样品 构建构建3 3种不同插入子大小的

35、基种不同插入子大小的基 因组文库因组文库2Kb, 10Kb2Kb, 10Kb和和50Kb50Kb 完成约完成约27002700万次万次 插入子末端测序插入子末端测序, , 总长总长14800Mb14800Mb GeneBankGeneBank下下 载载104018104018个个 BACBAC末端顺序末端顺序 PFPPFP发表的公开发表的公开 数据主要为数据主要为BACBAC 克隆的顺序克隆的顺序, ,共共 4443.3Mb4443.3Mb 随机测序与序列组装方法和 指导测序与序列组装方法 相结合进行序列组装 研 尔 恐 锋 螺 药 款 辛 效 劲 彩 晋 腑 瓷 拔 厕 溜 陇 属 碰 囚

36、粉 乌 夺 邯 竭 钞 芭 洞 凸 络 厅 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 B 国际人类基因组测序策略 构建BAC克隆 限制性限制性酶酶处处理理获获得指得指纹纹 根据指根据指纹纹重叠方法重叠方法组组建建BACBAC克隆重叠群克隆重叠群 根据根据STSSTS标记标记 , ,将将BACBAC克隆重叠群克隆重叠群标标定在物理定在物理图图上上 每个每个BACBAC克隆内部采用克隆内部采用鸟枪鸟枪 法法测测序序, ,组组装装 将将BACBAC插入插入顺顺序与序与BACBAC克隆指克隆指纹纹极重叠群极重叠群对对比比, ,将已将已阅读阅

37、读 的的 顺顺序序锚锚定到物理定到物理图图上上 瞥 试 娟 锁 磐 腊 逛 焚 秩 拂 肚 苹 些 姨 岛 琉 抖 敝 折 酵 琅 蹿 婉 凳 爱 护 旗 邪 赡 秃 源 虾 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 遂 陶 络 龋 惮 狱 琐 湿 隶 戳 役 疆 刃 拴 咖 喉 轩 夺 彝 翘 偷 瞎 疯 筐 菇 敬 党 舀 轮 争 惭 失 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 5.4 人类基因组测序结果 基因数是3万、4万还是10万 人类遗传基因数量比原先估 计的

38、少很多。目前研究表明, 人类基因组中约有3万至4万个 蛋白编码基因,仅仅是果蝇基 因数目的两倍,人有而鼠没有 的基因只有300个。此结论是 由两大科研小组的数据是从 DNA水平上得出的;而“人类有 10万多个基因”则是从RNA水平 上得出的结论。所以,这些数 据不能推翻“人类有10万个基 因”的说法。 敝 注 粟 柿 炽 拈 机 弃 杖 窿 着 幻 荔 罩 缨 拼 丘 钳 椰 吻 铭 振 互 余 嘘 枷 坞 悔 悔 入 施 拢 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 人类基因组研究的惊人发现 19号染色体是含基因最丰富的染色 体,

39、而13号染色体含基因量最少 目前已经发现和定位了26000多个功 能基因,其中尚有42%的基因尚不知 道功能 人类基因组中存在“热点”和大片“荒 漠”。在染色体上有基因成簇密集分 布的区域,也有大片的区域只有“无 用DNA” 不包含或含有极少基因 的成分。基因组上大约有14的区域 没有基因的片段。 353的基因包含重复的序列。 这说明那些原来被认为是“垃圾”的 DNA也起重要作用,应该被进一步研 究。 诲 幌 区 绪 频 棘 厉 气 倔 戴 缴 胰 亢 蔡 磕 飘 叉 附 尚 秩 曰 咳 郭 肠 铆 更 弛 玉 域 纯 衣 疟 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基

40、 因 组 测 序 与 序 列 组 装 什么是单核苷酸多态性 人类999的基因密码 是相同的,而差异不到0 1,不同人群仅有140 万个核苷酸差异。这些差 异是由“单一核苷酸多样性 ”(SNP)产生的,它构成 了不同个体的遗传基础, 个体的多样性被认为是产 生遗传疾病的原因。在整 个基因组序列中,人与人 之间的变异仅为万分之一 ,从而说明人类不同“种属 ”之间并没有本质上的区别 。 冯 狰 搭 猩 厩 旷 铡 布 巡 梨 曹 瘁 鞭 纳 子 乐 狈 式 违 伤 暇 究 弛 隙 臀 桃 客 颊 斯 酝 寄 陵 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与

41、序 列 组 装 5.5 人类基因组计划的意义 随着人类基因组逐渐 被破译,一张生命之图将 被绘就,人们的生活也将 发生巨大变化。人类基因 研究的意义在于它可以支 持和推动生命科学中一系 列重要的基础性研究。如 基因组遗传语言的破译, 基因的结构与功能关系, 生命的起源和进化,细胞 发育、生产、分化的分子 机理,疾病发生的机理等 。 砂 贬 谈 获 葬 驻 笔 匪 贰 指 顿 彼 蚜 篱 寇 浦 痛 桅 悠 礁 蚜 睬 蕊 惺 蔬 厄 考 哎 促 崖 岩 禄 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 5.6 人类基因组计划的论理学 A

42、 A 个人个人DNADNA顺序的隐私权顺序的隐私权. . 如如:” :”次等次等” ”基因携带者可能受到岐基因携带者可能受到岐 视视, ,职业职业 限制限制, ,医疗保险等问题医疗保险等问题; ; B B 基因专利问题基因专利问题 蕾 剪 乐 邻 形 曳 浓 焙 洽 想 皆 纬 汞 乏 猪 需 穴 琶 雄 案 镣 仑 嗅 宛 傲 奈 辐 序 循 晒 磕 升 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 6. 后人类基因组计划 伴随着人类基因组计划的 迅速进展,基因的全序列逐步 被完整的测出,会出现大量的 不知道任何功能信息的序列。 因此

43、,在HGP完成之后,即全 部人类基因被定序之后,还需 要: n破解贮存于基因组之中的遗传 语言; n识别、分离、鉴定和克隆所有 基因; n搞清每个基因的功能及基因之 间的相互作用和相互关系。 瞪 硷 虱 崎 输 李 泡 选 琵 虫 冕 匪 镐 占 讫 澜 雨 翰 劈 卧 茨 膏 冶 奈 晤 叙 铃 纤 厚 生 饭 膏 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 7 水稻的基因组 2002年我国科学家 完成了水稻基因组定序 和初步分析。出人意表 的是,水稻的基因竟比 人类基因还要多得多。 人类基因大约有3-4万个 ,水稻有46022-5

44、5615 个基因。因此水稻基因 组可说是继人类基因组 之后,完成定序的最大 基因组,也是至今已知 最大的植物基因组。由 于水稻是全球半数以上 人口的主食,对解决全 球粮食问题具有重要意 义。 猾 甄 据 抡 刚 瑟 孪 扦 诽 沛 吨 盈 钻 蔗 筋 撅 队 胯 歌 船 竟 沈 斥 卒 嘿 武 屯 腻 闺 卧 屉 概 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 本章要点 n链终止法测序 n人类基因组计划 n了解其他基因测序方法和基因拼接方法 裂 钵 宦 频 逊 霹 预 坟 小 渗 矫 委 释 晨 双 佩 嘎 鞘 祖 倚 甭 蓑 弥 堡

45、 咐 棍 卡 艇 王 漓 悍 佩 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 本章内容结束谢谢本章内容结束谢谢! ! 滑 旁 抬 恼 挚 糠 广 幕 小 毯 妨 碑 奢 迪 碰 芋 钒 涟 藤 锻 头 愧 证 旬 亿 且 搐 您 财 驭 铡 哀 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 第二讲 基因组序列诠释 组 意 借 烹 披 昼 宏 侨 一 萄 音 分 垣 认 弹 登 迂 交 惟 渣 睁 灼 胖 祸 饰 娶 索 元 然 蔚 单 膳 第 一 讲 基 因 组 测 序 与 序

46、 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 问题 n基因组序列所包含的全部遗传信息是什 么? n基因组作为一个整体如何行使其功能? n用什么方法寻找基因,研究基因地功能 呢? 杏 裔 两 赎 垮 汽 蚤 甭 秀 羞 怒 旺 识 释 坚 氧 鹤 三 速 旅 酗 生 菌 否 谷 渴 过 燕 绪 暗 刹 骡 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 主要内容: n寻找基因 n获取基因的全长cDNA序列 n确定DNA顺序中基因的位置 n研究基因的功能 n基因表达 n蛋白质组学 脏 炭 鼎 实 顾 唁 藐 蠕 表 辊 慌

47、 屎 网 烽 歉 洼 绝 贬 厚 瞬 伪 烽 惮 发 技 讹 种 姥 浊 嵌 音 叁 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 1. 寻找基因 1.1 根据开放读码框预测基因 A 起始密码子 ATG n n 第一个第一个ATGATG的确定则依据的确定则依据KozakKozak规则规则; ; Kozak Kozak规则是基于已知数据的统计结果,规则是基于已知数据的统计结果, 所谓所谓KozakKozak规则,即第一个规则,即第一个ATGATG侧翼序列的碱侧翼序列的碱 基分布所满足的统计规律基分布所满足的统计规律. . 坛 街 枉 卤 触 氮 孵 帝 伟 陆 蝉 遂 囊 祟 惶 简 瞥 铲 乌 黄 瑶 迢 辆 吉 畸 裸 量 皂 脑 贝 馆 赞 第 一 讲 基 因 组 测 序 与 序 列 组 装 第 一 讲 基 因 组 测 序 与 序 列 组 装 若将第一个ATG中的碱基A,T,G分别 标为1,2,3位,则

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1