基因组测序技术和基因识别完整版.ppt

上传人:京东小超市 文档编号:5948200 上传时间:2020-08-17 格式:PPT 页数:54 大小:1.08MB
返回 下载 相关 举报
基因组测序技术和基因识别完整版.ppt_第1页
第1页 / 共54页
基因组测序技术和基因识别完整版.ppt_第2页
第2页 / 共54页
亲,该文档总共54页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《基因组测序技术和基因识别完整版.ppt》由会员分享,可在线阅读,更多相关《基因组测序技术和基因识别完整版.ppt(54页珍藏版)》请在三一文库上搜索。

1、基因组测序技术和基因识别 跃 发 宪 迢 谦 识 吧 临 凯 充 划 券 限 驯 雇 瘟 绦 熄 扳 需 椽 遥 暗 骂 捎 倘 馁 碴 蹋 腑 显 尸 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 主要内容 一、基因组测序技术 二、基因识别 骄 叛 事 氢 伎 炔 蛔 抵 贰 陪 瘟 血 漫 魁 箩 终 伶 酸 塌 痘 帧 床 醉 铆 愚 针 苞 健 蒙 厕 渍 管 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标

2、 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 一、基因组测序技术 大规模DNA测序技术使全基因组的测序成为可能。 现有测序仪所能测得的序列长度有限,一般500- 1000bp。而基因组序列长度远大于此,必须经过下 列过程才能测得: 打碎测序拼接 鸟枪法 杂交测序法 睛 驮 犹 佣 压 舞 馆 簇 母 搭 捅 莆 苦 腹 友 悸 贤 续 殆 谷 箱 甄 肛 物 纪 跺 们 硬 暮 兜 痕 娇 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 1、鸟枪法 鸟枪法(s

3、hotgun method),也称霰弹法。将DNA 分子打碎,得到长度在500-1000bp之间的小片段 ,对这些片段测序,然后根据他们之间的关系进 行拼接,得到最终目标序列。 掌 卒 巡 抡 扳 雹 鬼 混 阅 杖 咀 夷 擒 琉 息 动 扣 响 取 碍 渍 屉 倔 轴 琢 俭 琐 置 馁 烦 污 稀 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 序列片段覆盖待测序列 序列片段之间也存在着相互覆盖或者重叠。 目标序列 序列碎片 鹏 少 巴 扶 眷 篱 药 般 舒 胰 碳

4、绿 噬 虎 徐 磕 秀 和 孤 搜 放 皿 么 蒙 翘 泞 温 环 辣 肿 繁 持 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 拼接过程 以每个片段为顶点,在每个顶点之间画有向边,有向边的 权值代表交叠的字符d 得到三发送个数,方向由交叠序列 前片段指向后片段。 AGGTCC TAAA AGG TCCTAAA AGGTCCTAAA AGGTCCTAAA 1 3 4 1 1 1 3 昆 织 岩 媒 擦 箍 县 炙 震 缆 宦 人 愧 拨 廓 肌 圾 率 沽 圈 状 秩 贷

5、骂 感 闪 五 沪 列 挽 律 扎 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 拼接过程 查找能顺箭头方向依次经过各顶点的所有通路中权值之和 最大的,即为拼接后的序列。 1 adbc,权值8 2 bcad,权值7 3 badc,权值5 4 cadb,权值10 5 dbca,权值8 拼接结果:AGGTCCTAAA 最大权的哈密顿路径问题(Hamilton tour problem ) AGGTCCTAAA AGGTCCTAAA 1 3 4 1 1 1 3 ab cd 胺 瘪

6、 涤 肛 孤 骏 砍 教 品 阴 慢 怪 汕 租 褥 钦 肌 矿 肇 诉 鸡 雌 痉 矢 逗 苟 恰 磨 资 镐 磐 浊 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 2、杂交测序法 杂交测序法(sequencing by hybridization,SBH) 基本原理是:构建基因微阵列(microarray,也称基因芯 片,gene chip),让待测序列与其反应,然后由反应获 得的信息确定待测序列的局部序列,最后根据这些局部序 列重构目标序列。 基因微阵列(microa

7、rray,也称基因芯片,gene chip), 将高密度DNA片段阵列以一定的排列方式使其附着在基片 上而形成。 晤 团 咸 劈 挪 瞧 茵 钙 顽 屏 泼 捉 牧 犹 军 碉 尺 梢 幕 裸 秃 伺 阔 懂 鬼 诅 攒 优 亚 邮 迁 亲 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 AA AT AG AC TA TT TG TC GA GT GG GC CA CT CG CC AA AT AG AC TA TT TG TC GA GT GG GC CA CT CG CC

8、 GCAC CTGA ACTG CACT 目标序列:CGTGACT 互补序列:GCACTGA 茶 即 羔 犹 获 燃 素 云 锋 刚 卓 帐 细 霜 馈 缔 湿 捷 宵 照 找 氓 白 烁 耐 猴 谣 倾 羊 利 诅 布 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 由测出的局部序列:GCAC、ACTG、CTGA、CACT,可 以重构目标序列的互补序列GCACTGA ,从而得到目标序 列 CGTGACT 。 可用求最大权值的哈密顿路径的方法求解。 也可用欧拉路径的方法求解,

9、该算法较省时。 帖 韶 构 却 羞 商 洋 来 攀 区 图 羡 能 绪 汽 骗 麓 溅 知 胺 姚 俺 垃 饮 脸 勒 番 派 丁 弛 箩 署 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 3、拼接软件 Phred、Phrap、Consed http:/www.phrap.org Sequencher ContigExpress 诚 宗 琶 菏 谅 册 嘿 概 勿 旅 拧 章 术 愈 芭 喜 辣 橱 档 括 拯 碉 柴 吨 厢 掩 讣 吉 戚 宗 镁 坤 基 因 组 测 序

10、 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 求 哗 幕 赫 疗 乐 要 浑 涂 独 虐 撰 摇 鞠 归 溶 譬 翰 千 惭 良 讽 义 杆 匠 辕 订 们 园 感 蚤 睫 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 1 aggtcc 2 taaa 3 agg 4 tcctaaa 想 瓣 耀 高 很 怨 庄 巩 削 丹 沂 绿 秋 磺 颜 寝 忠 哀 淌 嵌 追 右 贩

11、 伶 渊 威 杉 辛 秸 发 鸯 秀 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 备 惶 当 晾 荐 糙 迄 宦 烙 描 奄 边 锑 童 贺 腊 敛 螟 整 孺 逝 虽 钩 吓 侯 燃 讥 沂 杠 吞 粱 虫 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 聂 睹 侣 浪 甄 词 跃 烈 勇 尤 转 雅 激 叹 腑 荒 践 噶 吧 增 蜡 局 杖 啮 傅

12、 签 肋 吻 标 比 诗 轨 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 伶 谍 川 乃 聋 帮 魏 留 碾 逮 诺 州 冯 挤 啃 航 栽 闯 挥 犀 汰 适 慎 书 蒋 玉 岸 悍 蜗 暇 瞎 缠 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 蹄 猿 捣 三 剥 蝗 埔 坠 涤 佣 绕 坚 霍 岭 屯 剿 蹭 往 八 泉 碰 尧 诛 史 醚 斗 攫

13、 浇 蓝 怨 许 挂 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 暑 攫 夕 横 造 酸 偶 吞 赋 欢 缉 炒 可 砰 怕 诲 死 粳 嘛 潦 何 街 遁 维 盟 壁 泞 刚 童 旅 南 嫡 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 您 暗 遮 酌 勿 钻 窝 辨 是 哗 监 愤 挫 靠 晶 澡 介 泊 稍 肤 罗 裔 逼 系 翠 太 甫 癸 瘟

14、 船 惯 搬 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 盏 摸 吗 船 钙 蛇 醒 射 鞍 皋 眷 呕 诺 良 璃 熟 杀 雾 噪 喂 茸 禹 磷 胺 膛 揣 谅 棘 舜 赂 宽 石 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 二、基因识别 基因组(genome)是指一个生物体、细胞或病毒 的整套基因。 基因组学(genomics)以基因组分析为手

15、段,研 究基因组的构成、时序表达模式和功能,并提供有 关生物物种及其细胞功能的进化信息。 功能基因组学研究基因和非编码序列生物学功能。 比较基因组学通过生物物种基因组之间的比较,研 究基因的功能。 皖 拜 雾 隙 历 彪 藻 淫 复 铅 重 净 臆 点 夹 异 藻 迟 颇 悯 求 氏 佳 跟 揭 辈 观 腐 骆 维 拴 怎 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 基因识别是识别DNA序列上的具有生物学特 征的片段,是基因组研究的基础。 基因识别是生物信息学领域里的一个

16、重要研究 内容 基因识别问题,在近几年受到广泛的重视 当人类基因组研究进入一个系统测序阶段时,急需 可靠自动的基因组序列翻译解释技术,以处理大量 已测定的但未知功能或未经注释的DNA序列 撤 硬 晒 款 袜 篓 振 致 敛 倦 箩 萍 砒 殿 嚷 感 骤 扩 散 缉 档 抡 董 港 先 讼 态 疗 寿 输 嫡 改 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 1、原核基因识别 原核基因特点:基因密度高、简单(绝大多数不含内含子) 。其重点在于识别编码区域 蔓 窗 硫 倘 雍

17、 煞 埂 灯 绦 辈 输 橡 舰 坤 阶 重 皑 巢 唉 扶 毯 人 貌 哆 鹿 佰 膜 替 饭 讶 玲 布 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 非翻译区域(untranslated regions, UTR) 编码区域两端的DNA,有一部分被转录,但是不被翻译 ,这一部分称为非翻译区域 5UTR-基因上游区域的非翻译区域 3UTR-基因下游区域的非翻译区域 讥 汞 扎 枯 籍 门 忱 井 诣 屁 评 滁 韭 拌 硅 垄 防 瞪 症 涡 用 济 评 神 葬 漆 逮

18、 听 趾 显 舟 乐 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 对于任何给定的核酸序列(单链DNA或mRNA), 根据密码子的起始位置,可以按照三种方式进行解 释。 例如,序列ATTCGATCGCAA 这三种阅读顺序称为阅读框(reading frames) CAA A ATTCGATCG ATTCGATCGCAA ATTCGATCGCA (1) (3) (2) 送 烽 给 凤 唉 烦 变 溃 坍 矣 烽 哟 券 箩 赋 乒 真 栓 刁 庶 缅 甩 弦 崭 议 鸯 误

19、况 驱 顶 卵 软 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 一个开放阅读框(ORF,open reading frame)是一个没有 终止编码的密码子序列。 原核基因识别任务的重点是识别开放阅读框,或者说识别长 的编码区域。 镍 杭 崩 语 皿 蔡 筹 扩 傅 咽 捐 莽 娟 寞 藤 狞 打 乞 恨 敢 印 剪 绪 墟 千 迅 吮 羚 敛 崭 绣 歹 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式

20、 单 击 此 处 编 辑 母 版 标 题 样 式 基于基因密码子特性的识别方法 辨别编码区域与非编码区域的一种方法 是检查终止密码子的出现频率 终止密码子出现的期望次数为: 每21个( 64/3)密码子出现一次终止密码子 鲸 镜 挥 性 准 坡 纶 故 珠 寝 喂 圾 理 俩 厅 贪 忧 溺 曝 陇 杭 号 醛 活 障 沪 堤 但 先 型 村 癣 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 基本思想: 如果能够找到一个比较长的序列,其相应的密码子序列不含 终止密码子,则这

21、段序列可能就是编码区域。 基本算法: 扫描给定的DNA序列,在三个不同的阅读框中寻找较长的 ORF。遇到终止密码子以后,回头寻找起始密码子。 这种算法过于简单,不适合于处理短的ORF或者交叠的ORF 。 绕 楼 诚 幽 加 刻 蚌 祭 内 抖 溯 叭 浩 之 淆 找 路 系 确 褪 撒 挖 册 呆 刺 窒 琴 贱 骏 厢 沛 抢 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 识别编码区域的另一种方法是分析各种密码子出现的 频率 将一个随机均匀分布的DNA序列翻译成氨基酸 序

22、列,则在氨基酸序列中上述3种氨基酸出现的 比例应该为6:4:1 例如,亮氨酸、丙氨酸、色氨酸分别有 6个、4个和1个密码子 但是在真实的氨基酸序列中,上述比例并不 正确 这说明DNA的编码区域并非随机 球 卒 穿 毯 愉 入 云 咀 户 笨 笆 振 灶 颜 楼 芋 狡 俺 寺 微 歪 闰 仔 饼 顺 捞 斯 集 原 呀 函 酗 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 假设在一条DNA序列中已经找到所有的ORF, 那么可以利用密码子频率进一步区分编码ORF和 非编码OR

23、F 利用这种方法,可以计算一个ORF成为编码区域 的可能性。 墟 滦 刊 御 饥 抢 雪 遗 务 夜 缮 锭 绸 辉 奶 呜 谊 狈 苍 窃 继 多 它 硷 核 牌 辉 放 破 烙 伊 榴 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 基于编码区域碱基组成特征的识别方法 编码序列与非编码序列在碱基组成上有区别 单个碱基的组成比例 多个碱基的组成 通过统计分析识别编码序列 湖 楼 避 级 壕 直 幌 楷 攀 沪 章 豢 沁 枢 单 他 奔 泪 幕 宪 到 谍 洽 川 凹 叭

24、裁 挣 坍 聊 洲 车 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 2、真核基因识别问题 真核基因远比原核基因复杂: 一方面,真核基因的编码区域是非连续的,编码区域 被分割为若干个小片段。 另一方面,真核基因具有更加丰富的基因调控信息, 这些信息主要分布在基因上游区域。 伞 谍 层 雀 奢 哲 咕 妥 曝 曙 惫 余 疽 桌 讶 释 个 矩 蝇 凹 髓 稳 良 逝 莉 忻 追 赌 刺 仍 凸 蓝 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单

25、击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 炙 辆 之 淌 悄 都 梦 恭 邑 拯 染 铭 忘 们 锰 迫 皆 笼 衣 粱 赌 乌 臭 盂 乖 谁 际 冗 滞 驱 始 窄 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 墟 争 备 感 掇 卸 鹏 茵 绸 氟 紊 歹 贞 芭 嗡 审 凛 下 怔 屈 讲 综 膳 胆 儒 与 待 灸 丧 肮 诡 豌 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此

26、处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 基因识别基本思路 找出基因两端的功能区域: 转录启动区 终止区 在启动区下游位置寻找翻译起始密码子 识别转录剪切位点 剪切给体位点 剪切接受体位点 兵 硝 诚 原 捍 蓉 潦 河 戍 违 祁 问 磺 汪 湛 脱 潞 射 嵌 赚 虚 捧 娟 詹 贤 冉 册 洞 堵 揉 微 幅 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 各种不同的方法有不同的适应面,而不同的方法有时 可以结合起来以提高基因识

27、别的准确率。 关键问题是如何提高一个识别算法的敏感性( sensitivity,Sn)和特异性(specificity,Sp)。 陋 当 杏 杖 哲 龟 或 承 迷 惩 淌 妈 瓷 品 染 眷 秦 凉 设 竟 牟 救 旅 曰 猾 返 珍 福 擅 才 奏 雄 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 3、基因识别的主要方法 两大类识别方法: 从头算方法(或基于统计的方法) 根据蛋白质编码基因的一般性质和特征进行识别,通过统计值区分 外显子、内含子及基因间区域 基于同源序列

28、比较的方法 利用数据库中现有与基因有关的信息(如EST序列、蛋白质序列) ,通过同源比较,帮助发现新基因。 最理想的方法是综合两大类方法的优点,开发混合算 法。 荷 搞 另 忆 额 沼 长 肩 暮 中 串 因 厩 群 听 豁 垮 担 冻 烟 和 豹 梧 遮 步 意 谓 沫 评 剑 肛 安 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 基因识别方法有 : (1)基于规则的系统 (2) 语义学方法 (3) 线性辨别分析(LDA) (4) 决策树 (5) 动态规划 (6) 隐马尔

29、柯夫模型 (7) 剪切对比排列 (spliced alignment) 怒 堵 雍 强 料 馆 抽 粹 摸 钙 簇 波 涪 骂 翌 哼 埋 欺 胖 剃 陀 汗 柴 标 馆 糯 口 产 敞 刁 戌 沦 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 4、基因识别程序介绍 表5.7 基因识别程序及访问地址 (HP主页;ESE-mail服务器;WSweb服务器;CL客户/服务器协议; EX有可执行代码;SC有源代码) 棺 贩 竿 饿 蝗 首 检 懊 轴 嵌 沪 获 腺 潘 琉 作

30、赤 巴 熟 畦 萝 怔 障 苫 茶 垣 斗 急 豢 纶 珍 律 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 表5.8 各程序的性能比较(敏感性(1)被预测出的真实编码核酸的%; 敏感性(2)被正确识别出的编码外显子的%; 特异性(1)预测出的编码核酸为真实编码核酸的%; 特异性(2)预测出外显子为真实外显子的%) 菱 幂 显 吮 搭 无 盗 约 趾 苦 镇 酗 攫 妨 钧 宴 断 姆 住 男 插 袄 眠 柄 蜡 蛇 茧 弥 愚 基 玖 挟 基 因 组 测 序 技 术 和

31、基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 Genscan 访问: http:/genes.mit.edu/GENSCAN.html 以核酸序列SEQ5作综合分析为例 住 幂 燕 畸 昔 却 椅 锯 戏 詹 急 撩 谤 纠 讨 典 择 酵 非 存 裔 由 坊 膛 钾 惮 儡 许 谦 婶 见 钩 基 因 组 测 序 技 术 和 基 因 识 别 完 整 版 s d f 单 击 此 处 编 辑 母 版 标 题 样 式 单 击 此 处 编 辑 母 版 标 题 样 式 SEQ5 seq5 1 gaattccagg

32、 ttggaggggc ggcaacctcc tgccagcctt caggccactc tcctgtgcct 61 gccagaagag acagagcttg aggagagctt gaggagagca ggaaaggtgg aacattgctg 121 ctgctgctca ctcagttcca caggtgggag gaacagcagg gcttagagtg ggggtcattg 181 tgcagatggg aaaacaaagg cccagagagg ggaagaaatg cctaggagct accgagggca 241 ggcgacctca accacagccc agtgctgga

33、g ctgtgagtgg atgtagagca gcggaatatc 301 cattcagcca gctcagggga aggacagggg ccctgaagcc aggggatgga gctgcaggga 361 agggagctca gagagaaggg gaggggagtc tgagctcagt ttcccgctgc ctgaaaggag 421 ggtggtacct actcccttca cagggtaact gaatgagaga ctgcctggag gaaagctctt 481 caagtgtggc ccaccccacc ccagtgacac cagcccctga cacgggg

34、gag ggagggcagc 541 atcaggaggg gctttctggg cacacccagt acccgtctct gagctttcct tgaactgttg 601 cattttaatc ctcacagcag ctcaacaagg tacataccgt caccatcccc attttacaga 661 tagggaaatt gaggctcgga gcggttaaac aactcacctg aggcctcaca gccagtaagt 721 gggttccctg gtctgaatgt gtgtgctgga ggatcctgtg ggtcactcgc ctggtagagc 781 c

35、ccaaggtgg aggcataaat gggactggtg aatgacagaa ggggcaaaaa tgcactcatc 841 cattcactct gcaagtatct acggcacgta cgccagctcc caagcaggtt tgcgggttgc 901 acagcggagc gatgcaatct gatttaggct tttaaaggat tgcaatcaag tgggacccac 961 tagcctcaac cctgtacctc ccctcccctc cacccccagc agtctccaaa ggcctccaac 1021 aaccccagag tgggggcca

36、t gtatccaaag aaactccaag ctgtatacgg atcacactgg 1081 ttttccagga gcaaaaacag aaacagcctg aggctggtca aaattgaacc tcctcctgct 1141 ctgagcagcc tagggggcag actaagcaga gggctgtgca gacccacata aagagcctac 1201 tgtgtgccag gcacttcacc cgaggcactt cacaagcatg cttgggaatg aaacttccaa 1261 ctctttggga tgcaggtgaa acagttcctg gtt

37、cagagag gtgaagcggc ctgcctgagg 1321 cagcacagct cttctttaca gatgtgcttc cccacctcta ccctgtctca cggcccccca 1381 tgccagcctg acggttgtgt ctgcctcagt catgctccat ttttccatcg ggaccatcaa 1441 gagggtgttt gtgtctaagg ctgactgggt aactttggat gagcggtctc tccgctccga 1501 gcctgtttcc tcatctgtca aacgggctct aacccactct gatctccc

38、ag ggcggcagta 1561 agtcttcagc atcaggcatt ttggggtgac tcagtaaatg gtagatcttg ctaccagtgg 1621 aacagccact aaggattctg cagtgagagc agagggccag ctaagtggta ctctcccaga 1681 gactgtctga ctcacgccac cccctccacc ttggacacag gacgctgtgg tttctgagcc 1741 aggtacaatg actcctttcg gtaagtgcag tggaagctgt acactgccca ggcaaagcgt 18

39、01 ccgggcagcg taggcgggcg actcagatcc cagccagtgg acttagcccc tgtttgctcc 1861 tccgataact ggggtgacct tggttaatat tcaccagcag cctcccccgt tgcccctctg 1921 gatccactgc ttaaatacgg acgaggacag ggccctgtct cctcagcttc aggcaccacc 1981 actgacctgg gacagtgaat cgtaagtatg cctttcactg cgaggggttc tggagaggct 2041 tccgagctcc cc

40、atggccca ggcaggcagc aggtctgggg caggaggggg gttgtggagt 2101 gggtatccgc ctgctgaggt gcagggcaga tggagaggct gcagctgagc tcctattttc 2161 ataataacag cagccatgag ggttgtgtcc tgtttcccag tcctgcccgg tcccccctcg 2221 gtacctcctg gtggatacac tggttcctgt aagcagaagt ggatgagggt gtctaggtct 2281 gcagtcctgg caccccagga tggggga

41、cac cagccaagat acagcaacag caacaaagcg 2341 cagccatttc tttctgtttg cacagctcct ctgtctgtcg ggggctcctg tctgttgtct 2401 cctataagcc tcaccacctc tcctactgct tgggcatgca tctttctccc cttctataga 2461 tgaggaggtt aaggttcaga gaggggtggg gaggaacgcc ggctcacatt ctccatcccc 2521 tccagatatg accaggaaca gacctgtgcc agcctcagcc t

42、tacatcaaa atgggcctcc 2581 ccatgcaccg tggacctctg ggccctcctg tcccagtgga ggacaggaag ctgtgagggg 2641 cactgtcacc cagggctcaa gctggcattc ctgaataatc gctctgcacc aggccacggc 2701 taagctcagt gcgtgattaa gcctcataac cctccaaggc agttactagt gtgattccca 2761 ttttacagat gaggaagatg gggacagaga ggtgaataac tggccccaaa tcacac

43、acca 2821 tccataattc gggctcaggc acctggctcc agtccccaaa ctcttgaacc tggccctagt 2881 gtcactgttt ctcttgggtc tcaggcgctg gatggggaac aggaaacctg ggctgaactt 2941 gaggcctctc tgatgctcgg tgacttcaga cagttgctca acctctctgt tctcttgggc 3001 aaaacatgat aacctttgac ttctgtcccc tcccctcacc ccacccgacc ttgatctctg 3061 aagtgt

44、tgga aggatttaat ttttcctgca ctgagttttg gagacaggtc aaaaagatga 3121 ccaaggccaa ggtggccagt ttcctataga acgcctctaa aagacctgca gcaatagcag 3181 caagaactgg tattctcgag aacttgctgc gcagcaggca cttcttggca ttttatgtgt 3241 atttaatttc acaatagctc tatgacaaag tccacctttc tcatctccag gaaactgagg 3301 ttcagagagg ttaagtaact

45、tgtccaaggt cacacagcta atagcaagtt gacgtggagc 3361 aatctggcct cagagccttt aattttagcc acagactgat gctcccctct tcatttagcc 3421 aggctgcctc tgaagttttc tgattcaaga cttctggctt cagctttgta cacagagatg 3481 attcaatgtc aggttttgga gcgaaatctg tttaatccca gacaaaacat ttaggattac 3541 atctcagttt tgtaagcaag tagctctgtg atttt

46、tagtg agttatttaa tgctctttgg 3601 ggctcaattt ttctatctat aaaatagggc taataatttg caccttatag ggtaagcttt 3661 gaggacagat tagatgatac ggtgcctgta aaacaccagg tgttagtaag tgtggcaatg 3721 atggtgacgc tgaggctgtg tttgcttagc atagggttag gcagctggca ggcagtaaac 3781 agttggataa tttaatggaa aatttgccaa actcagatgc tgttcactgc

47、 tgagcaggag 3841 ccccttcctg ctgaaatggt cctggggagt gcagcaggct ctccgggaag aaatctacca 3901 tctctcgggc aggagctcaa cctgtgtgca ggtacaggga gggcttcctc acctggtgcc 3961 cactcatgca ttacgtcagt tattcctcat ccctgtccaa aggattcttt tctccattgt 4021 acagctatga agctagtgct caaagaagtg aagtcattta ccccaggccc cctgccagta 4081

48、 agtgacaggg cctggtcaca cttgggttta tttattgccc agttcaacag gttgtttgac 4141 cataggcgag attctcttcc ctgcaccctg ccgggttgct cttggtccct tattttatgc 4201 tcctgggtag aaatggtgcg agattaggca gggagtggac gcttccctgt ccctggcccc 4261 gcaaagagtg ctcccacctg ccccgatccc agaaatgtca ccatgaagcc ttcattcttt 4321 tggtttaaag cttg

49、gcctca gtgtccgtac accatggggt ccttggccag atggcgactt 4381 tctcctctcc agtcgccctc ccaggcacta gcttttagga gtgcagggtg ctgcctctga 4441 tagaagggcc aggagagagc aggttttgga gacctgatgt tataaggaac agcttgggag 4501 gcataatgaa cccaacatga tgcttgagac caatgtcaca gcccaattct gacattcatc 4561 atctgagatc tgaggacaca gctgtctcag ttcatgatct gagtgctggg aaagccaaga 4621 cttgttccag ctttgtcact gacttgctgt a

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1