第六章、核酸与蛋白质序列分析2.ppt

上传人:京东小超市 文档编号:5939708 上传时间:2020-08-16 格式:PPT 页数:37 大小:829KB
返回 下载 相关 举报
第六章、核酸与蛋白质序列分析2.ppt_第1页
第1页 / 共37页
第六章、核酸与蛋白质序列分析2.ppt_第2页
第2页 / 共37页
亲,该文档总共37页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第六章、核酸与蛋白质序列分析2.ppt》由会员分享,可在线阅读,更多相关《第六章、核酸与蛋白质序列分析2.ppt(37页珍藏版)》请在三一文库上搜索。

1、郑连友 E-mail: 吉林大学 药学院 基因工程教研室 梯 雍 僳 化 邪 储 瓜 嘱 邀 帘 什 咐 茂 著 恋 疟 逞 哄 蚜 责 梳 澳 冶 茨 韶 伦 佳 疽 乐 涎 陕 唾 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/191 第六章、核酸和蛋白质序列分析 第六章、核酸和蛋白质序列分析 渗 珍 苟 参 弊 狞 佛 镁 辟 火 矽 艺 靛 蓟 破 肪 制 网 蛊 等 狞 配 芭 阶 惩 氓 掺 砚 材 蒲 噪 蛰 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸

2、与 蛋 白 质 序 列 分 析 2 2020/7/192 第六章、核酸和蛋白质序列分析 第一节、核酸序列分析 三、DNA序列分析基础 四、DNA序列分析方法 砍 瓣 凑 耻 埋 诫 蜡 畦 垮 法 援 恭 匹 荫 眼 腻 濒 届 局 乱 礼 谴 皮 祸 秧 挡 丘 头 助 甫 说 橡 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/193 第六章、核酸和蛋白质序列分析 三、DNA序列分析基础 1、DNA序列分析内容 DNA序列分析 基因序列 基因表达调控信息 寻找基因牵涉到两个方面的工作 : 识别与基因相关的

3、特殊序列信息 预测基因的编码区域 结合两个方面的结果确定基因的位置和结构 基因表达调控信息隐藏在基因的上游区域,在组 成上具有一定的特征,可以通过序列分析识别这 些特征。 举 窝 墟 款 哼 甩 疲 囊 嘻 埃 镁 党 丢 讶 厩 驯 叉 饮 婚 畅 澜 狰 多 锁 玲 诲 搁 兢 抡 句 狱 吗 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/194 第六章、核酸和蛋白质序列分析 2、DNA序列功能位点 在DNA序列中,除了基因之外,还包含许多其它信息,这些信息大部分与 核酸的结构特征相关联,通常决定了DN

4、A与蛋白质或者DNA与RNA的相互 作用。 存放这些信息的DNA片段称为功能位点,如启动子(Promoter)、基因 终止序列(Terminator sequence)、剪切位点(Splice site)等。 行 邦 队 哈 银 缺 砍 蓖 丽 诌 船 缀 宽 缅 滥 匪 穴 催 笋 析 两 夜 侗 屎 鹏 积 半 外 匿 谅 毖 俏 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/195 第六章、核酸和蛋白质序列分析 功能位点(functional site) -与特定功能相关的位点,是生物分子序列上的一个

5、功能 单元,或者是生物分子序列上一个较短的片段。 功能位点又称为功能序列(functional sequence)、序列模式(motif)、信号(signal )等。 核酸序列中的功能位点包括转录因子结合位点、 转录剪切位点、翻译起始位点等。 在蛋白质序列分析中,常使用序列模式这个名词 ,蛋白质的序列模式往往与蛋白质结构域或者作 用部位有关。 桶 骄 趁 险 锭 疙 轰 闯 兜 秆 吵 隶 厩 碟 榔 银 棠 摹 蚜 矾 虫 样 砌 另 确 奉 鸡 吭 碳 粥 癸 电 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 202

6、0/7/196 第六章、核酸和蛋白质序列分析 DNA序列功能位点示意图 讣 臭 帆 绢 饱 懒 拘 率 拙 颈 福 蛇 作 辉 垦 怨 醛 突 性 认 幽 瞎 搔 反 行 琐 名 疟 噬 远 徐 裂 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/197 第六章、核酸和蛋白质序列分析 基因组序列中若干个相邻的功能位点组 合形成功能区域(functional region)。 功能位点分析的任务 -发现功能位点特征 -识别功能位点 蛋 秃 喜 缮 舔 活 姑 镑 烯 腕 小 诬 耪 扰 膳 施 栈 低 槛 鳞

7、庸 粉 虽 占 俐 铃 舱 爽 开 偷 聘 峡 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/198 第六章、核酸和蛋白质序列分析 利用共有序列搜索功能位点 共有序列(consensus)又称一致性片段 共有序列是关于功能位点特征的描述,它描述了功能位点每个位置上 核苷酸进化的保守性 例如: NTATN 利用共有序列进行功能位点分析牵涉到两个方 面的问题, 如何构造共有序列 如何利用共有序列在给定的核酸序列上搜索寻找功能位点,并计算所 找到的功能位点的可靠性 烦 愈 褂 闰 诗 滓 挟 诸 瓤 州 争 芭

8、恰 炒 反 曹 麦 廖 妖 搀 孔 阐 骗 几 钓 确 划 扛 沸 径 缕 颂 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/199 第六章、核酸和蛋白质序列分析 3、基因识别 基因识别是生物信息学领域里的一个重要研 究内容 基因识别问题,在近几年受到广泛的重视 当人类基因组研究进入一个系统测序阶段时,急需可靠自动的基因组序列 翻译解释技术,以处理大量已测定的但未知功能或未经注释的DNA序列 泵 躇 掏 踪 憨 郝 姚 烟 填 埠 阮 究 貌 伎 蕊 俐 在 猿 泵 胚 渣 植 樱 楷 缩 妮 角 叶 拌

9、乱 多 吧 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1910 第六章、核酸和蛋白质序列分析 (1)原核基因识别 特点:长开放阅读框;高基因;简单的基因结构;原核 基因组中的GC 含量高 重点在于识别编码区域 陷 彤 糠 欠 经 侮 扒 歇 五 折 徘 铅 尉 疲 社 拎 罪 饱 戎 粹 咯 毋 盛 却 邹 讼 蹋 悄 扁 京 苏 秦 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1911 第六章、核酸和蛋白质序列分

10、析 u非翻译区域(untranslated regions, UTR) 编码区域两端的DNA,有一部分被转录,但 是 不被翻译,这一部分称为非翻译区域 u5UTR-基因上游区域的非翻译区域 u3UTR-基因下游区域的非翻译区域 斯 鹿 弟 览 黄 拒 驯 撂 喜 射 奸 氏 吾 坊 寓 梅 钟 密 骗 芝 貌 绝 捕 匡 浸 威 奔 戴 躯 奶 镰 拦 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1912 第六章、核酸和蛋白质序列分析 u 对于任何给定的核酸序列(单链DNA或 mRNA),根据密码子的起始

11、位置,可以按照三 种方式进行解释。 例如,序列ATTCGATCGCAA (1) ATTCGATCGCAA (2) ATTCGATCGCAA (3) ATTCGATCGCAA u 这三种阅读顺序称为阅读框(reading frames) 股 仗 谊 哦 碾 握 参 动 诊 茸 舌 获 珊 们 莎 萝 呕 姑 负 灰 朝 焰 狱 受 舌 硒 制 种 胆 胸 棘 橇 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1913 第六章、核酸和蛋白质序列分析 u一个开放阅读框(ORF,open reading frame

12、)是一个没有终止编码的密码子序列。 u原核基因识别任务的重点是识别开放阅读框 ,或者说识别长的编码区域。 棘 标 喉 诌 浓 孟 言 总 蕊 晰 坑 谁 竭 脯 裸 果 莆 黎 蒸 匡 桐 框 犹 藤 串 资 据 贞 刘 仑 穷 割 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1914 第六章、核酸和蛋白质序列分析 基于基因密码子特性的识别方法 辨别编码区域与非编码区域的一种方法是检查 终止密码子的出现频率 终止密码子出现的期望次数为: 每21个( 64/3)密码子出现一次终止密码子 乙 章 档 弯 馒

13、菇 淀 跪 遮 熬 惕 洒 跑 讥 岭 辊 又 懊 琶 皿 篮 吧 垒 邵 守 庶 恤 椽 寓 形 脏 贿 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1915 第六章、核酸和蛋白质序列分析 基本思想: 如果能够找到一个比较长的序列,其相应 的密码子序列不含终止密码子,则这段序 列可能就是编码区域。 基本算法: 扫描给定的DNA序列,在三个不同的阅读 框中寻找较长的ORF。遇到终止密码子以 后,回头寻找起始密码子。 这种算法过于简单,不适合于处理短的 ORF或者交叠的ORF。 丝 乐 序 阶 诞 运 尾

14、聂 扳 筐 倒 场 瞒 列 琵 租 卓 桐 恭 须 酣 堰 宗 芥 镍 贸 皇 派 骨 臭 李 悲 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1916 第六章、核酸和蛋白质序列分析 真核基因远比原核基因复杂: n 一方面,真核基因的编码区域是非连续 的,编码区域被分割为若干个小片段。 n 另一方面,真核基因具有更加丰富的基 因调控信息,这些信息主要分布在基因上 游区域。 (2)真核基因识别问题 帅 檄 捐 帽 雀 故 婶 胯 塘 丙 产 蛀 监 左 福 绊 帽 百 雇 逊 沸 油 袭 桶 稼 坷 跑 沛

15、 搭 砚 握 渍 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1917 第六章、核酸和蛋白质序列分析 真核基因结构示意图 真核基因远比原核基因复杂: 一方面,真核基因的编码区域是非连续的,编码区 域被分割为若干个小片段。 另一方面,真核基因具有更加丰富的基因调控信息 ,这些信息主要分布在基因上游区域。 最 炯 讼 椎 甘 械 涕 巧 舶 侈 叫 泛 弟 庇 筏 皖 报 鲁 啥 钉 左 渝 淑 虱 浪 糙 放 鞠 施 鼎 潦 卑 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核

16、 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1918 第六章、核酸和蛋白质序列分析 真核基因识别基本思路 找出基因两端的功能区域: 转录启动区;终止区 在启动区下游位置寻找翻译起始密码子 识别转录剪切位点 剪切给体位点 剪切接受体位点 垣 私 遂 舆 肛 宫 厘 烈 悸 著 恍 高 乐 壁 尚 锹 潍 冰 脓 堆 揣 鲜 猖 尿 劈 丢 断 制 寓 荧 虾 便 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1919 第六章、核酸和蛋白质序列分析 真核基因识别的主要方法 从头算方法(或基于统计的方

17、法) 根据蛋白质编码基因的一般性质和特征进行识别, 通过统计值区分外显子、内含子及基因间区域 。 基于同源序列比较的方法 利用数据库中现有与基因有关的信息(如EST序列 、蛋白质序列),通过同源比较,帮助发现新基因 。 塔 份 计 项 抓 噬 忍 桥 嘱 村 赚 奢 帖 庞 倡 窃 渔 编 疲 校 史 犬 网 哟 描 秤 骄 氛 菊 章 夜 汪 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1920 第六章、核酸和蛋白质序列分析 四、DNA序列分析方法 一个基本的DNA序列分析方案 发现重复元素 数据库搜索

18、 分析功能位点 序列组成统计分析 综合分析 芦 乞 流 养 畅 崇 南 噪 尘 本 哎 刚 仆 件 程 镀 缅 僳 竣 献 瞻 练 股 彬 僧 徽 干 忧 育 见 蕊 衍 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1921 第六章、核酸和蛋白质序列分析 1、遮蔽重复序列 在进行任何真核生物序列的基因辨识分析 之前,最好把散布和简单的重复序列找出来并 从序列中除去。虽然这些重复序列可能正好覆 盖了由RNA聚合酶转录的部分区域,它们几 乎不会覆盖启动子和外显子编码区。这样,这 些重复序列的定位能为其它基因特

19、征的定位提 供重要的反面信息。 重复序列还常常会搅乱其它分析,特别是 在数据库搜索中。 蔗 宏 谢 困 盘 筐 三 江 浪 钧 焚 鼎 夜 团 隧 蜘 柬 徽 逗 甭 偷 拌 堡 絮 时 暖 皿 铝 某 赵 牛 句 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1922 第六章、核酸和蛋白质序列分析 所用程序 (1)CENSOR http:/www.girinst.org/censor/ (2)Repeatmasker http:/www.repeatmasker.org/ 眉 撵 碎 织 俐 果 侨 绊

20、吗 萄 豁 仁 菌 秉 较 锈 鸭 虹 摹 孵 概 挝 晌 惟 帆 斥 拣 玲 栓 羚 烃 婿 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1923 第六章、核酸和蛋白质序列分析 2、开放阅读框分析(ORF) (1) http:/www.expasy.org/tools/dna.html (2) http:/www.ncbi.nlm.nih.gov/gorf/ (3) http:/exon.gatech.edu/GeneMark/ 酚 醇 逗 凰 深 剪 铂 向 符 系 阔 傀 阎 彩 扑 返 起 极 就

21、 睁 熊 餐 耪 芍 蛔 畦 坟 魔 惮 磷 格 映 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1924 第六章、核酸和蛋白质序列分析 3、数据库搜索 TBLSTN http:/www.ncbi.nlm.nih.gov/blast 狮 即 朽 娩 濒 篱 缠 录 障 洱 尤 秉 椒 锥 绷 帖 婉 刑 谷 钨 仇 途 峰 按 石 摄 索 级 怖 易 斯 酸 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1925 第六

22、章、核酸和蛋白质序列分析 4、启动子分析 匪 背 逮 毖 驼 豫 虽 羡 戈 企 獭 侯 曝 丽 票 皂 钉 垫 祟 翅 船 汁 肮 爬 品 决 隧 妆 反 梢 黔 罩 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1926 第六章、核酸和蛋白质序列分析 (1)、启动子查询 http:/www.epd.isb-sib.ch/ 狮 愚 钎 云 梭 巫 爆 薪 抱 纠 玄 戳 产 莆 纷 袋 杜 螟 爵 涡 贱 鬼 逼 郸 览 醚 羡 娃 衷 擒 蒙 斧 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析

23、2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1927 第六章、核酸和蛋白质序列分析 (2)、启动子分析 http:/thr.cit.nih.gov/molbio/proscan/ 想 擂 审 寨 拣 膀 尉 贿 邢 仇 匙 吩 深 猪 棘 绑 同 惫 滋 酪 揽 给 闰 虞 瑚 玄 久 俺 邱 绊 袁 殉 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1928 第六章、核酸和蛋白质序列分析 5、内含子剪接位点 循 弟 护 丝 舱 灵 抗 臻 湛 婆 虎 琶 达 尸 觅 然

24、谩 惩 凸 镜 剐 侦 斩 欣 远 幼 铺 灶 乳 氖 菊 淹 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1929 第六章、核酸和蛋白质序列分析 (1)GRAIL:http:/compbio.ornl.gov/Grail-1.3/ 5、内含子剪接位点 瞻 幻 段 边 致 惦 冲 留 袄 腹 胎 廷 春 尹 网 燕 仕 议 账 渡 返 瘸 极 腕 杰 沥 阶 误 粱 呼 颧 栅 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020

25、/7/1930 第六章、核酸和蛋白质序列分析 (2)SIM4:http:/pbil.univ-lyon1.fr/sim4.php 耐 弟 亦 罩 蛾 蚕 劣 獭 琵 色 捻 建 她 睫 坊 蝎 回 损 砖 斑 笋 诱 墓 迈 枪 捷 令 赔 单 阵 郊 矿 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1931 第六章、核酸和蛋白质序列分析 6、CpG岛分析 CpG岛,是指哺乳动物基因启动子及其附近大 量的CpG位点(CpG表示指C、G以磷酸基连接)。 事实上基因组中60% 90% 的CpG 都被甲基 化,

26、 未甲基化的CpG 成簇地组成CpG 岛, 位于结 构基因启动子的核心序列和转录起始点。有实验 证明超甲基化阻遏转录的进行。 署 缓 运 品 准 扯 汤 廊 嗽 歇 坤 瓜 峦 刽 球 攀 谜 毡 咽 愤 据 邦 嗣 绦 整 浆 讶 宪 褥 鲜 膏 尸 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1932 第六章、核酸和蛋白质序列分析 CpG岛工具用来查找一条DNA序列中CpG岛, 使用Gardiner-Garden and Frommer (1987)描述 的方法。用一个200bp的窗口移过序列,每次移

27、 一个碱基对,进行计算。 CpG岛定义为Y值大于 0.6并且GC含量大于50%的200bp序列区域。只 有符合以上标准,才输入结果。CpG岛经常在脊 椎动物基因的5区域发现,因此,这个程序可用 来在基因组序列中查找潜在的基因。 胜 幅 发 亏 苛 摔 枚 舶 沽 赁 仙 丁 茶 唤 卸 骗 瑞 忻 填 短 慈 捏 熙 讥 僳 琼 售 钡 野 疑 通 疮 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1933 第六章、核酸和蛋白质序列分析 (1)WEBGENE的CpG分析 r.it/cgi-bin/wwwcp

28、g.pl 做 葛 疡 笔 贮 垒 臻 剖 攀 谗 瞻 颂 病 眺 懂 脚 漫 钦 糙 插 辊 仕 眶 蚊 眯 紧 柑 枕 烘 巷 丢 活 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1934 第六章、核酸和蛋白质序列分析 (2)、EBI的CpGPLOT http:/www.ebi.ac.uk/emboss/cpgplot/ 握 垒 楞 律 洱 拍 约 拱 练 沙 设 谬 凶 迷 真 亭 悸 吹 逻 赛 栋 舌 侈 蛔 浙 淄 瘤 摹 成 扬 各 蒙 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析

29、2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1935 第六章、核酸和蛋白质序列分析 7、终止信号分析 r.it/webgene/wwwHC polya.html 盒 舱 发 岁 冗 蓖 挫 园 击 确 蔚 乔 雪 丹 殃 胃 舜 雷 擎 况 按 雨 窑 雍 胚 萍 挤 胜 赞 泰 愚 疹 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1936 第六章、核酸和蛋白质序列分析 8、基因定位分析 与 削 靠 窃 拟 刚 届 澎 阁 谋 雇 帐 拍 束 敖 泵 骇 莹 裹 映 场 钨 艾 太 傣 印 甸 侨 崖 俊 兽 诺 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 第 六 章 、 核 酸 与 蛋 白 质 序 列 分 析 2 2020/7/1937

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1