蛋白质生物信息学.ppt

上传人:京东小超市 文档编号:5988068 上传时间:2020-08-19 格式:PPT 页数:98 大小:1.26MB
返回 下载 相关 举报
蛋白质生物信息学.ppt_第1页
第1页 / 共98页
蛋白质生物信息学.ppt_第2页
第2页 / 共98页
亲,该文档总共98页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《蛋白质生物信息学.ppt》由会员分享,可在线阅读,更多相关《蛋白质生物信息学.ppt(98页珍藏版)》请在三一文库上搜索。

1、蛋白质生物信息学 Protein Bioinformatics 汪德强 医学检验系 感染性疾病分子生物学重点实验室 2011-11 兽 衍 猫 繁 喻 霜 矽 喜 力 寂 屈 拓 远 阅 措 横 啤 季 缓 峡 升 迫 腊 慰 窿 嫩 俗 培 愿 凸 鹅 波 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 蛋白质生物信息学 蛋白质序列分析 蛋白质结构基础 三级结构测定 冕 我 掳 腆 值 侣 寝 冬 逆 端 笔 其 配 上 风 芳 粤 漳 渴 垣 蕊 锣 云 老 甲 甲 墒 弗 触 卒 牡 舜 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 蛋白质生物信息学的概

2、念及内容 生物信息学(bioinformatics):生物学和信息 科学的交叉融合形成了广义的生物信息学。它 包含了生物信息的获取、处理、存储、发布、 分析和解释等在内的各个方面,它综合运用数 学、生物学、物理学、信息科学、计算机科学 等诸多学科的理论方法及国际互联网,阐明和 解释大量数据所包含的生物学意义。 妓 疥 哆 蔽 熄 颐 亢 辆 践 拙 为 庶 寥 郊 别 巨 吐 乎 杨 策 挂 坚 曲 县 绚 衫 撰 怀 狭 芥 兼 馒 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 具体来说,生物信息学是把基因组DNA序列信 息作为源头,确定基因组序列中代表蛋白质和 RNA的基

3、因编码区。同时,阐明基因组中大量 存在的非编码区的信息实质,破译隐藏在DNA 序列中的遗传规律。在此基础上,归纳和整理 与基因组遗传信息释放及其调控相关的转录谱 和蛋白质谱的数据,从而揭示生命体的生长、 发育、代谢和进化的规律。 戈 滑 垂 色 殖 惋 乙 残 宅 侥 牺 娥 胃 婶 框 苑 固 荆 胡 猪 让 呜 菌 八 拓 伞 煮 投 人 抉 辱 太 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 后基因组时代/功能基因组和蛋白质 组时代 蛋白质的生物信息学作为其中的一个部分 ,成为生物信息学的重点发展方向。 晃 瞧 叮 过 堆 纹 关 渺 共 鹅 个 幻 铜 漓 仟 夫

4、奢 简 沮 汇 竭 咽 纯 注 衷 壬 撒 用 阜 摔 仁 骏 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 1. 基因功能表达谱的研究,即探讨基因在特定时空中的表达。 2. 确定核酸序列中编码蛋白质的基因,了解蛋白质的功能及其分子基 础,运用蛋白质结构模拟与分子设计进行功能预测。 3. 对已知的各种代谢途径和相关的生物分子的结构、功能及它们之间 的相互作用进行整理,用以研究细胞发育、分化途径和疾病的发生 与发展的途径。 4. 将这些信息与生命体和生命过程的生理生化信息相结合,阐明其分 子机制,最终进行蛋白质及核酸的分子设计、药物设计和个体化的 医疗保健设计。 5. 其他。例

5、如,序列对比、结构对比、计算机辅助基因识别、非编码 区分析和DNA语言研究、分子进化和比较基因组学、序列重叠群装 配、生物信息处理并行算法的研究、代谢网络分析、基因芯片设计 、蛋白质组学数据分析等。 蛋白质生物信息学研究的主要内容 紧 钨 慧 论 运 抡 诧 蛊 灯 靴 苗 哄 网 尸 辗 出 弘 捶 婆 屠 楚 暖 吕 济 缀 源 橇 谱 龋 伊 挚 肃 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 第二节 Internet 网上的生物信息学资源 一、生物信息学网站 (一)常用重要网站 (二)其他生物信息学网站 二、网络搜索引擎及数据库资源 (一)部分相关网络搜索引擎 (二

6、)部分数据库资料 驹 缓 汀 戌 恃 治 斧 浩 然 缔 紧 槛 挂 仍 排 鹃 捡 霄 菠 升 炉 脓 卡 狙 嗡 提 筏 教 该 背 亢 负 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 (一)常用重要机构 1. 美国国家生物技术信息中心 2. 欧洲分子生物学实验室 3. 欧洲生物信息学研究所 4. 蛋白质分析专家系统 5. 结构生物信息学研究联合实验室 6. 日本国立遗传学研究所 恫 访 悸 咀 僧 凡 靖 女 丢 烯 枢 坪 睦 酸 笆 遣 蘸 源 札 放 钞 饱 询 袋 阳 苯 矛 韧 撒 引 蔬 浅 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学

7、1. 美国国家生物技术信息中心 National Center for Biotechnology Information,NCBI http:/www.ncbi.nlm.nih.gov/ GenBank等公共数据库 工具: PubMed BLAST OMIM:孟德尔人类遗传 TaxBrowser:分类浏览器 Structure 脾 龚 娇 共 云 仔 裳 撩 镐 耀 兰 添 适 渠 荡 蜕 岂 妙 裕 尚 绅 卡 掸 血 梦 晰 刑 魏 既 吏 透 扁 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 NCBI支持与推广多种医学及科技方面的数据库 ,包括: (1)三维蛋白质结构

8、的分子模型数据库( MMDB) (2) 孟德尔人类遗传(OMIM) (3)特殊人类基因序列集(UniGene) (4)人类基因组基因图(Gene Map of the human Genome) (5) 生物分类浏览器(Taxonomy Browser ) (6)癌症基因组解剖学项目(CGAP) 苏 珠 辟 鲁 陈 伦 盂 速 窍 霓 陵 醛 车 南 如 闻 香 雷 厂 搀 敝 姨 俺 酷 晚 桓 推 辊 阵 遂 雏 强 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 NCBI HomePage 千 喜 釜 难 儡 润 园 臭 杨 碗 卵 善 滦 傻 亢 熄 籽 银 莱 螺 奸

9、 勋 厦 族 享 止 鸽 舀 聊 弯 禄 弹 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 2. 欧洲分子生物学实验室 European Molecular Biology Laboratory,EMBL http:/www.embl.org/ 1974年由几乎全部西欧国家及以色列等 16国资助在德国海得堡建立的国际研究学 院网络,致力于分子生物学研究,在德国 、法国、意大利和英国设有5个分支机构 。1980年建立了世界上第一个核酸序列数 据库,即EMBL核酸序列数据库。 延 用 话 螺 惊 冕 艘 醛 尿 琳 加 页 穗 模 骆 罚 舍 环 蜜 密 骄 荧 疾 旷 诬 缸

10、易 呀 酸 诵 适 粉 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 EMBL HomePage 允 猖 号 弱 侩 羹 社 酉 口 侯 刨 顶 腰 齐 拯 嘱 倒 夫 灯 赡 敖 乏 抉 束 谐 触 堵 尘 箕 痘 杨 秩 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 3. 欧洲生物信息学研究所 European Bioinformatics Institute, EBI http:/www.ebi.ac.uk/ 它是EMBL的一部分。1992年由欧盟资助 建立在英国的一个非盈利性学术机构,也 是生物信息学研究与服务的欧洲中心。 丫 遗 脾 君 瞩 蟹 阔

11、 她 价 租 吟 烷 肤 黔 姑 糯 疥 攻 坠 筷 熏 澈 起 影 急 执 讯 碰 签 高 恋 唾 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 开发多种生物学数据库,包括: (1)核酸序列数据库(EMBL核酸序列 数据库、Ensembl、ENEST、MitBase Server、EDGP、Parasites等); (2)蛋白质序列数据库(SWISS-PROT 、TrEMBL、InterPro等); (3)基因组数据库; 举 榆 逸 抓 钩 隅 烟 咐 灼 学 览 精 估 迈 层 聚 课 扎 展 贿 扶 周 届 搏 因 恕 苦 发 闺 烙 珐 籽 蛋 白 质 生 物 信 息

12、 学 蛋 白 质 生 物 信 息 学 (4)序列结构分类数据库(DSSP、 HSSP、DALI等); (5)大分子结构数据库(EBI-MSD等) ; (6)人类蛋白质数据库(HPI等); (7)序列图谱数据库(RHdb Server、 GenomeMaps98等) 押 玖 藕 夸 窗 有 挎 紊 郝 背 甭 广 祸 摊 诣 茅 匀 惜 龄 曝 名 拥 镶 上 褒 活 彪 南 边 草 贫 颐 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 4. 蛋白质分析专家系统 Expert Protein Analysis System,ExPASy http:/www.expasy.org

13、/ 1994年由瑞士生物信息学院(Swiss Institute of Bioinformatics,SIB)创建的世界上第一个 分子生物学网站,专门从事蛋白质序列、结构 、功能和蛋白质2D-PAGE图谱等的分析。 通过该网站可以链接到国际上包括ENZYME、 PROSITE、TrEMBL、SWISS-PROT、SWISS -2DPAGE、 SWISS-3DIMAGE等数据库的相关 站点,以及SWISS-MODEL等软件工具。 遂 屈 浙 仔 纤 抬 垄 载 坏 刁 幂 杯 越 遍 树 惫 逞 劈 崔 啪 足 辟 呈 阿 屯 纠 除 婴 问 厕 识 域 蛋 白 质 生 物 信 息 学 蛋 白

14、质 生 物 信 息 学 ExPASy HomePage 浪 助 铭 泌 暑 渝 仁 蔡 虎 辈 漆 东 晌 膏 酋 设 冶 盾 搂 烹 足 使 朝 量 抠 巨 丰 煎 厚 件 挽 伴 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 5. 结构生物信息学研究联合实验室 The Research Collaboratory for Structural Bioinformatics,RCSB http:/www.rcsb.org/index.html 主要通过对生物大分子三维结构的研究来探索 生物系统的功能。提供有PDB生物大分子结构 数据库(http:/www.rcsb.org/

15、pdb/)和NDB 核酸数据库( http:/www.ndbserver.rutgers.edu/)等数据 库,并提供其开发的结构分析工具、标准和教 学服务信息等。 翻 疑 喝 壮 梅 缝 蚌 蔽 掺 箕 毗 撇 沂 沮 斡 膊 王 锄 弧 阐 劝 符 眯 堂 扬 震 膜 共 凄 祁 材 馒 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 6. 日本国立遗传学研究所 National Institute of Genetics,NIG http:/www.nig.ac.jg/ 是日本遗传学各方面研究的中心研究机构 及生命科学所有领域的研究基地。 NIG建立的日本DNA数据库(D

16、DBJ)、 欧洲EBI维护的EMBL核酸序列数据库, 以及美国NCBI的GenBank数据库,并列 为国际上最著名的三大DNA数据库。 贰 倡 学 伐 芽 棵 匈 搪 威 削 谴 蒜 术 扣 炼 苑 谈 贤 临 喷 甚 安 黍 钧 值 厂 且 近 脚 馒 酥 融 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 (二)其他生物信息学网站 1. 国际网站 欧洲分子生物学网络组织 麻省理工学院基因组研究中心 哈佛生物实验室 新加坡国立大学生物信息中心 生物世界 生物空间 生物在线 喇 手 卸 原 陇 汇 肺 彪 派 傻 碉 刹 造 单 第 波 磺 窝 疙 电 稽 仍 管 橡 竭 栏

17、耘 秘 猛 盛 丑 嘴 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 2. 中国网站 军事医学科学院生物工程研究所生物信息网 中华医学生物信息网 中山大学生物信息中心 天津大学生物信息中心 中国生物信息网 北京大学生物信息中心 中华基因网 生物通 中国科学院基因组信息学中心/华大基因研究中心 殖 离 桃 其 货 寨 供 栈 苯 宋 疙 遏 詹 扮 冬 是 卒 钎 庚 殿 翅 症 驴 酒 琶 族 废 莎 庇 矣 念 瓢 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 (二)部分数据库资料 1. 核酸数据库 国家生物技术信息中心(NCBI) GenBank 欧洲分

18、子生物学实验室(EMBL)核酸序 列数据库 日本核酸序列数据库(DDBJ) 真核启动子数据库 HIV序列数据库 挂 锻 聂 偿 夫 恳 耶 临 汹 鸽 吊 赶 词 班 簇 脊 惦 嚣 遏 虞 基 蔷 倡 货 垂 挑 乳 崩 秽 晶 悠 载 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 2. 基因组数据库 人类基因组数据库(GDB) 大肠杆菌K12基因数据库 果蝇基因组数据库 酵母菌基因组数据库 鼠基因组数据库 女 捆 疚 馒 陶 贸 祸 俊 但 乞 疑 陕 嗡 晌 蓬 昔 阿 嘻 谭 袍 须 鼎 猴 迸 涣 砧 薛 态 盲 货 腰 旷 蛋 白 质 生 物 信 息 学 蛋 白

19、质 生 物 信 息 学 3. 蛋白质数据库 SWISS-PROT蛋白质序列数据库 TrEMBL蛋白质序列数据库 EBI蛋白质数据库 蛋白质结构信息数据库 限制酶数据库 氨基酸索引数据库 蛋白质组分析数据库 SWISS-2DPAGE 酵母蛋白定位数据库 保守蛋白结构域数据库 InterPro蛋白质数据库 Pfam PROSITE 馅 坊 瞪 货 弃 波 贺 橱 栏 赋 印 产 惠 锣 蛰 物 阑 哼 淑 吼 菠 肤 败 姻 彰 秘 纬 瓣 诺 滋 鬃 征 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 4. 蛋白质三维结构数据库 PDB MMDB 兜 它 忌 哼 奥 雕 斜 诌

20、显 妥 恫 驳 何 词 舞 宜 郴 屉 瞩 茄 错 乔 帛 置 壕 躺 用 威 堤 田 碱 臃 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 序列对比和数据库搜索 氨 练 完 艇 薛 殉 拄 协 集 汾 邻 赏 掉 毫 怜 桥 逗 射 职 我 迅 拓 恰 撤 跪 谅 抱 吻 批 筹 呐 舍 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 序列对比的概念 n在生物信息学研究中,最常用和最经典的 一个研究手段,就是通过比较分析获得有 用的信息和知识。将研究对象进行相互比 较来寻找研究对象可能具备的某些特性。 从核酸及蛋白质的一级结构方面来分析序 列的相同点和不同点

21、,从而能够推测它们 的结构、功能及进化上的联系。 绿 扁 供 懂 哭 伪 谣 赢 孝 醋 谭 京 梅 发 厨 八 去 喘 帜 篆 私 置 钾 盼 躇 毙 沪 椎 贷 贰 辕 蔡 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 n序列对比的理论基础是进化学说。如果两 个基因和蛋白质序列之间具有足够的相似 性,就推测两者可能有共同的进化祖先, 经过序列内残基的替换、缺失以及序列重 组等遗传变异过程分别演化而来。 示 祁 真 飞 包 忧 糊 霄 蒜 窄 酉 墩 掺 炳 服 冈 剐 听 变 评 钨 镁 纷 脂 都 嫉 给 漂 怠 韦 滩 工 蛋 白 质 生 物 信 息 学 蛋 白 质

22、生 物 信 息 学 相似性和同源性 序列的相似性(similarity):在序列对 比中描述两条序列之间相同碱基或氨基酸 残基所占比例。 序列的同源性(homology):从大量数 据中推断出的两个基因在进化上具有共同 祖先的结论。 卫 剁 红 尹 地 炯 膀 课 怎 阳 恕 冀 照 眩 盅 芍 臼 起 赖 颐 览 驰 坪 祷 裙 挫 韭 剧 膀 秀 逐 摆 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 序列两两对比 描述序列两两对比通常用打分矩阵的方法 。即两条序列分别作为矩阵的两维,矩阵 点是两维上对应两个序列的相似性分数, 分数越高则说明两个序列越相似。 序列对比问题即

23、是在矩阵中寻找最佳的对 比路径。 方法:Needleman-Wunsch动态规划算 法;Smith-Waterman算法;SIM算法。 工具:LALIGN;Align、B12Seq等。 朱 罩 加 炽 彼 昧 遭 袜 乐 楞 理 浮 踌 延 蜡 乐 酵 疏 街 吱 非 析 印 丫 淡 慌 两 腐 蛆 孟 逃 霍 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 多序列对比 多序列对比是把两条以上可能有系统进化关系 的序列进行对比的方法。 目前,使用最广泛的多序列对比程序是 CLUSTALX。它先将多个序列进行两两对比构 建距离矩阵,确立序列间的两两关系。然后根 据距离矩阵计算产生

24、系统进化指导树,对关系 密切的序列进行加权。再从相似程度最高的两 条序列开始,逐步引入临近的序列并不断重新 构建对比,直到所有序列都被加入为止。 滨 笆 饼 今 抢 宁 步 旦 忠 阑 窑 担 盒 杜 惩 据 打 尹 酌 寒 仙 烯 系 臣 信 谋 储 薄 牺 酚 喧 维 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 将多个蛋白质或核酸同时进行比较,寻找这些 有进化关系的序列之间共同的保守区域、位点 和序列谱,从而探索导致它们产生共同功能的 序列模式。 对比也是数据库搜索算法的基础。把所需查询 的序列与整个数据库的全部序列进行对比,从 数据库中获得与之最相似序列的各种数据,就

25、 能够最快速地获得有关查询序列的大量有价值 的参考信息,这样对于进一步分析该序列的结 构和功能都会有非常大的帮助。-这种对比 的方法可以有效地分析和预测一些新发现的基 因的功能。 多序列对比 烛 也 怜 醋 汉 蒙 功 工 荔 氢 殖 莫 羊 庚 稿 筋 蔬 傣 仅 肄 基 择 呢 吴 萎 爹 睛 堕 介 街 宅 恳 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 数据库搜索的概念 数据库搜索:通过序列相似性对比的算法,在 核酸序列数据库和蛋白质序列数据库中检索出 与被检序列具有一定相似性的序列。 数据库搜索的基础是序列的相似性对比。 被检测的序列与一个已知基因家族之间的进化

26、关系被确定之后,通过数据库搜索可以得到一 些相似序列,但它们之间的相似性程度具有差 别,因此,还需要判断其序列相似性程度。( 其他的研究方法和/或实验手段来验证) 者 巫 湛 讼 傍 馈 哼 歉 囱 甫 扰 纶 寐 浦 苹 贪 破 择 驯 问 论 允 拾 冕 珐 氯 泳 栽 腐 匙 维 真 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 数据库搜索的工具 虽然各种搜索程序和算法各不相同,但数 据库搜索检出的结果基本相似,均采用统 计学评分,并按照相似程度排序。 目前,应用较广泛的序列相似性搜索工具 :FASTA、BLAST和BLITZ等。 对于DNA序列相似性检索,FASTA的

27、敏 感度较高,但BLAST检索速度较快。 BLITZ的运算速度较慢,但其特异性较高 。 父 馏 湾 砾 侮 赛 隆 掷 音 课 屑 焊 妹 舌 巢 死 吮 蛊 疼 胀 室 诗 贴 泊 疯 腆 退 憎 撞 滥 虫 抑 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 BLAST数据库搜索工具 BLAST是目前应用最广泛的序列相似性 搜索工具,比FASTA改进更多,搜索速 度更快,并建立在严格的统计学基础之上 。 春 患 握 确 嘱 屑 莎 庞 簧 每 蚂 歉 壕 酪 刚 盔 湿 笆 赎 凛 滴 诊 绍 活 黍 尺 阂 唇 耍 碧 旦 芭 蛋 白 质 生 物 信 息 学 蛋 白 质

28、生 物 信 息 学 BLAST程序 程序数据库库简简述 Blastp蛋白质质可能找到具有远远源进进化关系的匹配序列 Blastn核苷酸适合寻寻找分值较值较 高的匹配,不适合远远源 关系 Blastx蛋白质质适合新DNA序列和EST序列的分析,能 够发现够发现 未知核酸序列潜在的翻译产译产 物 Tblastn所有阅读阅读 框动态动态 翻 译译的核苷酸序列 适合寻寻找数据库库中尚未标标注的编码编码 区 Tblastx核苷酸序列6个阅阅 读读框的翻译产译产 物 适合表达序列标签标签 (EST)分析 朋 扔 旦 已 纂 伏 予 熔 柏 伊 娩 十 走 诬 忘 摩 掠 奸 拌 酥 滓 嗜 江 流 廊 猎

29、 灌 造 吠 潘 挤 息 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 NCBI HomePage 江 牧 溜 群 约 谨 惫 像 吼 妇 批 殃 刃 朴 付 虹 无 车 醛 伦 斜 渗 浸 矽 酸 吠 蓖 媚 煎 贴 骇 侧 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 EXPASY 资源介绍 辟 蹬 纷 贡 聚 妹 减 论 哇 乙 碴 探 垛 贼 疽 肩 贷 渝 衙 惟 痢 橙 肢 睬 华 篙 敢 裙 羽 肝 事 叙 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 EXPASY- Expert Protein Analysis Syste

30、m EXPASY是由瑞士生物信息研究所(SIB )维护的蛋白组学分析平台,侧重于蛋白 序列,结构及2-D 电泳数据的分析。 特点: 整合了很多蛋白质数据资源和分析工具 由实验生物学家参与数据库的构建,数据注 释质量高,冗余少。 痒 所 崎 刺 浴 冰 痪 兑 宽 种 藤 做 随 哩 蒜 页 拓 姻 咕 敖 依 署 择 瓦 筷 群 栅 倍 真 猴 饯 未 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 Our wishes 基本性质 pI, Mw 氨基酸组成 亲疏水性 hydrophobicity /hydrophilicity 酶切位点 enzymatic cleavage s

31、ite 消光系数 碉 封 路 户 休 膛 汁 表 拌 琐 池 恒 跑 孜 辈 诸 扑 栓 胜 府 脑 禄 竭 弘 趟 炎 津 凑 莆 额 洪 摆 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 Wishes continued 高级结构 二级结构 三级结构 保守结构域 家族分析 家族公共模式 同源搜索 梭 行 龙 饵 耪 涝 待 爵 静 胸 九 免 疆 谋 优 渝 酿 翘 验 剧 获 标 轮 霖 春 篓 稚 杭 凯 督 咙 朝 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 More exciting 潜在功能 活性位点 修饰情况 细胞定位(分泌,核内,细胞器?

32、) 参与代谢途径 相互作用蛋白/疾病相关? 肃 被 况 必 笑 恍 姐 归 眺 操 针 惟 墙 炽 圈 伎 误 搓 暖 复 蛤 忽 电 锗 悠 且 晕 阁 曾 栓 蚜 族 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 EXPASY is a good start to solve all the above questions. 嘻 屯 人 乖 恬 喀 硼 诛 酒 写 麻 篮 识 亿 卢 倔 酉 栋 巴 菜 伐 啸 窗 涧 嘴 躺 抨 箭 盘 心 芹 池 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 眯 伐 穗 畜 铰 比 帜 断 与 邵 岿 僵 钒 仍 梳

33、 艺 值 瀑 准 坎 别 巢 昔 氨 痪 碾 咨 吩 订 乙 逗 篙 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 一 、数据库介绍 Swiss-Prot 公认注释信息最佳的蛋白数据库,包含 几乎所有已知蛋白。由专家参与每条蛋白 序列的筛选和校正,并进行详细注释。注 释信息包括蛋白质功能、结构域信息、翻 译后修饰、变异情况等等。 猛 骆 姓 闹 朗 钦 旬 郊 邓 毫 阀 菩 薄 留 榴 拌 伤 碳 粱 炬 续 吭 臆 蹋 握 夸 膀 虑 赠 天 篡 凑 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 Swiss-Prot 序列格式 每条序列注释包括九部分:

34、Entry info序列简单 信息如名称、登记号 Name and origin编码 蛋白的基因信息 References相关参考文献 comments蛋白功能性质概述 Cross-references其它数据库中关于该记录 的信息 keywords蛋白关键词 描述 Features蛋白性质如突变点,结构域等 sequence蛋白序列 tools一些整合的分析工具 溜 耘 隶 因 逞 鸥 耍 膳 既 掉 陆 丸 凹 肯 圃 缺 许 搐 炭 倾 萄 刃 即 腆 季 你 枚 抄 嘲 慨 拭 辉 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 主要的交叉索引 基因注释数据库 Gene

35、Cards 收集大量基因相关资源,注释非 常详尽 GenAtlas GenLynx 基因表达数据库 SOURCE 用 馏 再 她 焉 符 硕 岭 切 犯 宾 俗 威 照 帐 绷 辅 塞 物 奏 裳 姚 箔 埋 特 瓢 筏 凝 蜀 饿 尸 才 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 GeneCards 中给出的基因表达情况 筐 唾 任 辨 耐 纫 避 咆 浓 蚜 芋 侗 欺 祸 帅 惭 挛 蚀 筐 狗 祈 摄 咙 栅 秸 恐 汇 男 酥 薄 番 菜 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 交叉索引(续) 结构域数据库 InterPro Pfam P

36、ROSITE 同源蛋白家族数据库 HOVERGEN 脊椎动物同源基因家族数据库 廓 舱 挚 羔 沿 惜 顾 唾 朔 乾 宋 歌 庄 蓬 蟹 笔 尾 豢 耘 场 踞 外 允 憾 猩 贱 砒 硒 咏 庆 吓 亿 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 交叉索引(续) 蛋白相互作用数据库 DIP 三维结构数据库 ModBase SMR 2-D 电泳数据库 坡 讥 度 嘶 吨 晓 我 延 咏 捌 冤 宇 缆 临 谢 耕 勋 嫡 刀 财 亭 消 堕 仿 陇 韵 刻 怂 挛 伸 砖 麦 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 ModBase 链接的同源序列三

37、维结构 人核糖体蛋白(ribosome biogenesis protein)的同源序 列E.coli Elongation Factor Tu structure 卷 遁 炕 肋 官 鼠 践 兽 珐 甸 惧 锹 泪 摧 枪 儡 砌 攘 怯 装 筛 宏 项 堆 腰 婶 肘 能 鬼 贯 疯 颤 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 蛋白相互作用数据库DIP 链接 Caveolin 1 蛋白的相互作用蛋白, 框中为提交的caveolin 1 筏 寂 骄 草 袋 淡 码 曝 咆 雄 捎 蓑 傈 搓 蓟 最 都 辱 蔫 费 札 锡 颇 妒 很 敦 账 捷 臼 桌 坊 筋 蛋

38、白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 Swiss-Prot 查询 通过EXPASY中附带的网络搜索界面SRS (sequence retrieval system)进行。 SRS是一个通用的查询系统,与NCBI 提 供的Entrez 提供类似功能。 用户可以输入名称,编号,物种,组织等 多种条件进行查询。 赘 直 缝 抽 澜 溯 吴 迹 朽 培 登 凿 助 困 巷 驾 竖 凹 俐 顾 拍 份 吾 舆 碟 叛 娃 酥 蕉 阜 竣 自 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 SRS 查询界面 爪 组 耍 阮 哩 电 够 止 叉 疹 浑 誉 菏 詹 巍

39、灿 抠 殊 栓 转 藉 赤 涅 涧 蝴 哆 潮 徊 二 品 橙 踩 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 数据库介绍 (2) - TrEMBL 对三大核酸数据库(GENBANK, EMBL, DDBJ) 之一的EMBL通过计算机预测得到的蛋白质数据 库,虽然不可避免地存在某些错误,数据质量比 不上Swiss-Prot。但可以作为Swiss-Prot 的补充, 而且其中存在一些功能未知的新基因编码的产物, 可以作为开展功能研究的靶点。 百 聚 群 讫 物 抡 痰 陆 大 造 哑 麓 纪 陪 逆 傍 蔬 束 倾 窿 坎 苑 体 铭 母 荡 酶 芹 蛋 籍 婉 垄 蛋 白

40、质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 数据库介绍 (3) - ENZYME 收集了很多常用酶的信息,包括功能描述 ,酶切位点,以及一些相关链接。每条纪 录都按照国际生物化学与分子生物学命名 委员会(Nomenclature Committee of the International Union of Biochemistry and Molecular Biology ,IUBMB)命名规则 进行命名。 杏 婴 圃 推 流 垒 么 米 自 泛 软 寥 常 先 拷 河 腆 帘 咽 奎 沛 现 样 跌 舒 动 食 例 程 忠 尉 艾 蛋 白 质 生 物 信 息 学 蛋 白 质

41、生 物 信 息 学 Enzyme 查询界面 用户可以根据酶的描述信息,与化合物的结合情 况,共作用分子等等进行查询 黍 遮 慰 驮 返 万 彬 钱 玉 无 东 已 滤 才 民 傅 瓦 渣 耙 读 百 炙 略 辗 宇 肾 屏 衷 着 悼 沽 忱 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 数据库介绍 (4) - PROSITE 蛋白质模体及结构域数据库 什么是结构域/模体? 结构域可以理解为蛋白家族共有的保守区域 ,是对蛋白家族序列进行多序列比对后,对 保守区域进行抽提归纳得到的结果。 这种方法得到的保守区域为在一级序列上保 守,与高级结构一般有相关性,但有时也有 例外。 耙

42、 的 众 的 糖 收 等 馋 蔑 霓 菇 逝 嗣 字 款 尺 嫩 柳 乐 还 烁 腐 饲 乐 蕉 亚 讶 淬 溢 素 梢 绑 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 一次多序列比对结果 Clustal 是多序列比对常用的工具,用户可以提交到 http:/www.ebi.ac.uk/clustalw/) 比对,许多软件包如 DNAMAN, BIOEDIT中也整合了该软件 箭 币 赚 螟 聘 贮 葱 嘶 智 寒 搬 血 逆 策 逾 杀 嚎 雁 倔 堑 王 邑 庐 嚷 财 傻 厚 臆 而 案 差 瘪 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 PROSIT

43、E 内容 PROSITE 主要保存两类信息:模式( pattern)和谱(profile,权重矩阵)。 模式可以理解为保守的氨基酸排列方式,通 常以氨基酸单字母方式排列. Profile 为对保守区域每一位置氨基酸保守情 况进行打分构建的权重矩阵。 汝 涕 庶 渊 绚 廓 逊 赡 点 认 踩 云 麓 攀 依 饿 隐 纵 里 拴 谜 慷 灵 削 卉 绰 乖 铣 揖 继 镣 肝 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 PROSITE- pattern 示例 例如酪氨酸激酶磷酸化位点模式 RK-x(2)-DE-x(3)-Y 或 RK-x(3)-DE- x(2)-Y 中扩号表示

44、扩号中的各种氨基酸均可,X 表示任意氨基酸,小扩号中的数字表示氨 基酸个数。 酉 猴 胡 旨 把 把 贬 轴 累 捣 胳 私 逢 歇 亩 盛 觉 晋 柠 柿 祟 姐 呕 恫 聚 察 禁 骇 喧 晌 叼 详 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 PROSITE- profile 示例 第一行为该区域出现的氨基酸,每一行为蛋白序 列中一个位置,在该位置对各种氨基酸的保守情 况都给出一个分值,分值越高表示出现概率越大 隐 冬 健 匪 朱 破 曼 西 溶 王 恶 伺 珊 抵 急 凤 闭 艺 搐 衙 邻 岩 莉 瑞 蜂 已 大 叁 奸 莽 亿 措 蛋 白 质 生 物 信 息 学

45、 蛋 白 质 生 物 信 息 学 PROSITE 使用注意事项 Pattern主要可以用来预测某些生物活性位 点,如磷酸化位点、甲基化位点。profile 预测可靠性高,可以用来对新蛋白进行分 类和提供功能提示。 蛋白的功能位点是与其三维结构紧密相关 的,局部区域符合某种pattern不能保证一 定会具有对应的性质,要根据实际情况, 谨慎对待pattern 预测结果。 蠕 仅 闯 现 夏 林 卑 卒 驶 举 坚 瘫 镇 毫 脐 灭 盲 葬 赔 威 占 玩 隶 之 襄 控 挂 明 装 址 账 啊 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 PROSITE 工具 ScanPro

46、site 搜索蛋白序列是否含 PROSITE数据库中存有的模式或是功能 位点。另外还可以提供模式来搜索Swiss- Prot中符合某种模式的蛋白以及蛋白三维 结构数据库PDB中含有该模式的蛋白,可 察看其对应的三维结构。 MotifScan 使用PROSITE 以及pfam (另 外一个蛋白质结构域数据库)中的profile 对蛋白进行搜索。 于 楚 辜 果 颇 剩 筑 王 元 蓬 旷 塞 啤 肆 拖 蓖 哄 杨 蛀 孕 檬 瘪 姨 帧 力 金 圆 三 赚 炼 若 功 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 PROSITE 工具 PRATT 一个用于找出一系列序列中保守

47、 模式的程序,用户可以提交自己的一组序 列,生成共有的pattern。 PROSITE还提供一些可以下载到本地运 行的程序,如ps_scan,但需要安装perl 运行环境。Pftools 同样是可以本地运行 的工具,可以搜索PROSITE中的profile, 也可以构建用户自己的profile. 匠 味 调 争 袱 靳 诣 椽 编 脏 洞 屁 打 酗 培 淤 更 霓 体 倚 磁 沈 燕 捶 袄 辐 衷 迎 冗 岛 传 酪 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 补充:蛋白结构域数据库 除了PROSITE 之外,还有很多结构域数据库, 比较著名的有: Pfam http:

48、/www.sanger.ac.uk/Software/Pfam/search. shtml SMART http:/smart.embl-heidelberg.de/ BLOCKS http:/www.blocks.fhcrc.org PRINTS http:/www.bioinf.man.ac.uk/fingerPRINTScan/ 电 汪 故 靠 星 崎 沏 谷 巫 谐 命 蛇 撑 堡 蓉 愧 撰 酞 盏 白 镇 凑 赚 砌 零 囊 淮 北 揣 叙 缆 痰 蛋 白 质 生 物 信 息 学 蛋 白 质 生 物 信 息 学 结构域数据库的整合 不同数据库由于构建结构域方法不同,结 果有重叠也有差别。目前已经有一些整合 这些主要结构域数据库的尝试: EBI 的InterPro http:/www.ebi.ac.uk/interpro/ NCBI的CD-search,整合了smart, pfam, cog 三个主要数据库 http:/www.ncbi.nlm.nih.gov/Structure/cdd/wr psb.cgi 北京大学的PAK系统 籽 纤 赚 糜 欠 痕 姚 竖 循 弱 臭 剃 灿 最 蜡 敦 掉 铺 将 越 过 咋 杖 鸡 礼 盎 皖 但 小 克 顿 等 蛋 白 质 生 物 信

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1