热点残基预测的总结.ppt

上传人:罗晋 文档编号:5732862 上传时间:2020-07-25 格式:PPT 页数:17 大小:825.50KB
返回 下载 相关 举报
热点残基预测的总结.ppt_第1页
第1页 / 共17页
热点残基预测的总结.ppt_第2页
第2页 / 共17页
热点残基预测的总结.ppt_第3页
第3页 / 共17页
热点残基预测的总结.ppt_第4页
第4页 / 共17页
热点残基预测的总结.ppt_第5页
第5页 / 共17页
点击查看更多>>
资源描述

《热点残基预测的总结.ppt》由会员分享,可在线阅读,更多相关《热点残基预测的总结.ppt(17页珍藏版)》请在三一文库上搜索。

1、热点残基预测的总结,13 级 艾美乐,相关背景,近年来,研究人员对蛋白质相互作用网络的研究中发现,在蛋白质相互作用界面上存在一种很特殊的残基,当使用丙氨酸突变扫描技术将这类残基诱发突变成丙氨酸后,会使结合自由能产生很大的变化,研究人员将这些残基称为热点残基。通过进一步的研究发现,热点残基主要是集中在蛋白质相互作用界面的中心部位,它们对保持蛋白质的功能和相互作用结合的稳定性起着非常重要的作用。因此对蛋白质相互作用界面中热点残基的研究不仅助于我们理解未知蛋白质的功能以及特定生物功能的生物特性,还能为研究人员探明致病微生物的致病机理,有助于新型药物的研发,从而提高人类的生活质量。,1.研究意义,2.

2、研究技术,目前研究蛋白质相互作用界面中热点残基的技术方法主要是丙氨酸突变扫描实验,该方法就是把蛋白质结合界面的氨基酸残基突变成丙氨酸,然后检查这个过程中结合自由能的变化,如果超过某个值就被认定为热点残基。该方法的优点是识别精度非常高,但缺点是成本高,周期长,需要消耗大量的人力和物力。因为蛋白质结合界面中的氨基酸残基数量非常大,但热点残基的数量往往很小,所以生物实验中要找到热点残基是相当困难的,因此通过数据挖掘和机器学习的方法来预测蛋白质相互作用界面的热点残基的方法应运而生,通过预测模型可以找出大部分的热点残基,然后结合生物实验进行验证,不仅能大大降低发现热点残基的成本,而且能缩短周期,提高效率

3、。,3.研究现状,正因为热点残基在蛋白质相互作用中有着非常重要地位,研究人员对它的生物属性进行了大量的研究。,Bogan和Thorn的研究表明,热点残基和非热点残基在氨基酸组成上存在着明显区别,色氨酸、酪氨酸和精氨酸在热点残基中出现的频率较高,苏氨酸、亮氨酸、缬氨酸和丝氨酸这些氨基酸在蛋白质结构中有着重要地位,但是它们在热点残基中出现却很少,而天冬酰胺和天冬氨酸相比谷酰胺和谷氨酸,在热点残基中出现更加频繁,原因可能是侧链构象熵的不同。 Li和Liu在研究中发现,热点残基通常是被一些在结合自由能上贡献不大的残基环绕着,这些残基在热点残基周围形成了一个环形结构,这个结构被称为“O”环,它的作用是使

4、热点残基与周围的水分子隔离开来而不能与之发生相互作用。 另外一些研究表明,热点残基比非热点残基在进化过程中更加的保守。,热点残基的相关介绍,一般热点残基通常被定义为丙氨酸突变后引起结合自由能的变化值大于等于2.0kcal/mol的那些结合面上的残基。 其它: G=2.0kcal/mol为热点残基,G=2.0kcal/mol为热点残基,G=1.0kcal/mol为热点残基,G1kcal/mol为非热点残基。,界面残基的定义:ASA12的残基。或者,界面残基是和其它链有原子连接的残基。这里的原子连接可以用CSU program计算。,热点残基数据库,ASEdb:丙氨酸扫描热力学数据库,就是实验获得

5、的热点残基的数据库。 BID:结合界面数据库,通过从文献中挖掘经过实验验证的热点残基数据库。,通常从ASEdb数据库中获得的数据作为训练集,从BID数据库中获得的数据作为测试集,热点残基的预测方法,从策略和技术上面来说: 策略: 1.基于能量的 2.基于特征的 3.基于综合信息的,1.经验公式 a.能量函数 b.经验函数 2.机器学习 a.遗传算法 b.人工神经网络 c.决策树 d.支持向量机 e.贝叶斯网络,技术:,基于能量的策略需要计算G,例如,计算丙氨酸扫描技术,就是利用结合自由能函数来计算丙氨酸突变效应引起的G的变化,根据计算出的G来标识热点残基。,Let A and B denote

6、 the unbound monomers and AB the complex we assume that the alanine mutation occurs on protein A. We further denote with (wt) the wild-type molecules and with (mut) the mutated molecules,基于特征的策略,利用各种特征把特点残基于界面上的其余残基区分开来,主要包括:从序列提取的特征,从结构提取的特征,从分子相互作用信息提取特征。现在大多数都是基于特征的。,特征: 序列:PSSM,sequence entropy等

7、 结构:ASA,Ca等 分子相互作用:氢键,库仑力等,基于序列特征。从AAindex中提取154个特征,经过提取去(去冗余)最终得到132个特征。提出了一个新的编码方案;PSSM*AA1点乘。对这132个特征分别建立分类器,最终选出10个最好的特征。然后集成。,基于序列和结构的特征,ASA,BC,Phy,ESE,SE,PSSM。本论文,首先分成两组ASA,BC,Phy和Phy,ESE,SE,PSSM。sequence-based svm,structure-based svm和all features svm,分别进行预测。,本论文也是多种特征,包含序列和结构信息,包含62个特征,然后利用特征

8、选择F-SCORE。然后获得9个特征,构建9个基于ASA或PI的单特征SVM模型,然后通过投票来预测热点残基。,基于能量的特征,van der Waals potentials,solvation energy,hydrogen bonds ,Coulomb electrostatics。3种类别,共12个特征。SVMx特征根据correlation of energy terms with observed G values.,本论文利用108个序列,结构,能量特征。然后又分别计算两结构相邻的特征,Euclidean distance 和 Voronoi diagram 一共324个特征。进

9、行两步特征选择,随机森林和序列向后消除。获得38个优秀特征,之后利用SVM进行分类,最后进行集成。,the nearest contact residue in the other face and the nearest contact residue in the same face,本论文也是利用序列,结构和能量的特征。而且面对数据不平衡问题上提出了利用半监督学习。,在线服务器,KFC Server:http:/kfc.mitchell-lab.org HotPoint:http:/prism.ccbb.ku.edu.tr/hotpoint PredHS:http:/www.predhs.org Hspred:http:/bioinf.cs.ucl.ac.uk/psipred,END,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 科普知识


经营许可证编号:宁ICP备18001539号-1