元胞自动机图的蛋白质二级结构类型预测.doc

上传人:scccc 文档编号:14498592 上传时间:2022-02-07 格式:DOC 页数:1 大小:38.50KB
返回 下载 相关 举报
元胞自动机图的蛋白质二级结构类型预测.doc_第1页
第1页 / 共1页
亲,该文档总共1页,全部预览完了,如果喜欢就下载吧!
资源描述

《元胞自动机图的蛋白质二级结构类型预测.doc》由会员分享,可在线阅读,更多相关《元胞自动机图的蛋白质二级结构类型预测.doc(1页珍藏版)》请在三一文库上搜索。

1、2262010,46(15)Computer Engineering and Applications 计算机工程与应用元胞自动机图的蛋白质二级结构类型预测胡鸿豪,宋丽平,肖绚HU Hong-hao,SONG Li-ping,XIAO Xuan杲德镇陶瓷学院机电学院,江西景徳镇333001Jingdezhen Ceramic Institute 9Jingdezhen Jiangxi 3330019 ChinaE-mail : zhehong77523 HU Ilong-hao tSONG Li-ping, XIAO XuanSecon46( 15): 226-229.Abstract: On

2、e of the important tasks of lhe post genome project is protein structure prediction,the key step of which is protein secondary structure prediction.This paper makes use of a mode of digital coding fc)r amino acid w and uses cellular automata to generate image representation for protein sequences.A p

3、rotein sequence can be represented by a unique image,and the image takes into account the interactional actions between amino acids.By the Gray Level Co-occurrence Matrix(GLCM) deriving from the CAI,a novel method has been developed that can be used to predict the secondary stmeture of the prolein/R

4、w result thus obtained is quite promising.Key words: secondary structure prediction;Cellular Automata(CA);Gray Level Co-occurrence Malrix(GLCM);K nearest neighbor algorithm:Jackknife cross-validation摘 要:妥白质结构预测是后基因组时代的一项重奂任务,买白质二级结构预测是妥白质姑构預测的关键步骤。利用啟基酸數字 编码模型生成旻白质序列的元胞自动机图(Cellular Automata ImageCA

5、I),提出了一种恳于灰度共生矩阵(Gray Level Co-occur- rencc Matrix,GLCMX取纹理图像特征的方法。用扩大的协方差算法进行预测,仿人结果显示有校好的分类效果Jackknife检脸 的頂测成功率达94.61 %o关键诚:蛋白质二级结构;元胞自动机;灰度共生矩阵;K近邻算法Jackknife测试DOI: 10.3778/j.issn. 1002-8331.2010.15.067文章编 9-: 1002-8331 (2010) 15-0226-04文猷标识码:A 中图分类9:TP3911前言蛋白质二级结构是指a螺旋和Q折叠等规则的蛋白质局 部结构元件。不同的氨基酸残

6、基对于形成不同的二级结构元件 具有不同的倾向性。按责白质中a螺旋和0折叠二级结构含 址,可以把球形贺白分为全a蛋白.全0蛋白、a申蛋白和叩 蛋白等4个折叠类型叭蛋白质二级结构预测是分子生物学中 的重要问题。蛋白质结构预测是后基因组时代的一项重要任 务。随着人类基因组计划的顺利实施,已完成测试的蛊白质序 列急速增加理论预测蛋白质结构势在必行。尽管20世纪50 年代初Anfinsen就提出了蛋白质特定的空间结构是由其氨基 酸排列顺序所决定的假说即蛋白质的一级结构决定其空间结 构并因此获得了诺贝尔奖但是目炕人们试图从蛋白质一级 净列直接预测其空间结构时仍遇到了种种困难,预测率一玄 不高。在这种情况下

7、,蛋A质二级结构预测就显得尤为車要它 不仅成为联系蛋白质一级结构和三级结构的纽带而且也是从 一级结构预测其三维空间结构的关键步骤叫蛋白质结构的类型预测是蛋白质科学的一个重要的组 成。许多不同的方法L1被用于蛋白质结构的类型预测。其基本 思路是:首先提取表征氨基酸序列的特征参就并将其转化为 数值矢量.然后基于这些特征参址建立蛋白质结构类型的识 别算法。一般的预测蛋白质二级结构的算法大多以已知三维 结构和二级结构的蛋白质为依据,通过机器学习、人工神经网 络、遗传算法等技术构建预测方法。总的来说,二级结构仍是 未能完全解决的问题,一般对于a螺旋预测精度较好.对0 折賽差些而对除a螺旋和0折聲等之外的

8、无规则二级结构 则效果很差。现在实用的大部分的这些方法都是基于氨基酸的成分,也 就是说在表示蛋白质的空间中,一个蛋白质样本可用一串20 个不连续的数字构成这20个数字分别代表了 20种不同氨基 酸在蛋白质序列中出现的频率叫明显地,如果只是使用传统的 氨基酸成分作为蛋H质的表示那么蛋白质序列中的氨基酸出 现前后次序以及卞列的长度将被遗失宀因为上述原因伪氨基菇金頊目:国家自然科学基金(the National Natural Science Foundation of China under Grant No.60661001);江西省自然科学基金(the Natural Science Foundation of Jiangxi Province of China under Grant No.0611060)作者簡介:胡鸿*(1953-).男教授,硕士生导师研究方向:非电蚩测量电测技术;宋丽平(19B1J男,硕士研究生,研究方向:微电子技术;肖绚 (1970-),男,教授,砍士生导师,研究方向:生物信息学,模式识别。期:2008-11-16修何口 期:2009-02-09

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1