原鸡基因CD8a生物信息学初步分析论文1.doc

上传人:小小飞 文档编号:3916292 上传时间:2019-10-10 格式:DOC 页数:23 大小:2MB
返回 下载 相关 举报
原鸡基因CD8a生物信息学初步分析论文1.doc_第1页
第1页 / 共23页
原鸡基因CD8a生物信息学初步分析论文1.doc_第2页
第2页 / 共23页
原鸡基因CD8a生物信息学初步分析论文1.doc_第3页
第3页 / 共23页
原鸡基因CD8a生物信息学初步分析论文1.doc_第4页
第4页 / 共23页
原鸡基因CD8a生物信息学初步分析论文1.doc_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《原鸡基因CD8a生物信息学初步分析论文1.doc》由会员分享,可在线阅读,更多相关《原鸡基因CD8a生物信息学初步分析论文1.doc(23页珍藏版)》请在三一文库上搜索。

1、原原鸡鸡基因基因 CD8a 生物信息学初步分析生物信息学初步分析 姓 名 卢慧 院 系生命科学学院 专 业生物技术 班 级 2011 级 1103 班 学 号1154010426 指导教师贾震虎 内容摘要 本文的实验对象是原鸡的 CD8a。本实验运用生物信息学方法,对本条核酸 序列进行核酸一级结构和其表达产物的一级结构、二级结构以及三级结构进行 初步分析。通过分析我们得出,该条序列长度为 648bp,有多种酶的限制性酶 切位点,与其他鸡形目的 CD8a 相似性很高,本条序列共编码 216 个氨基酸。氨 基酸疏水性不高,有 12 个磷酸化位点,没有信号肽,有一个跨膜区,蛋白质二 级结构主要是 螺

2、旋,占 22.69%;延伸链,占 15.74%;无规卷曲,占 61.57%,并且分布不连续。通过对其系统发生树的建立,三种方法构建的系统 树,所表现的 CD8a 和其他物种同源序列之间的关系基本一致。 【关键词】:原鸡 生物信息学 CD8a 目录 一、综述.4 二、分析研究材料与方法.5 (一)研究材料5 (二)研究方法及工具5 (三)分析方法和具体步骤6 三、预测结果与分析.8 (一)核酸序列一级结构分析8 1核酸序列基本分析8 2.核酸序列的酶切图谱分析.9 3.碱基同源性初步分析.11 (二)氨基酸序列的初步分析12 1.氨基酸序列的组成.12 2磷酸位点的预测14 3氨基酸的疏水性和亲

3、水性分析14 4氨基酸的跨膜区分布15 5信号肽区域的预测16 (三)氨基酸高能结构的分析17 1氨基酸的二级结构分析17 2蛋白质序列的结构功能域分析18 3蛋白质的亚细胞定位19 4氨基酸序列三级结构的分析20 5系统进化树的构建及其进化分析20 四、结果讨论.21 (一)核酸序列的基本分析21 (二)氨基酸序列的基本分析21 (三)蛋白质高级结构分析及功能预测22 (四)结论22 五、参考文献.22 原鸡基因 CD8a 生物信息学初步分析 Bioinformatical Analysis of a Gallus gallus CD8a Gene 学生姓名:卢慧 指导老师:贾震虎 一、一、

4、综综述述 生物信息学是一门新兴的前沿的科学,它随着计算机的技术的发展,逐步 应用于农林学、生物学、医学等研究中1,通过各种软、数据库、服务器对生 物分子的分析及功能预测,在科技领域显示了它越来越重要的作用。 本文就是利用生物信息学方法,对原鸡的 CD8a 进行初步分析。原鸡不仅适 应于热带、亚热带地区饲养繁衍,而且对高寒地区也具有良好的适应能力,全 年各个季节全国各地均可饲养。而且其抗病能力强,病害少,育雏成活率高, 达到 98%左右,属于中国二级保护动物。 CD8分子是 T 淋巴细胞表面的 I 型跨膜蛋白2,也是 T 淋巴细胞表面重要的 标志性分子3, 4。鸡的 CD8分子主要表达在细胞毒性

5、 T 淋巴细胞5、抑制性 T 细胞和树突状细胞的表面。6CD8分子是二聚体,并有 CD8aa 同型二聚体和 CD8a 异型二聚体两种表达形式。CD8主要识别 MHC类分子递呈的内源性抗原; 鸡 CD8分子是鸡免疫系统的重要组成部分,与哺乳动物的 CD8分子在生物进化和 功能上有明显的相似性12,13。CD8a 参与胸腺分化以及 T 细胞活化的信号传导,7 而 CD8 主要协助 CD8a 发挥生物学功能。 通过对不同物种的 CD8a 核酸序列的分析,人们发现 CD8a 是一个功能类似 而且较为保守的跨膜蛋白,约由230个氨基酸组成,包含一个规范的信号肽,一 个 Ig 高变区,Ig 高变区暴露于同

6、源的免疫球蛋白的 CDR1、2、3的钩环区;紧 接着 Ig 高变区的是富含脯氨酸的铰链区,之后是由二十个氨基酸构成的跨膜区。 本文首先对核酸序列进行基本分析,通过对酶切位点的分析,我们可以 对本条核酸序列酶切及体外扩增,用于分子实验。对氨基酸序列的分析,我 们可以找到其磷酸化的位置,有无信号肽,以及亚细胞定位和其二级结构等, 在此基础上,来分析预测结构和功能的关系。对CD8a 基因的生物信息学分 析,通过比较相同基因和不同基因的等位基因,有助于研究不同基因间的进化 关系,以及进一步研究 CD8a 与免疫系统防御的关系,所以在原鸡养殖和优良 育种方面具有很好的应用前景8。 二、分析研究材料与方法

7、二、分析研究材料与方法 (一)研究材料 研究对象是原鸡的 CD8a 作为研究材料,长度为 648bp,在 GenBank 的登录 号为 NM_205235.1。 (二)研究方法及工具 本论文采用生物信息学方法,用计算机对草鱼的原鸡的 CD8a(648bp)的 结构、功能及进化地位进行了研究,主要用到的生物信息学数据库、分析软件 以及网络服务器如下 数据库: NCBI(National Center for Biotechnology Information,美国 国家生物技术信息中心) 软件: Bioedit(用于核酸序列编辑与分析) Discover studio Visualizer(用于

8、蛋白质结构的分析) MEGA(用于分子进化遗传分析) 网络服务器(主要用于蛋白质结构的预测): BLAST 程序(用于同源序列的比对) SCRATCH Protein Predictor(蛋白质结构预测) Swiss-model; CBS 服务器的 NetPhos2.0 Server Expos 服务器的 Prostate CBS 服务器的 TMHMM Server v. 2.0 CBS 服务器的 SignalP3.0 server PBIL LYON-GERLAND 信息库 SMART CBS 服务器的 CPHmodels Wolf PSORT CDART: Conserved Domain

9、 Architecture Retrieval Tool (三)分析方法和具体步骤 首先,登录 NCBI,将待分析核酸序列存为 FASTA 格式,命名为 48。将氨基 酸序列存为 FASTA 格式,命名为 CD8a。 1.对本条核酸序列一级结构的分析 (1)核酸序列的基本分析采用 Bioedit 软件,打开 Bioedit,选择文件, 将保存好的 FASTA 格式的核酸序列打开。选中本条序列后点击 SequenceNucleic AcidNucleotide Composition,就会显示核酸序列的分 子量、碱基数量等结果,保存这个结果。 (2)核酸序列的酶切图谱分析 用 Chromaspr

10、o 软件进行限制性酶切位点的分析,在 Chromaspro 软件中打 开该序列的 FASTA 格式,再点 Analysis Restriction Enzyme,选择 all Enzyme 即可显示出分析结果,保存结果。 (3)同源序列的搜索与对比 首先打开 NCBI 首页,再打开 Blast,在 Basic Blast 中选 Nucleotide blast。页面打开后,在对话框中浏览文件,选择保存好的 FASTA 格式的核酸序 列,在 Database 中选 others(nr etc),默认其它参数。最后点 BLAST,显示分 析结果,保存。 2氨基酸序列的初步分析 (1)氨基酸序列的组

11、成 打开 BioEdit 软件,打开本条氨基酸编码的氨基酸序列,选中序列,点 SequenceProteinAmino Acid Composition,显示结果,保存。 (2)氨基酸序列的磷酸化位点分析 运用丹麦科技大学(DTU)的 CBS 服务器上的 NetPhos2.0 Server 程序。 网址:http:/www.cbs.dtu.dk/services/NetPhos/ 打开网址,浏览文件,选中 FASTA 格式的氨基酸序列,之后,在参数中选 择:tyrosine(酪氨酸)、threonine(苯丙氨酸)、serine(丝氨酸)这三种 氨基酸为了看是这三种氨基酸否被磷酸化,点击 Su

12、bmit 提交,最后结果以图像 形式输出。 (3)氨基酸序列疏水性和亲水性分析 采用 ExPAsy 服务器上的 ProtScale 程序进行氨基酸的疏水性分析 网址:http:/www.expasy.org/cgi-bin/protscale.pl 打开网址,之后将氨基酸序列复制粘贴到对话框,在参数选择中,有不同 的 Window size 和 amino acid scale,选择不同的参数会得到不同的结果,在 这里,我们选择:Hphob. / Roseman,点击 Sumbit 提交,出现结果并保存。 (4)氨基酸序列的跨膜区分析 运用丹麦科技大学(DTU)的 CBS 服务器上的 TMHM

13、M Server v. 2.0 程序。 网址:http:/www.cbs.dtu.dk/services/TMHMM/ 打开网址,浏览文件,将氨基酸序列的 FASTA 格式选入对话框中,输出形 式选 Extensive,with graphic,最后点击 Submit(提交),稍后会出现分析 结果,保存结果。 (5)氨基酸序列的信号肽预测 使用 SignalP3.0 server 程序。 网址:http:/www.cbs.dtu.dk/services/SignalP/ 首先打开网址,浏览文件,将氨基酸序列 FASTA 格式选入对话框中,选择 参数: Organism group:选 Euka

14、ryotes(真核细胞); Method(神经网络算法):本实验为了比较选 Both; Graphics:选择 GIF (inline); Output format:选择 Standard(标准)输出方式; Truncation:由于无法预测信号肽长度一般选择(0)阻断,本次实验为 了比较还选择(30)为阻断常数。点 Submit 按钮,出现结果并保存。 3.氨基酸高能结构的分析 (1)氨基酸序列的二级结构分析及预测 运用 PBIL LYON-GERLAND 数据库对氨基酸的序列进行二级结构预测。 网址:http:/npsa-pbil.ibcp.fr/cgi- bin/npsa_automa

15、t.pl?page=/NPSA/npsa_hnn.html 首先,打开网址,把氨基酸序列粘贴在对话框中。点击 Submit(提交), 显示结果并保存。 (2)氨基酸序列的结构功能域分析 用简单模块构架搜索工具 SMART 对氨基酸序列序列进行结构功能域分析。 网址:http:/smart.embl-heidelberg.de/, 打开网址,在首页上点 throuth this page,进入新页面。在 Sequence 中 粘贴氨基酸序列,最后点 Sequence SMART 即可得到结果,保存结果。 (3)蛋白质的亚细胞定位 运用 WoLF PSORT 程序对氨基酸序列进行亚细胞定位。 网址

16、:http:/wolfpsort.seq.cbrc.jp/ 首先,打开网址,在“select an organism type” 中选择“Animal”。 之后,“Please select input method”选择“From File”;浏览文件,选入 FASTA 格式的氨基酸序列,最后,提交,将结果保存。 (4)氨基酸序列三级结构分析 运用丹麦科技大学(DTU)的 CBS 服务器上的 CPHmodel3.0 程序对氨基酸序列 进行三级结构的分析。 网址:http:/www.cbs.dtu.dk/services/CPHmodels/ 首先打开网址,将氨基酸序列放入对话框,点 Subm

17、it,将新页面中的 Email 地址填好,几分钟之后将结果打开,点 query.pdb 下载 pdb 格式的文件。 打开 Accelrys Discovery Studio Visualizer3.1 软件,在 OPEN 里打开刚 才下载的文件,即可出现蛋白质的 3D 结构,保存结果。 (5)系统发生树的构建及进化地位分析 运用 MEGA4 软件对的核酸序列和氨基酸序列进行同源性分析,并绘制出系 统发生树。通过 NCBI 数据库,BioEdit 和 MEGA 软件进行系统发生树的构建, 来进行进化地位分析。 首先在 NCBI 中通过 Protein Blast 找到与该 EST 氨基酸序列相似

18、的序列, 并下载它们的氨基酸序列,连同本文预测序列一起放入一个记事本中保存,在 BioEdit 中打开,用 FASTA 格式保存。 用 MEGA 软件构建系统进化树。打开 MEGAAlignmentAlignment explorer/CLUSTAL选 create a new alignment,点 OK在弹出的对话框中点 NO(表示放入的序列是蛋白质的)又出现了一个对话框,打开之前保存的 FASTA 格式的氨基酸序列全选,再点 W( Align selected block by clustalW)点 OK然后再点 Dataexport alignmentMEGA format,保存 在之

19、前小 MEGA 中打开上步保存的 megphylogenyconstruct phylogeny 最后再选 NJ 或 MP 即可得到进化树,保存结果。 三、三、预测结预测结果与分析果与分析 登陆 NCBI,登陆号为 NM_205235.1,将核酸序列和氨基酸序列保存为 FASTA 格式,用来下文分析。 (一)核酸序列一级结构分析 1核酸序列基本分析 运用 Bioedit 软件分析核酸序列的分子质量、碱基组成和碱基分布。 结果如下: 图 1 核酸序列 4 种碱基百分比直方图 通过分析,统计数据得 表一: 碱基组成分析表 ATCG 数量 170193162123 百分比 26.2329.7825.

20、0018.98 本序列全长 648bp,单链分子量 198449.00Daltons,双链分子量 394483.00Daltons。 2.核酸序列的酶切图谱分析 结果如图,包含了多种酶的限制性酶切位点。 图 2 核酸序列酶切位点预测图 3碱基同源性初步分析 在 NCBI 中,将本条序列 BLAST,得到以下结果 图 3 核酸序列碱基同源性对比图(1) 图 4 核酸序列碱基同源性对比图(2) 本文序列预测额和原鸡 CD8a 分子基因相似度高达 100%,我们跟踪其 中一条序列,得到以下结果 图 5 核酸序列碱基同源性对比图(3) 这是原鸡 CD8a 分子基因和本条核酸序列的对照,在原鸡的第 62

21、 个碱基到 第 709 个之间,这俩条序列相同。 (二)氨基酸序列的初步分析 1氨基酸序列的组成 用 Bioedit 软件对氨基酸组成分析结果如下: 图 6 氨基酸百分比直方图 表 2 氨基酸组成分析表 Amino AcidNumberMolAmino AcidNumberMol Ala A156.94Met M41.85 Cys C94.17Asn N136.02 Asp D52.31Pro p156.94 Glu E94.17Gln Q146.48 Phe F125.56Arg R167.41 Gly G125.56Ser S177.87 His H41.85Thr T167.41 Ile

22、 I125.56Val V115.09 Lys K115.09Trp W20.93 Leu L156.94Tyr y41.85 2磷酸位点的预测 结果显示,有 9 个丝氨酸(Ser),2 个苏氨酸(Thr),1 个酪氨酸(Tyr) 可能被磷酸化,可能性分析如下: 图 7 序列中可能的磷酸化位点(1) 图 8 序列中可能的磷酸化位点(2) 3氨基酸的疏水性和亲水性分析 得到以下结果 图 9 氨基酸的亲/疏水性分布图 氨基酸序列的亲疏水性决定了蛋白质的结构,从输出结果来看,氨基酸序 列集中在-1 附近,所以疏水性不强,属于亲水性氨基酸。 4氨基酸的跨膜区分布 运用丹麦科技大学(DTU)的 CBS

23、服务器上的 TMHMM Server v.2.0 程序对 该序列进行蛋白质序列的跨膜区分析。 得到结果如下图 图 9 氨基酸序列跨膜区分析图 从分析结果来看,本条氨基酸序列中有一个跨膜区。 5信号肽区域的预测 图 10 氨基酸序列信号肽分析 通过分析,本条序列没有信号肽。 (三)氨基酸高能结构的分析 1氨基酸的二级结构分析 图 11 氨基酸的二级结构分析图 表 3 二级结构预测结果 a 螺旋(Hh) 49 22.69 310 螺旋(Gg) 0 0.00 Pi 螺旋(Ii) 0 0.00 片层(Bb) 0 0.00 延伸链(Ee) 34 15.74 转角(Tt) 0 0.00 弯曲域(Ss) 0

24、 0.00 无规卷曲(Cc) 133 61.57 任意形式 0 0.00 其它形式 0 0.00 图 12 氨基酸二级结构预测 图 13 二级结构分析直观结果 通过表格和上图我们可以看出这条氨基酸序列的二级结构主要是 a 螺旋, 占 22.69%;延伸链,占 15.74%;无规卷曲,占 61.57,并且分布不连续。 2蛋白质序列的结构功能域分析 有输出结果,我们得出,本条序列的功能域是由第 23 个氨基酸到第 133 个氨基酸编码的 IG 结构域。E 值是 1.63e-03。 3蛋白质的亚细胞定位 运用 WoLF PSORT 程序对氨基酸序列进行亚细胞定位。结果如下: 图 15 亚细胞定位分析

25、结果图(1) 图 16 亚细胞定位分析结果图(2) 图 17 亚细胞定位分析结果图(3) 通过分析结果,我们得出亚细胞定位分析蛋白质位于细胞膜上。 4氨基酸序列三级结构的分析 结果及分析 图 18 三级结构模型 以上是蛋白质三级结构的模型图,有 螺旋和很多的无规卷曲,其余为延 伸链。 5系统进化树的构建及其进化分析 图 19 绝对保守区(局部) 图 19 N-J 法构建的刺痛发生树 图 20 M-P 法构建的系统发生树 通过以上的分析结果显示,两种方法构建的系统树,本文所研究的序列和其他 物种同源序列之间的关系基本一致。预测蛋白与火鸡最接近,所以预测它们在 结构和功能方面处于同一进化地位。 (

26、四)(四)结结果果讨论讨论 (一)核酸序列的基本分析 通过对本条序列以上几方面的分析,我们可以得出:该条序列是一条全 长 648bp 的 mDNA,含有多种酶的酶切性位点,通过得出的酶切位点的信息,我 们可以对本条核酸序列酶切及体外扩增,用于分子实验。通过碱基的同源 性分析,与其他鸡形目 CD8a 序列比较相似,相对保守。 (二)氨基酸序列的基本分析 通过氨基酸序列的分析,我们发现此序列编码的蛋白质有较强的保守性。 有 9 个丝氨酸(Ser),2 个苏氨酸(Thr),1 个酪氨酸(Tyr)可能被磷酸化, 氨基酸序列的亲疏水性决定了蛋白质的结构,从输出结果来看,氨基酸大部分 序列的值小于 0,疏

27、水性不强,属于亲水性氨基酸。本条氨基酸序列有一个跨 膜区,没有信号肽区域,怀疑此序列结构和功能域不完全,需要再进行进一步 分析。 (三)蛋白质高级结构分析及功能预测 蛋白质二级结构主要是 螺旋,占 22.69%;延伸链,占 15.74%;无规 卷曲,占 61.57%,并且分布不连续。本条序列的功能域是由第 23 个氨基酸到 第 133 个氨基酸编码的 IG 结构域。E 值是 1.63e-03.经过亚细胞定位分析,蛋 白质位于线粒体。通过 M-P 法构建的系统发生树可以预测蛋白与火鸡最接近, 所以预测它们在结构和功能方面处于同一进化地位。 (四)结论 CD8 分子是 T 淋巴细胞表面的 I 型跨

28、膜蛋白11,14,也是 T 淋巴细胞表面重 要的标志性分子9。CD8 分子是二聚体,并有 CD8aa 同型二聚体和 CD8a 异型 二聚体两种表达形式15。其中,CD8a 是一个功能类似而且较为保守的跨膜蛋白, 约由 230 个氨基酸组成,包含一个规范的信号肽,一个 Ig 高变区,Ig 高变区 暴露于同源的免疫球蛋白的 CDR1、2、3 的钩环区;紧接着 Ig 高变区的是富含 脯氨酸的铰链区,之后是由二十个氨基酸构成的跨膜区。本文预测的蛋白质含 216 个氨基酸,从结果来看,没有信号肽,无法实行穿膜功能,但是有跨膜区, 至于其是怎样完成穿膜,需要我们进一步分析。通过以上分析结果,推测该蛋 白质

29、可能是与其他同源基因编码的 a 链和 链结合共同完成免疫功能。现今普 遍认为,CD8 分子是参与 TCR 信号传导的辅受体。作为辅受体, CD8 在信号 传导中起重要作用,通过 p56lck和 CD3 链间的酪氨酸磷酸化途径激活 TCR10。最近的数据表明, CD8 具有一系列重要免疫学功能的跨膜分子。 五、参考文献五、参考文献 1.Bernard, V. and M. Michaut, Explain bioinformatics to your grandmother! PLoS Comput Biol. 9(10):e1003305. 2.Wu, T.L., et al., CD8 T

30、Cell Recognition of Epitopes Within the Capsid of Adeno-associated Virus 8-based Gene Transfer Vectors Depends on Vectors Genome. Mol Ther. 3.Zou, Q., et al., CD8 Treg cells suppress CD8 T cell-responses by IL-10-dependent mechanism during H5N1 influenza virus infection. Eur J Immunol. 4.Snauwaert,

31、S., et al., In vitro generation of mature, naive antigen-specific CD8 T cells with a single T-cell receptor by agonist selection. Leukemia. 5.Trifari, S., et al., MicroRNA-directed program of cytotoxic CD8+ T-cell differentiation. Proc Natl Acad Sci U S A. 110(46):18608-13. 6.Brown, A.S., et al., CD

32、8 subunit expression by plasmacytoid dendritic cells is variable, and does not define stable subsets. Mucosal Immunol. 7.Cho, J.H., et al., Unique Features of Naive CD8+ T Cell Activation by IL-2. J Immunol. 8.Meng, X.T., et al., Increased hepatic yolk precursor synthesis, secretion and facilitated

33、uptake by follicles are involved in the rejuvenation of reproductive performance of molted hens (Gallus gallus domesticus). Gen Comp Endocrinol. 194C:198-207. 9.Zelinskyy, G., T. Werner, and U. Dittmer, Natural regulatory T cells inhibit production of cytotoxic molecules in CD8+ T cells during low-l

34、evel Friend retrovirus infection. Retrovirology. 10(1):109. 10.Gonzalez-Serna, A., et al., CD8 TCR beta chain repertoire expansions and deletions are related with immunologic markers in HIV-1-infected patients during treatment interruption. J Clin Virol. 11. 黄金林;. 鸡 CD4 和 CD8 基因 cDNA 的克隆及其真核表达质粒的构建.

35、 中国畜牧兽医学会 2004 学术年会暨第五届全国畜牧兽医青年科技工作者学术研讨会,译. 中国畜牧兽医学会 2004 学 术年会暨第五届全国畜牧兽医青年科技工作者学术研讨会论文集(下册). :扬州大学生物科学与 技术学院;. 12. 徐琪;. 鸭 CD8 基因的克隆与表达调控初步分析. 见:陈国宏;,主编. 特种经济动物饲养. ,2012. 13. 焦新安;. 鸡 CD4 和 CD8 分子研究进展. 动物医学进展. 2005. (04). 14. 谢国化;. 鸡 CD4、CD8 基因的克隆和原核表达. 见:李槿年;,主编. 预防兽医学. ,2006. 15. 汤承;. 荧光定量 RT-PCR 检测鸡 CD4、CD8 基因表达水平. 畜牧兽医学报. 2008. (06).

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1