生物化学硕士论文-18种鹭科鸟类(AvesArdeidae)反转座子CR1的初步研究.doc

上传人:小小飞 文档编号:3955612 上传时间:2019-10-11 格式:DOC 页数:90 大小:2.71MB
返回 下载 相关 举报
生物化学硕士论文-18种鹭科鸟类(AvesArdeidae)反转座子CR1的初步研究.doc_第1页
第1页 / 共90页
生物化学硕士论文-18种鹭科鸟类(AvesArdeidae)反转座子CR1的初步研究.doc_第2页
第2页 / 共90页
生物化学硕士论文-18种鹭科鸟类(AvesArdeidae)反转座子CR1的初步研究.doc_第3页
第3页 / 共90页
生物化学硕士论文-18种鹭科鸟类(AvesArdeidae)反转座子CR1的初步研究.doc_第4页
第4页 / 共90页
生物化学硕士论文-18种鹭科鸟类(AvesArdeidae)反转座子CR1的初步研究.doc_第5页
第5页 / 共90页
点击查看更多>>
资源描述

《生物化学硕士论文-18种鹭科鸟类(AvesArdeidae)反转座子CR1的初步研究.doc》由会员分享,可在线阅读,更多相关《生物化学硕士论文-18种鹭科鸟类(AvesArdeidae)反转座子CR1的初步研究.doc(90页珍藏版)》请在三一文库上搜索。

1、学校编码: 分类号 密级 学 号:21620071151909 UDC 硕 士 学 位 论 文18种鹭科鸟类(Aves:Ardeidae)反转座子CR1的初步研究An initial research of the CR1 elements from 18 ardeids (Aves: Ardeidae)*指导教师姓名:专 业 名 称: 生 物 化 学论文提交日期: 论文答辩时间: 学位授予日期: 答辩委员会主席:评 阅 人:厦门大学学位论文原创性声明本人呈交的学位论文是本人在导师指导下,独立完成的研究成果。本人在论文写作中参考其他个人或集体已经发表的研究成果,均在文中以适当方式明确标明,并符

2、合法律规范和厦门大学研究生学术活动规范(试行)。另外,该学位论文为( )课题(组)的研究成果,获得( )课题(组)经费或实验室的资助,在( )实验室完成。(请在以上括号内填写课题或课题组负责人或实验室名称,未有此项声明内容的,可以不作特别声明。)声明人(签名): 年 月 日厦门大学学位论文著作权使用声明本人同意厦门大学根据中华人民共和国学位条例暂行实施办法等规定保留和使用此学位论文,并向主管部门或其指定机构送交学位论文(包括纸质版和电子版),允许学位论文进入厦门大学图书馆及其数据库被查阅、借阅。本人同意厦门大学将学位论文加入全国博士、硕士学位论文共建单位数据库进行检索,将学位论文的标题和摘要汇

3、编出版,采用影印、缩印或者其它方式合理复制学位论文。本学位论文属于:( )1.经厦门大学保密委员会审查核定的保密学位论文,于 年 月 日解密,解密后适用上述授权。( )2.不保密,适用上述授权。(请在以上相应括号内打“”或填上相应内容。保密学位论文应是已经厦门大学保密委员会审定过的学位论文,未经厦门大学保密委员会审定的学位论文均为公开学位论文。此声明栏不填写的,默认为公开学位论文,均适用上述授权。) 声明人(签名):年 月 日目录摘要Abstract第一章 前言1.1鸟类基因组重复序列的研究进展1.1.1鸟类基因组中重复序列简介1.1.2长散在重复序列LINE1.1.3短散在重复序列SINE1

4、.1.4长末端散在重复序列LTR-retrotransposons1.1.5转座子DNA transposons1.2鸟类反转座子CR1的研究进展 1.2.1 CR1的早期研究1.2.2 CR1的结构1.2.3 CR1的增值模式及家族分类1.2.4 CR1的反转座机制1.2.5 CR1在鸟类及其它物种中的分布1.3 CR1在鸟类分子系统学研究中的应用 1.4反转座子和微卫星的关系1.5本研究的目的和意义 第二章 材料与方法2.1仪器与试剂2.1.1主要的仪器设备 2.1.2试剂2.2样品采集2.3实验方法2.3.1.DNA的提取2.3.2引物设计2.3.3PCR扩增和产物纯化 2.3.4克隆转

5、化和测序2.4数据处理与分析2.4.1鹭科鸟类反转座子CR1分析2.4.2鸟类反转座子CR1和微卫星之间的关系分析第三章 结果与分析3.1鹭科鸟类CR1家族的研究结果3.1.1鹭科鸟类CR1序列特征分析3.1.2 鹭科鸟类CR1亚家族分类3.1.3 鹭科鸟类CR1亚家族在18个物种中的分布3.1.4不同CR1亚家族进化年代分析3.2鸟类CR1和微卫星之间的关系研究结果3.2.1鹭科鸟类部分序列和微卫星之间的结构分析3.2.2数据库检索3.2.3鸟类CR1和微卫星的关系分析结果第四章 讨论4.1 CR1序列的富集方法4.2鹭科鸟类CR1序列结构特征4.3鹭科鸟类CR1亚家族分类、进化年代及在不同

6、物种中的分布4.4鸟类CR1和SSR之间的关系第五章 结论与展望5.1 结论5.2 展望参考文献致谢ContentsAbstract in ChineseAbstract in EnglishChapter 1 Introduction1.1 Progress of repetitive sequences research of avian genome1.1.1 The repetitive landscape of avian genome1.1.2 Long interspersed nuclear elements (LINEs)1.1.3 Short interspersed nu

7、clear elements (SINEs)1.1.4 Long terminal repeat retrotransposons (LTR-retroposons) 1.1.5 DNA transposons1.2 Progress of CR1 investigation1.2.1 The early study about CR11.2.2 The structure of CR11.2.3 The propagation model and subfamilies of CR11.2.4 The retrotansposition mechanism of CR11.2.5 The d

8、istribution of CR1 among animals1.3 Application and promise of CR1 methods in avian phylogenitic1.4 The microsatellite repeats and retrotransposons1.5 Aims of this study Chapter 2 Materials and Methods2.1 Instruments and reagents2.1.1 Instruments2.1.2 Reagents2.2 Samples2.3 Methods2.3.1 DNA extracti

9、on2.3.2 Primer design2.3.3 PCR amplify and product purification2.3.4 Clone and Sequencing2.4 Data processing and analysis2.4.1 Analysis of the Ardeidae CR1 sequence2.4.2 Analysis of association between CR1 and SSRChapter 3 Result and analysis3.1 Result of Ardeidae CR1 analysis 3.1.1 Sequence charact

10、eristics of Ardeidae CR13.1.2 Identification of subfamilies of Ardeidae CR13.1.3 The distribution of Ardeidae CR1 among 18 ardeids3.1.4 The evolutionary age of Ardeidae CR1 subfamilies3.2 Result of association between CR1 and SSR3.2.1 Several cases of Ardeidae SSR associated with CR13.2.2 Database s

11、earch results3.2.3 Relationship between CR1 and SSRChapter 4 Discussion4.1 The enrichment of CR1 sequences4.2 Characterstic of CR1 of Ardeidae4.3 Phylogenetic of Ardeidae CR1 4.4 Intimate association between CR1 and SSR Chapter 5 Conclusion and Perspective5.1 Conclusion5.2 Perspective RefferenceAckn

12、owledgements摘 要本研究主要分为两部分:第一部分研究了18种鹭科鸟类中CR1不同亚家族的系统进化,第二部分研究了鸟类CR1和微卫星之间的关系。第一部分通过数据库检索和PCR富集两种方法,在18种鹭科鸟类中一共分离到284条长度约为320bp的 CR1序列,包含ORF2的3末端267bp和3UTR的48-58bp。其中3UTR可以分为高变区和保守区两个区域,根据高变区的序列特征,鹭鸟的高变区共分为五种类型:Ard-1a,Ard-1b,Ard-2,Ard-3,Ard-4。分析Ard-1a和Ard-1b高变区的差异,结合已有的鸟类CR1家族数据,提出在高变区短片段的插入可能是该区域序列多

13、态性的一个产生机制。利用40个已有的CR1亚家族构建鸟类CR1亚家族间的系统进化关系,可将鸟类CR1分为5个世系:Clade1,Clade2,Clade3,Clade4以及Clade0,通过ORF2区段的序列分析,可以将鹭科鸟类的CR1分为4个亚家族:Ard-1,Ard-2,Ard-3,Ard-4,分别对应于鸟类CR1的前4个世系。利用Alucode分析诊断性碱基的原理,进一步将4个亚家族分为44个亚亚家族。借用原鸡的核基因中性突变率,计算出44个亚家族的进化年代大概在340至5240万年之间。在此基础上,参考各个亚亚家族在不同物种中的分布情况,筛选出13个对鹭科鸟类系统进化研究具有潜在价值的

14、亚亚家族。第二部分通过数据库检索的方法,在鸟类9个目18个科的物种中共得到170条与SSR有关联的CR1序列,其中在91条序列里SSR和CR1紧密相连(间隔0-18bp),另外79条序列里的SSR则位于CR1内部。分析这79条序列中CR1和SSR相毗邻的序列特征,一共可归为三种情况:第一种情况,CR1含有前微卫星序列,推测其直接参与SSR的成熟过程;第二种情况,CR1含有低复杂度的序列,推测其间接参与了SSR的生成;第三种情况,CR1不含有明显的和SSR相关的序列,这部分SSR的生成机制尚不清楚。 以CR1-B亚家族全长序列为参照序列,SSR位于CR1内部的79条序列一共可以定位到23个位点,

15、其中有27条属于CR1-X3_Pass亚家族的序列在同一位点(3UTR末端)生成五碱基重复单元的SSR,暗示CR1-X3_Pass家族的3UTR末端可能是一个SSR进化的热点区域。在余下的22个位点中,有10个位点发生两例或两例以上的SSR,另外12个位点各有一例SSR发生。其余的CR1家族是否可以作为SSR在基因组中的扩散媒介,还需要更多的数据加以阐明。基于已有的研究中显示的来源于转座元件的SSR会对结果分析产生一些负面影响,建议在鸟类中开发SSR位点时要检测其侧翼序列特征。关键词:鹭科鸟类;CR1;微卫星AbstractThe present study includes two part

16、s:in the first part, we investigated the structures and the phylogenetic relationships among the CR1 subfamilies of 18 ardeids; in the second part, we analysised the association between avian CR1 and SSR elements.284 CR1 fragments were isolated from 18 ardeids through database searching and PCR meth

17、od. The length of CR1 ranged in size from 315-325 bp which due to the different length of 3UTR. The hyper-variable domain and conserve domain of 3UTR are difined based on the sequences alignments. Our data suggested that there are 5 distinct groups of hyper-variable domain within the ardeids, namely

18、, Ard-1a, Ard-1b, Ard-2, Ard-3, Ard-4. In particular, the difference between 3UTR of Ard-1a and Ard-1b, combined with other previously described avian CR1 subfamilies, prompting speculation that short insertion mutations may be one of the evolutionaly mechanisms underlying the diversity of hyper-var

19、iable domain.Phylogenetic analysis of 40 previously described avian CR1 subfamilies indicated that 5 major CR1 clades (clade0 to clade4) may have been present in a common ancestor of most extant bird species. Base on ORF2 sequences, these ardeids CR1s could divided into 4 distince subfamilies (Ard-1

20、 to Ard-4) with each corresponding to CR1 clade1 to clade4. Using Alucode method, ardeids CR1s were further characterize into 44 subsubfamilies that share diagnostic nucleotides. The age of subsubfamilies range from 3.4 to 52.4 My were determined from the sequence divergence between every pair of su

21、b-subfamily members assuming a substitution rate of 3.610-9subtitutions/site/year calculated for chicken genome. Finally, 13 potential phylogenetically informative subsubfamilies were screened out according to the subsubfamily age and their distribution among 18 ardeids. 170 CR1s associated with SSR

22、 were identified through searching the database which representing 18 families in 9 avian orders. Among these target sequences, SSR were juxtaposed to CR1 in 91 instances with 0-18 bp gaps between them, while in other 79 instances, SSR were situated precisely in the CR1. A detailed examination of th

23、e 79 instances revealed that three types of association existed between CR1 and SSR: that CR1 harbored proto-microsatellite which may produce SSR directly; that CR1 harbored low complexity sequence which may participate in the production of SSR indirectly; that CR1 have no obvious characteristic inv

24、olved in the rise of SSR. Using CR1-B as a reference sequence, 79 SSRs that located in the CR1 internal sequence could binned to 23 sites. Specifically, 27 SSRs with ATTCT repeat motif or its variants are obviously arose from expansion of a proto-SSR within 3UTR of CR1-X3_Pass, indicating that this

25、site may be a hot spot for the rise of SSR. Among the rest of 22 sites, 10 sites have equal or greater than 2 SSRs, and 12 sites have only one SSR. Whether other CR1 subfamilies could act as proto-SSR or SSR generators need more data to elucidate. We suggest that all flanking sequences of SSR coming

26、 from library-screening process should be analysised before using them as polymorphism markers in avian study.Keywords: Ardeidae; CR1; SSR第一章 前言1.1 鸟类基因组重复序列的研究进展1.1.1 鸟类基因组中重复序列简介基因组中的重复序列也被称为“垃圾序列”(junk DNA)或者“自私因子”(selfish DNA),包括串联重复序列(short tandem repeats)以及各种类型的散在重复序列(interspersed repeats)1。散在

27、重复序列又称为转座因子(mobile elements),根据转座机制的不同可以分为两类:第一类以mRNA为中介,称为反转座子;第二类是直接以DNA的形式转座,称为转座子。反转座子可以根据是否含有长末端重复(LTR)分为两类:长末端反转座子(LTR-retrotransposons)以及非长末端反转座子(non-LTR-retrotransposons)。其中第二类根据其序列长度可以再细分为两类:短散在重复序列(SINE, Short Interspersed Nuclear Element)和长散在重复序列(LINE, Long Interspersed Nuclear Element)。不

28、同生物类群的基因组中重复序列所占的比例存在较大的差异。2004年测得的原鸡(Gallus gallus)基因组大小为1200 Mbp2,只占人类基因组大小的35%,老鼠基因组大小的45%。如此显著的差异很难从功能基因的数目方面得到解释,因为用不同的预测功能基因的方法得到的原鸡中功能基因的数目大概为20000-23000个,和哺乳动物并无显著差异。比较基因组学研究和重组动力学研究发现,基因组中重复序列的含量是造成这一差异的一个关键因素:哺乳类基因组中含有40%-50%的重复序列,而鸟类则只有10%3-5。Burt等6认为鸟类基因组中较少的重复序列有利于小染色体同源区域的配对。鸟类的染色体中多数为

29、小染色体(microchomosomes,0.5-2.5 m),只有少数几对为大染色体(macrochomosomes,3-6 m),如原鸡有33对小染色体7,而大染色体只有6对。小染色体普遍存在成对交叉的现象,有利于有丝分裂和减数分裂时小染色体之间的配对8。Hughes等9比较了原鸡和人类不同大小的染色体中重复序列的比例,发现在染色体长度相似的条件下,人类的染色体中重复序列比例远远高于原鸡的(图1-1),同时,原鸡染色体中所含的重复序列随着染色体长度的增加而增加;Wicker等5也报道了鸟类基因组中重复序列和蛋白编码基因的比例在大染色体中大于小染色体,这些都和Burt等的结论相一致。图1-1

30、 重复序列平均长度和所在染色体长度的关系(蓝色的点代表人类的染色体,红色的点代表原鸡的染色体)(Hughes等,2005)Fig.1-1 The average length of repeats as a function of chromosome length in human (blue dot) and chicken (red dot)1.1.2 长散在重复序列LINECR1原鸡的基因组研究结果表明,有9%的序列属于散在重复序列,其中数量最多的是一类称为CR1(Chicken Repeat 1)的非长末端反转座子,拷贝数达到20万个,占基因组中散在重复序列的80%以上(表1-1)。

31、完整的CR1全长有5-6 kb,但大多数的CR1都在5端发生不同程度的缺失,只剩 3端几百bp的序列。这暗示了CR1的3末端与其余的片段相比可能存在某种调节功能10。但也有学者指出冗余的3端可能仅仅是CR1转座过程过早结束(premature termination)的产物,由于5端编码与反转座相关的重要的酶,这些残缺的CR1在插入基因组位点时便不再有转座功能(dead-on-arrival)11。原鸡的基因组中只找到一个完整的具有编码功能的CR1,另外一些较长的CR1序列中普遍存在碱基突变或者插入缺失突变,使得编码区丧失功能。由于大多数CR1都是没有功能的,推测原鸡的基因组中可能已经不存在有

32、活性的CR12。另外,原鸡的基因组中存在多个不同的CR1家族,系统进化分析表明,大部分CR1在4500万年前曾到达一个活性的峰值,之后便逐渐沉默12,一些更为古老的CR1家族甚至在鸟类和爬行类分化之前就已经存在13, 14。表1-1 原鸡基因组中散在重复序列的类型、比例及其分布(International Chicken Genome Sequencing Consortium,2004)Tab 1-1 Composition of interspersed repeats in the chicken genomeRepeat typeCopy numberDensityOverall(%)

33、Macro(%)Micro(%)Z(%)Unassigned(%)CR1205,0006.47.43.210.48.0MIRs/LINE210,0000.10.10.10.10.1LTR elements12,0001.31.30.51.83.3DNA transposons13,0000.81.00.31.50.8Simple repeats12,0000.70.60.40.71.5Satellites2,0000.10.10.10.10.9Total254,0009.410.24.514.514.5原鸡基因组中具有编码功能的序列只有4%,除去10%左右的重复序列,还有超过85%的序列(20

34、0Mb)目前仍然没有得到充分的研究。基于反转座子的古老起源,推测在这未破解的序列中,有相当大的一部分也属于散在重复序列,由于它们在基因组当中经历了漫长的演化,已经很难通过序列比对来识别它们,因此已有的关于CR1的拷贝数的估计应该是保守的,实际数目或许要远远大于20万个15。通常认为重复序列不受选择压力的作用,因此它们可以在基因组中通过积累突变而产生高度的复杂区域,这些区域有可能是功能基因的起源之一5。另外,某些家族的成员之间的序列差异度很大,在暗示其古老起源的同时,也提示原鸡基因组当中较少的散在重复序列并不是由于基因组高频率的缺失造成的,更可能是重复序列在原鸡进化过程中逐渐沉默的结果2。1.1

35、.3 短散在重复序列SINESINE是与LINE密切相关的一类散在重复序列。它是基因组中的一种中度重复序列,长度在70-500bp之间16,在真核生物基因组中的拷贝数大约在103-105之间17,它已经在人类18、哺乳类19、两栖类20、鱼类21、真菌22和植物23等许多真核生物中发现。SINE的结构一般由三部分组成:5端的RNA相关区,这部分衍生于相应的7SLRNA、tRNA或者5SrRNA;中部的RNA非相关区,这部分变异很大,而且没有特征性的模式;3端的AT富含区,有时也称为LINE衍生区24,该区最显著的特征是含有丰富的AT,与LINE的3端尾部有很高的相似性。因为LINE编码的反转座

36、酶能无特异性的识别3端的AT富含区来介导LINE的反转座,所以在所有关于SINE的研究中,都把SINE的转座看作是与相应的LINE相关联的,SINE也因此被称为LINE的寄生因子25, 26。由于SINE和LINE的密切关联,理论上原鸡基因组中存在的大量的CR1暗示着大量相关的SINE的存在,但是在已测得的原鸡的基因组中并没有发现与CR1相关联的SINE,这被认为是与CR1编码的反转座酶的特异性有关2。如上所述,哺乳动物的L1(LINE-1)编码的反转座酶可以识别大量的富含AT尾巴的序列,而CR1编码的反转座酶高度特异的识别3端八碱基重复,因此该酶无法被其余的以Poly-A结尾的散在重复序列所

37、利用,是CR1自身转座专一性的酶。同样,由于L1和CR1各自编码的反转座酶的特异性不同,也导致相应基因组中假基因的数量差别:原鸡的基因组中只检测到51个由转座因子介导形成的假基因,而哺乳动物的这类假基因则多达15000个27。在原鸡的基因组中检测到的SINE(MIR和MIR3,分别与L2和L3相关联)都是古老且丧失活性的,研究表明这些SINE在鸟类和哺乳类分化之前就已经存在,但在不同的支系中它们的命运却显著不同:在哺乳动物中,这些古老的SINE逐渐被新生的SINE所掩盖甚至替代,而在鸟类中大多数都被完整的保留2, 12。1.1.4长末端散在重复序列LTR-retrotransposons这类重

38、复序列元件的典型特征是在中央编码区域的两侧带有很长的侧翼重复序列,这些侧翼序列通常较长(几百bp),并且含有反转座过程必须的一些调节因子(如启动子)28, 29。LTR-retrotransposons的结构和反转录病毒的结构很相似,通常认为它起源于反转录病毒。两者都含有gag和pol基因,前者编码病毒衣壳蛋白,后者编码反转座过程必须的酶,如反转录酶,核酸内切酶1。与其他的脊椎动物相类似,原鸡基因组中LTR-retrotransposons的数量要远远的小于non-LTR-retrotransposons。通过比较原鸡基因组中的classGGERVK10和class GGERVL的序列相似性后

39、发现它们各自家族成员之间的差异度只有3%,推测也许目前仍然处于活跃时期。在哺乳动物中,有一类和GGERVL相对应的重复序列,称为ERV-L30,研究表明这类元件有着古老的起源,因此推测原鸡当中的GGERVL和哺乳动物中的ERV-L有共同的祖先,并且在哺乳类和鸟类分化前就已定居在基因组中。但是这和观察到的GGERVL家族成员间的序列差异度是矛盾的,也许GGERVL和ERV-L是在鸟类和哺乳类各自进化过程中反转录病毒独立渗透的产物2。1.1.5 转座子DNA transposons与上述的几类反转座子显著不同的是,反转座子采用“copy and paste”的转座策略,而转座子的转座策略为“cut

40、 and paste”,即一个转座子从基因组中的某一位点将自身完整的切下,然后再插入到另一个新的位点31(图1-2)。图1-2 反转座子和转座子机制的区别(Nishihara等,2008)Fig 1-2. The difference between mechanisms of retroposons and transposons原鸡基因组中转座子DNA数目较少,相关的研究也不多,目前已发现的转座子都属于两个家族:Charlie12_GG(activator-like)和GGMAR(mariner-like)。推测在鸟类的进化过程中,有着和哺乳动物相类似的机制用于防御转座子对基因组的渗透。C

41、harlie12_GG和GGMAR各自的序列差异度都为16%,因此两者有可能有着共同的进化年龄。原鸡中分离出的一个Charlie12_GG和GGMAR的嵌合体也支持了上述的推测,在这个嵌合体当中,GGMAR插入到了Charlie12_GG中,并且伴随后者的转座在基因组当中扩散2。1.2 鸟类反转座子CR1的研究进展1.2.1 CR1的早期研究在上述的几类重复序列中,反转座子CR1家族的数量最为庞大,因此研究得也较为深入。 1981年OMalley课题组32首次报道了原鸡中这一类型的散在重复序列,并且命名为CR1(Chicken Repeat 1)。在他们的研究中,发现了CR1家族的两个成员,分

42、别为CR1U1a和CR1Ova,前一个位于原鸡U1 RNA基因上游2kb处,后一个位于原鸡卵清蛋白基因下游12kb处。通过比对发现这两条序列和人类的Alu家族以及老鼠的B1家族在部分区域有着高度相似性,据此推测CR1家族和Alu家族有共同的祖先,之后在哺乳动物和鸟类中独立进化。同时他们根据Alu序列的方向性也给CR1定了方向,在他们的报道中,两条CR1都指向邻近的基因,但这一现象是否具有普遍性,在当时实验结果中未得到证实(图1-2)。该报道中的另外一个重要发现是两条序列的侧翼有10-15 bp的重复序列,由此推测CR1家族是一类转座因子。重组动力学研究表明,CR1在原鸡基因组中的拷贝数大约为3

43、000-14000。在后续的几年里,OMalley课题组及其他研究小组对CR1进行了更深入的研究,包括探索其在基因组中的功能。1983年,OMalley等33在研究原鸡的卵清蛋白基因X和Y时,发现CR1可能参与X和Y基因两侧区域对DNase切割敏感性的转变,并且再次发现与功能基因相邻的CR1都指向功能基因(图1-2),他们认为CR1和相邻基因的相对位置可能和这种敏感性转变紧密相关; Olofsson等34研究了CR1在基因组中的分布,发现CR1在原鸡基因组中的分布并不均匀,大部分都集中在GC富集区; 1984年,OMalley课题组分离出一类能特异性结合CR1的蛋白,并且结合区正是CR1高度保

44、守的区域35;通过比较CR1序列和鸟类反转录病毒的相似性,他们推测CR1也是反转录病毒起源的一类反转座子,另外,他们再次发现新克隆出的CR1成员指向邻近的功能基因这一现象,这样的指向暗示着CR1可能通过改变染色质的空间结构来调节功能基因的表达36。图1-3 CR1序列和邻近基因的相对位置(Stumph,1984)Fig.1-3 Genomic locations of several CR1 sequences但1987年FH Van Schip等37报道的一个CR1成员不是指向邻近基因,而是远离邻近基因,这一现象对之前的观点提出了挑战,认为CR1虽然可能参与改变染色质的空间结构,但是并没有固

45、定的方向。同年OMalley课题组也发现,虽然在某些基因的DNase敏感性转变区有CR1存在,另外一些转变区并没有发现CR1,并且不是所有CR1所在的区域都存在敏感性转变的现象,CR1出现在敏感转变区可能可以强化这些区域的抗切割性能,这些发现揭示了CR1在基因组中的分布和功能的复杂性。Shapira等38还研究了CR1在鸡胚胎发育过程的m RNA 表达模式,他们认为CR1可以利用邻近基因的启动子,借助阅读框通读而让自身序列得以转录,但这些被转录的CR1都没有被翻译成相应的蛋白,并且这样的“搭车转录”对邻近基因的表达没有产生负面影响。由于CR1家族在基因组中庞大的数量及分布的不均,很难在其功能层

46、面进行有效的研究,于是更多的研究将重心返回到DNA序列结构上。Burch等39很幸运的发现一个能够阐明CR1结构的途径:他们分离出的卵黄生成素假基因(pseudo-VTG)的第二内含子中间有一个CR1插入,通过比较这个内含子和真基因内含子序列,得到一个清晰的CR1序列边界。和当时数据库中已有的CR1序列比对后,他们认为CR1的3末端是以两个八碱基重复序列结束,八碱基可以表达为通式:NATTCTRT(N=C、A、G、T,R=A、G)。由于3端的八碱基重复序列的高度保守性,使其有可能被作为反转录的起始位点介导整个CR1序列的反转座行为,最重要的是,这个CR1序列含有部分的ORF区域,提示CR1本身可能具有某些编码功能。Reitman等40在研究原鸡-球蛋白(globin)基因时,发现该基因簇中含有大量的CR1序列(占全序列的16%),并且这些CR1的3端八碱基重复数目并不是恒等于两个,变化范围在1-4个,他们

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1