二氢叶酸还原酶缺陷型中华仓鼠卵巢细胞偏爱密码子的研究.pdf

上传人:小小飞 文档编号:3698720 上传时间:2019-09-20 格式:PDF 页数:4 大小:416.65KB
返回 下载 相关 举报
二氢叶酸还原酶缺陷型中华仓鼠卵巢细胞偏爱密码子的研究.pdf_第1页
第1页 / 共4页
二氢叶酸还原酶缺陷型中华仓鼠卵巢细胞偏爱密码子的研究.pdf_第2页
第2页 / 共4页
二氢叶酸还原酶缺陷型中华仓鼠卵巢细胞偏爱密码子的研究.pdf_第3页
第3页 / 共4页
二氢叶酸还原酶缺陷型中华仓鼠卵巢细胞偏爱密码子的研究.pdf_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《二氢叶酸还原酶缺陷型中华仓鼠卵巢细胞偏爱密码子的研究.pdf》由会员分享,可在线阅读,更多相关《二氢叶酸还原酶缺陷型中华仓鼠卵巢细胞偏爱密码子的研究.pdf(4页珍藏版)》请在三一文库上搜索。

1、 2 6 6中华实验和临床病毒学杂志2 0 0 6 年9 月第2 0 卷第3 期J E x p C l i n V i ro l , S e p t e m b e r 2 0 0 6 , V o l 2 0 , N o . 3 . 论 著 . 二氢叶酸还原酶缺陷型中华仓鼠卵巢细胞 偏爱密码子的研究 王志云田淑芳王秀平王世峰李仁清楚雍烈阮力 摘要】 目的研究二氢叶酸还原酶缺陷型中华仓鼠卵巢细胞( C H O d h f r - ) 的偏爱密码子。方法 建立 C H O d h f r . 细胞高丰度 m R N A的。 D N A文库, 对该文库进行签定以获得合格的编码蛋白质的 c D N A

2、序列, 统计密码子使用频率并与C U T G数据库中的中华仓鼠比较, 同时对所获得的c D N A序列进 行对应统计分析。结果获得了5 0 个合格的C H O d h f r - 细胞高丰度蛋白的。 D N A序列, 与中华仓鼠密 码子使用频率比 较, 除了P ro , A r g 外, 其余氨基酸的最高使用频率的密码子在C H O d h fr - 细胞和中华仓 鼠中都相同。同时根据对应分析确定了能解释最多变量( 1 4 . 7 %) 的第一主成分, 确定了2 2 个同义密 码子为C H O d h f r . 细胞偏爱密码子。结论C H O d h f r - 细胞存在自身偏爱的密码子,

3、提示密码子的偏爱 性是不同哺乳动物细胞功能差异的因素之一, 也为外源基因在 C H O d h f r - 细胞中通过优化密码子而获 得高表达提供了新思路。 【 主题词】 四氢叶酸脱氢酶; 仓鼠属; 卵巢; D N A , 互补; 密码子 C o d o n u s a g e o f C h i n e s e h a m s t e r o v a r y c e l l s W A N G Z h i- y u n , T I A N S h u f a n g , W A N G X i u r p i n g , W A N G S h i- f e n g , L I R e r

4、o- q i n , C H U Y o n g - l i e , R U A N L i . X i a n J i a o t o n g U n i v e r s it y , X i a n 7 1 0 0 6 1 , C h i n a J A b s t r a c t ) O b j e c t i v e T o i n v e s ti g a t e t h e o p t i m a l c o d o n s o f d ih y d r o f o l a t e r e d u c t a s e ( d h f r ) m i n u s C h i n e

5、s e h a m s t e r o v a ry c e l l s ( C H O d h f r - ) . M e t h o d s A c D N A l i b r a ry o f C H O d h f r - c o n t a i n i n g h i g h a b u n d e n c e m R N A w a s c o n s t r u c t e d a n d p ro t e i n - c o d i n g s e q u e n c e s w e r e o b t a i n e d a f t e r i d e n t i f i c

6、 a t i o n a n d a n a l y s i s . C o d o n f re q u e n c e o f C H O d h f r - w a s c o m p a r e d w i t h t h a t o f C h i n e s e h a m s t e r i n C U T G d a t a b a s e . T h e n c o d o n u s a g e v a r i a t i o n a m o n g c D N A w a s i n v e s t i g a t e d u s i n g c o r r e s p

7、o n d e n c e a n a l y s i s ( C O A ) . R e s u l t s F i f t y q u a li f i e d c D N A s f r o m C H O d h f r - w e r e s e l e c t e d , w h i c h e n c o d e s p ro t e i n s o f h i g h a b u n d e n c e . C o m p a r i n g w i t h t h e c o d o n f r e q u e n c e o f C h i n e s e h a m s

8、t e r , t h e h i g h e s t f re q u e n c e o f s y n o n y m o u s c o d o n s f o r a m i n o a c i d s i n C H O d h f r - c e l l s w e r e t h e s a m e a s C h i n e s e h a m s t e r e x c e p t t h a t o f A r g a n d P r o . T h i s m e t h o d o f C O A i d e n t if i e s t h e f i r s t

9、m a i n f a c t o r w h i c h c a n a c c o u n t f o r t h e l a r g e s t f r a c t i o n s ( 1 4 . 7 % ) o f v a r i a t i o n a m o n g c D N A s . T w e n t y - t w o s y n o n y m o u s c o d o n s w e re i d e n t i f i e d a s t h e o p t i m a l c o d o n s o f C H O c e ll . C o n c l u s

10、i o n C H O d h f r - c e ll h a s i t s o w n o p t i m a l c o d o n s , i t i s s u g g e s t e d t h a t c o d o n b i a s i s o n e o f r e a s o n s f o r f u n c t i o n a l d i v e r s i t y o f d i ff e r e n t m a m m a l c e l l s a n d it i s a n e ff e c t i v e s t r a t a g y t o m o

11、d i f i c a t i o n o f t h e c o d o n u s a g e o f t h e f o re i g n g e n e a c c o r d i n g t o t h e o p t i m a l c o d o n s o f C H O d h f r - t o i n c r e a s e t h e p r o d u c t i o n o f f o r e i g n g e n e . K e y w o r d s T e tr a h y d ro f o l a t e d e h y d ro g e n a s e

12、; C r i c e t u l u s ;O v a ry ; D N A , c o m p l e m e n t a ry ; C o d o n 编码同一种氨基酸的几种密码子称为同义密码 于, 因此, 密码子具有高度简并性, 而且对于绝大部 分氨基酸, 不同种属甚至哺乳动物的不同组织表现 出 不同的密码子偏向性 。许多实验证实, 尽量使 用大肠埃希菌和啤酒酵母的偏爱密码子, 可以提高 外源基因的表达水平 2 。二氢叶酸还原酶缺陷型中 基金项目: “ 八六三” 高科技发展计划资助项目( 8 6 3 - 0 2 - 0 7 - 0 2 - 0 1 , 8 6 3 - 1 0 2 - 0

13、 7 - 0 1 - 0 2 ) ; 国家杰出青年基金资助课题( 3 9 5 2 5 0 0 1 ) 作者单位: 7 1 0 0 6 1 , 西安交通大学( 王志云、 楚雍烈) ; 中国疾病预 防控制中心病毒病预防控制所( 田淑芳、 王秀平、 王世峰、 李仁清、 阮 力) 华仓鼠卵巢细胞( C H O d h f r - ) 是野型 C H O传代细胞 P r o - K 1 经多次诱变建立的二氢叶酸还原酶双基因缺 失的营养缺陷型细胞, 具有特异性 , 是用于真核基 因表达最成功的宿主细胞之一, 但其产量较低, 一般 仅占细胞总蛋白的2 . 5 % 1 4 1 , 因此寻找C H O d h

14、f r 一 细 胞的偏爱密码子, 在外源基因氨基酸顺序不变情况 下, 尽量使用C H O d h f r 一 细胞的偏爱密码子来提高表 达量是值得探索的一条新途径, 而且有益于揭示密 码子使用偏爱性在不同哺乳动物细胞中的作用。本 研究通过建立C H O d h f r , 细胞高丰度 m R N A的c D N A 文库, 得到一批编码蛋白的。 D N A序列; 本研究运用 对应分析对。 D N A序列进行处理, 分析 C H O d h f r , 细 中华实验和临床病毒学杂志2 0 0 6 年9 月第2 0 卷第3 期 C h i n e s e i E x p C l i n V i r

15、o l I S e p t e m b e r 2 0 0 6 , V o l 2 0 , N o . 3 胞密码子的使用规律。 1 材料和方法 1 . 1 细胞株C H O d h f r 一 细胞株是野型C H O传代细胞 P r o - K l 经多次物理化学诱变建立的二氢叶酸还原酶 双基因缺失的营养缺陷型细胞, 由哥伦比亚大学 C h a s i n 教授惠赠。 1 . 2 质粒载体和菌株 p U C 1 8 是用于c D N A的克隆 和测序载体。E. c o l i D H 5 a 为宿主菌。 1 . 3 c D N A文库的构建 利用美国P ro m e g a 公司的 总R N

16、 A提取试剂盒 R N A g e n t s r T o t a l R N A I s o l a a t i o n S y s t e m从生长旺盛 8 0 %一 9 0 %成片生长的 C H O d h f r - 细胞中提取总 R N A , P 1 1 y A t r a c e r m R N A I s o l a t i o n S y s t e m s II 试剂盒用来分离 m R N A , 美国G i b c o B R L 公司 c D N A高效合成试剂盒 S u p e r S c r i p t T M C h o i c e S y s t e m f o

17、 r c D N A S y n t h e s i s 合成c D N A , c D N A与p U C 1 8 质粒载体连接, 转化宿主菌 E . c o l i D H 5 u , 建立。 D N A 文库。 1 . 4 工具酶和主要试剂实验用限制性内切酶购 自 华美生物工程公司, 美国P ro m e g a 和B i o l a b , 公司。 R N a s i n 为P r o m e g a 公司产品。 1 . 5 c D N A序列分析和密码子分析c D N A序列的 密码子 G+C含量, 翻译分析和阅读框架预测等由 日 立公司提供的 D N A S I S ( V E R

18、 7 . 0 ) 软件, D N A和蛋 白质的同源性比较使用 B l a s t 软件与 N C B I 等数据库 比 较。密码子分析由英国诺丁汉大学P a u l M S h a r p 实验室提供的 C o d o n W v e r s i o n 1 . 3 软件分析。其他 有关统计学由E p i i n f o 2 0 0 0 软件进行。 1 . 6 c D N A序列偏向性指标f s l 1 . 6 . 1 R S C U ( R e l a t iv e s y n o n y m o u s c o d o n u s a g e ) 相对 同义密码子使用频率: 某种氨基酸一

19、种密码子的实 际频率与所有同义密码子平均使用时期望频率之 比, R S C U接近 1 表示同义密码子的使用缺乏偏向 性。 1 . 6 . 2 G C 3 s : 一个基因中所有密码子第三同义位置 中G + C 的含量( 除了只有一种密码子的M e t , T r p 和 终止密码子) , 大小从0 到 1 o G C 3 s 数值越大, 反映 了基因碱基组成越倾向于向G / C方向突变。 1 . 6 . 3 N c ( E f f e c t i v e n u m b e r o f c o d o n s ) 密码子的有效 数: 这是一种总的偏向性指标: F 反映了一个基因中 密码子使用

20、种类的多少。N c 值在 2 0和 6 1 之间。 当一个极度偏向的基因每种氨基酸只用一种密码 子, 则 N 。 值为2 0 ; 当一个无偏向性的基因以相同概 率使用全部6 1 种同义密码子, 则 N c 值为6 0 0 1 . 6 . 4 F o p ( F r e q u e n c y o f o p t i m a l c o d o n s f o r a p p l ic a t i o n i n t h e g e n e ) 一个基因中偏爱密码子使用频率: 这是 一种具有种属特异性的偏向性指标, 针对某些由于 翻译偏向而导致使用一套偏爱密码子的种属。F o p 是偏爱密码子出

21、现总数与 1 8 种氨基酸密码子出现 总数之比。F o p 值在。 与 1 之间。 2 结果 2 . 1 C H O d h f r . 细胞 c D N A文库的构建应用从 5 x1 0 7 生长旺盛 C H O d h f r 一 细胞中提取总 R N A , 获得 总R N A 1 2 7 6 p g , A 2 6, / A 2 3o = 1 . 7 6 , A 2 6 , / A 2 1 = 1 . 5 1 , 表 明提取的总 R N A无蛋白质和硫氰酸呱吮的污染。 采用P r o m e g a 公司的磁性球珠分离m R N A , 1 0 0 0 p .g 总R N A共获得1

22、0 . 8 u g m R N A , 其A 2 O / A s s , = 2 . 2 5 , A 2, / A 2 1 二 1 . 9 3 , 表明m R N A质量良 好, 无蛋白质和 盐离子的污染。同时选用O li g o d ( T ) 和随机引物两 种引物, 双链 。 D N A平末端与 E c o R I 衔接头连接, 载 体选用 E c o R I 酶切p U C 1 8 , 两者相连, 转化 E . c o l i D H 5 a 后建成中华仓鼠细胞的 c D N A文库。从连接 产物中 取出1 川, 稀释5 0 倍, 从5 尽转化宿主菌, 在 含有I P T G和X - g

23、 a l 的平板中生长, 蓝斑: 5 个, 白斑 2 8 9 个, 重组插人率为9 8 . 2 %, 独立克隆数为 2 . 9 4 x 1 护。随即挑取白斑, 以 E c o R I 酶切签定插人片段的 大小, 插入片段为 1 一 2 k b . 2 . 2 C H O d h f r . 细胞 c D N A序列阅读框架分析随 机挑取 1 5 0 个克隆, 每个克隆测一个反应平均长度 为5 5 0 b y 。通过B L A S T 程序, 去除假基因、 t R N A和 r R N A 、 重复序列基因、 非编码区核昔酸、 重复的 c D N A序列等, 最后剩下 5 0个合格的编码蛋白质

24、c D N A序列。以。 D N A序列为查询序列, 通过 B L A S T 程序在 n r G e n B a n k 数据库搜索, 得到同c D N A序列 核昔酸匹配度最高的序列, 当其阅读框架和D N A S I S 确定的c D N A阅读框架相吻合时为此 c D N A序列的 合理开放阅读框架。 2 . 3 C H O d h f r 细胞与中华仓鼠( C R U ) 密码子使用 频率比较1 9 8 6 年建立数据库 C U T G ( c o d o n u s a g e t a b u l a t e d f r o m G e n B a n k ) 中, 选择某物种已知

25、所有编 码蛋白质和核昔酸序列, 可统计出密码子使用频率。 到1 9 9 9年为止, C U T G包括了 7 4 3 4个物种, 包括 C R U 。本研究中所分析的C H O d h f r - 细胞是经过多次 诱变, 染色体发生畸变的具有高度特异性的C H O细 胞, 因此有必要对 C H O d h f r , 细胞密码子使用频率与 中华实验和临床病毒学杂志2 0 0 6 年9 月第2 0 卷第3 期C h i n e s e IC l i n V i ro l , S e p t e m b e r 2 0 0 6 , V o l 2 0 , N o . 3 C U T G数据库中已有

26、 C R U密码子使用频率做比较。 经过比较可以 看出除了P ro , A r g , P h e 外, 其余氨 基酸最高使用频率的密码子在C H O d h f r 一 和C R U中 都相同, 但是这些差别经过统计学检验才有意义。 用卡方统计法进行两个率的比较, 发现 P h e的两个 同义密码子T I T和T T C在 C H O和 C R U中的使用频 率差异的概率 P 0 . 0 5 , 说明C H O和 C R U在使用 P h e 同义密码子 T 1 I , 和 T T C的频率差异无统计学意 义。C H O中 P ro最高使用频率密码子为 C C T , 而 C R U 为C

27、C C ; C H O中A r g 最高使用频率的密码子为 A G A , 而C R U为C G G 。卡方检验P r o 和A r g 最高使 用频率密码子在 C H O和 C R U中的差异概率都为 0 . 0 5 P 0 . 0 1 , 提示这些差异均有统计学意义。最 终结果说明只有P r o , A r g 最高使用频率的密码子在 C H O d h f r , 细胞和中华仓鼠中不同。上述方法简单易 行, 能初步看出 C H O与 C R U密码子使用方式存在 不同, 但如果直接以总密码子使用频率确定 C H O细 胞偏爱密码子, 则不可避免地存在其不严密性, 必须 考虑到基因异质性对

28、物种密码子使用方式的影响。 2 . 4 C H O d h f r . 细胞基因异质性的分析基因间存 在异质性是指一个物种的不同基因间密码子选择方 式不同, 体现为偏向性不同, 即每个基因中各氨基酸 的每种相对同义密码子使用值( R S C U ) 不同。 2 . 4 . 1 对应分析确定密码子使用方式的第一主成 分: 由于6 4 个密码子三个终止密码子, 氨基酸 M e t , T y r 只有1 个密码子, 所以共有5 9 种R S C U 作为基因 异质性众多单项指标, 仅用其中任意一个指标来对 基因的异质性分析都是片面的, 必须利用对应分析 ( c o r r e s p o n d

29、e n c e a n a l y s i s ) 找出能包含最多原始信息量 的 综合指标第一主成分概括原来5 9 种 R S C U众多 指标所包含的信息。利用 C o n d o n W程序对 C H O d h f r , 细胞的5 1 个 c D N A序列进行分析, 产生了能解 释最多变量的第一主成分, 相对惯量为 1 4 . 7 , 说明 第一主成分( 或第一轴) 能解释1 4 . 7 %的变量。 2 . 4 . 2 通过基因的偏向指数分析异质性: 基因的偏 向 性指数具体有G C 3 s , N c , F o p 。将 C H O d h f r - 细胞 5 0 c D N

30、A 序列按第一主成分排列, 同时显示每个 c D N A 序列的 偏向 指数, 来研究它们的异质性5 1 0 从表 1 以看出, 异质性强的基因 G C 3 s 在0 . 3 - 0 . 4 之间, 而异质性弱的基因 G C 3 s 在 0 . 7 一 0 . 8 之 间, G C 3 s 从 0 . 3 1 5 逐渐增加到0 . 8 0 6 。将第一主成 分作为排列基因异质性强弱的首要指标, 基因排列 位置与G C 3 s 的相关系数; = 0 . 8 8 5 , 与F o p 的相关系 表1 C H O d h f r . 基因偏向指数 T a b . l I n d e x o f c

31、o d o n b i a s i n C HO d h f r - c e ll c D N A 产物名称 N a m e o f c D N A p r o d u c t GC3 s 862539662343334325l7839878933923085l783874379757犯 39凭6154.525751板55.49.51556l46.615756.6l425l.47.4360.47.36525744.6156.57 h e a t s h o c k 7 0 x 1 0 3 p r o t e i n 0 . 4 2 4 z i n c f i n g e r p ro t e

32、i n 0 . 4 2 4 d U T P a s e 0 . 4 0 5 n u c l e a r p ro t e i n 2 2 0 ( N p 2 2 0 ) 0 . 4 1 8 m i t o C H O d h f r - n d r i a l p r o c e s s i n g p e p t i d a s e 0 . 4 2 2 R I K E N c D N A 4 9 3 0 5 3 0 . 4 H a m s t e r a s p a r a g i n e s y n t h e t a s 0 . 4 1 1 P ro t e i n p h o s p

33、h a t a s e 0 . 4 1 9 H o m o s a p i e n s K I A A 0 2 6 6 g e n e p r o d u c t 0 . 3 2 2 c e r e b e ll u m 0 . 5 1 7 r i b o s o m a l p ro t e i n S 6 0 . 4 4 4 v a c u o l a r A T P a s e s u b u n i t D 0 . 4 5 8 v i n c u l i n 0 . 3 6 1 v i me n t i n 0 . 4 9 4 C a rt i l a g e p a i r e d

34、- c l a s s h o m e o p ro t e i n 1 0 . 4 4 1 U n k n o w n 0 . 4 2 6 B AB 2 4 2 1 0. 1 0 . 4 4 8 a l d o- k e t o r e d u c t a s e f a m i l y 0 . 3 8 1 E F - 1 a l p h a 0 . 5 7 6 R I K E N c D N A 2 5 1 0 0 0 8 H 0 7 0 . 5 2 6 m e m b e r R A S o n c o g e n e f a m 诉0 . 3 5 5 R A B / R i p p r

35、o t e i n 0 . 4 1 4 i n o s i n e - 5 - m o n o p h o s p h a t e d e h y d ro g e n a s e 0 . 4 5 3 C a t h e p s i n L 0 . 4 3 5 c l o n e MG C : 3 0 2 9 4 0 . 2 8 9 s e m a p h o r i n C 0 . 4 2 8 R I K E N c D N A 2 6 1 0 3 0 1 13 0 6 g e n e 0 . 4 5 9 R I K E N c D N A 0 6 1 0 0 3 3 L 0 3 g e n

36、 e 0 . 4 2 8 H y p o t h e t i c a l p r o t e i n F I J 2 0 2 7 7 0 . 4 1 4 h y p o t h e t i c a l p ro t e i n F I J 2 0 2 7 8 0 . 4 3 5 P a d r e n e r g i c r e c e p t o r k i n a s e 0 . 4 5 4 P a d r e n e r g i c r e c e p t o r k i n a s e 0 . 4 4 7 RI K E N c DN A 2 4 1 0 0 0 2 0 . 4 4 8

37、R I K E N c l o n e : 2 6 1 0 0 1 2 0 2 2 0 . 5 1 7 v i me n t i n 0 . 5 0 3 U n k o w n 0 . 5 1 4 R i b o s o m a l p r o t e i n 5 1 0 0 . 4 4 3 P C T A I R E - m o t i f p ro t e i n k i n a s e 0 . 5 1 4 p r o t e i n p h o s p h a t a s e 4 0 . 5 0 8 P C T A I R E - m o t i f p ro t e i n k i n

38、 a s e 1 0 . 4 4 9 灿o s p h a t a s e 4 0 . 5 1 5 t r a n s l a t i o n i n i t i a t i o n f a c t o r 3 0 . 4 7 4 c l o n e I MA G E: 3 6 0 1 0 6 7 0 . 4 6 4 n u c l e a r d i s t r i b u t i o n g e n e C 0 . 4 9 6 灿o s p h o o l i g o s a c c h a r i d e - p ro t e i n 0 . 4 9 4 a c y l - C o A

39、h y d ro l a s e 0 . 4 6 t r a n s m e m b r a n e 6 s u p e r f a m i l y 0 . 4 9 7 U n k n o w n 0 . 4 4 R I K E N c l o n e : 1 7 0 0 1 2 7 1 3 0 4 0 . 5 3 7 c a t h e p s i n Z 0 . 6 1 2 5 7. 6 1 0. 3 6 4 0. 3 1 5 0. 3 3 6 0 . 3 5 2 0. 3 6 9 0. 4 6 7 0. 4 3 2 0. 5 4 7 0. 5 2 6 0. 4 7 1 0. 4 4 4

40、0. 4 0 5 0. 4 8 4 0. 5 41 0. 4 9 0. 4 5 9 0. 5 2 9 0. 4 8 5 0. 5 1 6 0. 5 41 0. 6 1 7 0. 3 2 8 0. 5 41 0. 5 9 0. 5 5 3 0. 5 9 9 0. 5 6 8 0. 6 0 8 0. 5 6 6 0. 5 6 5 0. 5 0 2 0. 5 8 6 0. 6 0. 5 8 5 0. 5 8 3 0. 5 8 3 0. 5 5 0. 5 9 9 0. 6 6 9 0 . 6 0 1 0. 61 4 0 . 6 9 9 0 . 7 2 5 0. 6 5 9 0. 6 8 8 0. 7

41、4 1 0. 7 2 6 0. 7 3 3 0. 8 0 6 0. 8 0 3 82162740871%36 5044494756465444 3 7. 5 5 69531984肠65589926 565247肠4644354139 注: F o p : 一个基因中偏爱密码子使用频率; N c : 密码子有效数; G C 3 s : 密码子第三同义位置中G + C的含量 N o t e s : F o p = F r e q u e n c y o f u s e o f o p t i m a l c o d o n i n a g e n e . N c 二 o f e ff e c t

42、i v e c -d- . G C 3 s =C o n t e n t o f G+C a t t h e 3 r d i s o - s e n s e c o d o n. N u mb e r l o c u s o f 中华实验和临床病毒学杂志2 0 0 6 年9 月第2 0 卷第3 期C h i n e s e J E x p C l i n V i r o l , S e p t e m b e r 2 0 0 6 , V o l 2 0 , N o . 3 数 r = 0 . 4 9 8 , 与N 。 的相关系数 r 二一 0 . 3 8 1 。这些结 果说明C H O d h

43、 f r 一 细胞基因密码子使用具有明显异 质性, 其使用方式与G C 3 s 高度相关, 利用这个结果 进一步分析 C H O d h f r , 细胞偏爱密码子的。 2 . 4 . 3 根据基因异质性确定 C H O d h f r - 细胞的偏爱 密码子: C H O d h f r 一 细胞密码子使用方式与G C 3 s 高度 相关, 所以基因根据第一主成分排列的位置代表了 基因偏向性的强弱, 偏向性高的的基因G C 3 s 数值相 应较高, 低偏向性基因的 G C 3 s 数值较低, 取位于两 端的基因( 一般为 1 0 %的基因) 进行双测卡方检验 ( tw o w a y C h

44、 i - s q u a r e c o n t i n g e n c y t e s t ) , 比较两端基因 的密码子使用方式, 确定在两端基因有统计学差别 的同义密码子为C H O d h f r 一 细胞偏爱密码子 L e n C U C C U G *; I l e A U C; V a l G U C * G U G , ; T y r U A C ; H i s : C A C ;G l n C A G; A s n A A C ; 场s A A G; A s p G A C; G l u G A G *; S e r U C C U C G * A G C ; P ro C

45、C C * C C G ; T h r A C C ; A l a C C G *; C y s U G C *; A r g C G C ; G l y G G C * B e r n a r d i 等提出的“ 等容区” ( i s o c h o r e ) 理论可以 用来解释这个现象9 1 。 恒温动物基因组是由一些嵌 合体组成的, 这些嵌合体是 G+C含量相似的长 D N A 片段, 称这些长 D N A片段为“ 等容区” , 分为 G+ C 含量低( 3 0 %一 4 5 %) 的L 等容区和 G+C含量 高( 4 5 %一 6 0 %) 的H等容区。人类基因组基因的分 布并不是统

46、一的, 基因在等容区H的密度是 L区的 2 0 倍, 称为“ 基因组核心” , L 组成“ 空区” , 大约 5 4 % 人类基因位于占基因组 1 2 %的基因组核心中, 剩余 4 6 %位于占基因组 8 8 %的空区中。大部分位于基 因组核心的基因( 包括多数管家基因) 都和C p G岛 相连, 转录活跃, 对应于开放的染色质结构一 R带, 具 有活跃的重组功能和早期复制。相反, G+ C含量低 的等容区位于染色质结构紧密的 G带, 它包含的基 因大部分转录是组织特异性, 或者是发育调节转录 的基因。B e r n a r d i 的研究发现位于 G+C含量不同 等容区的基因其G C 3 s

47、 不同, 导致了密码子使用具有 强烈偏向性。 本研究阐明了C H O d h f r 一 细胞密码子使用特点, 提示密码子使用的偏向性, 可能是哺乳动物细胞间 功能差异的重要因素, 为从偏爱密码子角度来探索 不同外源基因在 C H O d h f r - 细胞表达水平提供新思 路 。 参考文献 3 讨论 C o n d o n W软件是专门为简化密码子使用方式的 多元分析而设计的软件包, 将本实验所得到的5 1 个 c D N A 序列作为输人序列, 结果发现基因在第一主成 分垂直轴的位置和 G C 3 s 密切相关, 说明C H O d h f r - 细胞密码子选择方式与 G C 3 s

48、高度相关。偏向性高 的基因 G C 3 s 数值相应较高, 低偏向性基因的 G C 3 s 数值较低, 所以基因在第一垂直轴上排列的位置代 表了基因偏向性的强弱, 取轴两端的基因( 一般为 1 0 %的基因) 进行双测卡方检验7 ,8 , 确定在两端基 因有统计学差别的同义密码子为 C H O d h f r - 细胞偏 爱密码子, 发现 C H O d h f r 一 细胞的2 3 个偏爱密码子 全部是以G或 C结尾的密码子。这个结果对指导 外源基因在 C H O d h f r 一 细胞中通过优化密码子而获 得高表达是有理论意义的。 1 N e w g a r d C B , N a k a n

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1