第二第四章内容.doc

上传人:本田雅阁 文档编号:2718074 上传时间:2019-05-08 格式:DOC 页数:21 大小:653.04KB
返回 下载 相关 举报
第二第四章内容.doc_第1页
第1页 / 共21页
第二第四章内容.doc_第2页
第2页 / 共21页
第二第四章内容.doc_第3页
第3页 / 共21页
第二第四章内容.doc_第4页
第4页 / 共21页
第二第四章内容.doc_第5页
第5页 / 共21页
点击查看更多>>
资源描述

《第二第四章内容.doc》由会员分享,可在线阅读,更多相关《第二第四章内容.doc(21页珍藏版)》请在三一文库上搜索。

1、第二章遗传方差组分数量遗传学以研究变异为核心,因为只有以变异的形式才能系统地说明遗传问题。那么,研究变异的基本思想,就是把群体的总变异剖分为由不同原因引起的组分,也正是因为组分的相对大小不同决定着群体的遗传特性(尤其是亲属间相似程度)和利用价值。变异组分通常用方差表示,那么,在数量遗传分析中要用到两类方差成分,一类是实测方差成分,用2表示。例如,把个体按家系分组,方差分析时,把实测总方差剖分为组间方差2D和组内方差2W;另一类为原因(或理论)方差成分,用V表示,如:表型方差VP可归因为不同的方差成分,即VP=VA+VD+VI+VE其中VA为加性方差,VD为显性方差,VI为上位性方差,VE为环境

2、方差。VA:由基因累加效应引起的遗传变异VD:由等位基因互作引起的遗传变异VI:由非等位基因互作引起的遗传变异那么,现就遗传群体内方差和协方差的理论组成做一介绍。第一节随机交配平衡群体的方差一、表型方差的组分已知P=G+E,对此线性函数求方差,并考虑到作物与环境的互作,可得到:VP=VG+VE+2CoVGE+VGE为其因型与环境互作的方差)两个变数的协方差等于其离均差乘积和的平均:CoVXY=那么,CoVGE(协方差)可以通过良好的设计和试验实施加以控制,VEG(基因型与环境互作的方差)是作物品种利用中很有意义的变异来源。如果不考虑CoVGE和VGE,就可简化为:VP=VG+VE二、遗传方差的

3、组分已知G=A+D+I,对此线性函数求方差,就可获得:VG=VA+VD+VI那么VG、VA、VD和VI各表示遗传方差、加性遗传方差、显性遗传方差和上位性遗传方差。由于CoVAI和CoVDI均为0,故遗传方差中不包括这些协方差。1、加性遗传方差加性遗传方差VA(简称加性方差)是重要的方差成分,因为它是育种值不同引起的方差,也就是由基因的平均效应所引起的方差(这是VA的实质),因而是亲属间相似的主要原因,是群体遗传特性的主要决定因子,也是群体对选择产生响应的主要决定因子(这是VA的重要性)。VA是根据群体实测值比较容易估计的唯一成分。因此,根据基因型频率和育种值,可以算出单座位一对等位基因的加性方

4、差。方差一各变量距均值的差的平方和的平均数VA =f(A-)2/f=fA2=p2(2qa)2+2pq(q-p)2a2+q2(-2pa)2=2pqa2总基因型频率,育种值属于个体的加性效应,在处于平衡状态的群体中,育种值的平均为零。下例,=0育种值一个个体的育种值就是它所携带的基因平均效应的总和。当p=q=1/2时,而d=0, VA =a2a表示单位座位时的两个等位基因A1和A2的加性效应值,p,q分别表示两个等位基因(A1和A2)的基因频率。2、显性遗传方差显性遗传方差VD(简称显性方差)是由座位内等位基因间互作效应所引起的方差。VD=f(D-)2/f=fD2=p2(2dpq)2+2pq(2d

5、pq)2+q2(-2dpq)2=4d2q2p2当p=q=1/2时,VD=d2当多座位时,VA和VD分别为各座位加性方差和显性方差之和。即:VA =2pqa2, VD=4p2q2d由以上可以看出,群体的遗传方差及其组分都依赖于群体的基因频率,任何方差成分的估值都只对特定群体有效。3、互作方差如果座位间存在互作偏差,则总遗传方差中除了VA和VD外,还应该包括互作方差VI。互作方差VI是座位间的总互作方差,如果分别考虑到育种值和显性偏差参与互作,那么,两座位间的互作方差VI还可进一步剖分为两座位育种值间互作方差VAA,一个座位的育种值与另一座位显性偏差间的互作方差VAD以及两座位显性偏差间的互作方差

6、VDD三部分。即:VG= VA +VD+VI三、环境方差环境方差主要由土壤和气候因素造成,但是,母性效应和发育上的差异也会造成个体间的非遗传差异。一个群体内的环境差异是误并的主要来原。对于一个随机交配的平衡群体来说,若不考虑基因型与环境互作的话,那么,VGE=0。第二节群体的方差和协方差一、自产世代群体的方差1、不分离世代、P1、P2和F1两纯系亲本和杂种F1群体,各只有一种基因型,称为不分离世代。群体内无遗传变异为同质群体。那么,在同质群体内VG=0,VP=VE。因此,可以用(VP1+VP2+VF1)、(VP1+VP2)或VP1+VP2+2VF1)或VF1等来估算环境方差VE=VP表现型方差

7、。当不分离世代与分离世代处于同一不分离世代的方差作为分离世代的环境方差VE的估值。2、分离世代分离世代的表型方差等于其遗传方差与环境方差之和,即VP=VG+VE。而遗传方差的计算可以根据表13列出的各世代基因型频率和计算世代均值的公式来算出来。(1)F2代的方差遗传方差:单座位时,VGF2=a2+d2+a2-(d)2=a2+a2多座位时,VGF2=a2+d2若令Va =a2Vd=d2则:VGF2=Va+VD注意:Va和Vd与加性方差VA和显性方差VD的含义不同,由VA和VD的定义,可知,当p=q=,VA=VA,VD= VdF2的环境方差由可下式估计:VEF2=(VP1+VP2+2VF1) 于是

8、,F2代的表型方差为:VPF2=VGF2+VEF2(2)F3代的方差遗传方差:VGF3=a2+d2环境方差:VEF3=VP1+VF1+VP2表型方差:VPF3=VGF3+VEF3(3)自交世代方差的一般式:Ft代总遗传方差VGFt=a2+d2探讨杂种优势产生的原因时:如果杂种优势不是由显性基因的分散所引起,那么就有可能产生一个真实的遗传品系,使得全部显性基因集中在一起,该真实遗传品系就会与DD(1 DD)F1相同或相似,而且自交不会分离,也就是说,杂种优势可以得到固定,从而减少繁殖和制种的麻烦。Ft代环境方差VEF2=(VP1+VP2)+VF1Ft代表型方差VPFt=VGFt+VEFt随着自交

9、次数增多,加性遗传不断增大,显性遗传方差不断减少。二、自交世代间协方差世代t-1和世代t的q级协方差为:CoVqF(t-1)(t)=( )qa2+()2t-q-2d2例如:F2单标与F3系统均值间的协方差为:CoV1F(2)(3)= a2+d2 (q=1,t=3)源于F1配子分离的F3系统均值与F4系统均值间协方差为:CoV1F(3)(4)= a2+d2 (q=1,t=4)源于F2配子分离的F3单株与F4系统均值的协方差为:CoV2F(3)(4)=a2+d2 (q=2,t-4)三、回交世代的方差设有单座位二等位基因,F1向大值亲本(A1A1)和小值亲本(A2A2)回交一次,分别产生B1L和B1

10、S世代,其世代方差如下:遗传方差:VGBL=a2+d2- (a+d)2=a2-ad+d2VGB1=a2+d2- (d-a)2=a2+ad+d2环境方差:VEB1L=VF1+VP1VEB2S=VF1+VP2VEB1L+VEB1S=2VEF2如果令VA=a2, Vd=d2(单座位时),VA=VA,VD= Vd或VA=a2, Vd=d2(多座位时)则VGBL+VGB1=VA+Vd习惯上,把B1LB1S称为B1和B2世代,则VGB1L和VGB1S分别称为VGB1和VGB2,VEB1L和VEB1S为VEB1和VEB2。第三节 亲属间相似与遗传协方差一、亲属间相似亲属相相似是数量性状所表现的基本遗传现象之

11、一,是人类从事遗传和育种工作所利用的一种重要的遗传现象(另一种是近衰退和杂种优势),如性状的鉴定和选择。亲属间相似程度提供了估算加性遗传方差的方式,而加性方差的比例对于确定育种的最适方法起决作用。因而,理解亲属间相似的原因对于数量性状的实际改良和育种应用十分重要。反映亲属间相似的统计数主要有如下两类:1、组内相关t:t= 2B和2W分别为组间方差和组内方差。表型方差为组间方差和组内方差之和,即2P=2B+2W;组间方差是组内个体共享的变异,也就是组内个体间的协方差;组内个体间的协方差占总表型方差的比例反映了组内个体的相似程度。2、亲子回归bb=COVop为子代与亲代的协方差,2P为亲代的表型方

12、差(随机交配平衡群体内亲代总表型方差与子代相同)。亲子之间的协方差在表型方差中所占的比例表示了亲子间的相信程度。 二、遗传协方差亲属间协方差由亲属间相似引起,并由原因方差成分构成。亲属类型不同,原因方差成分对协方差的贡献也不同。实践中就是利用原因方差成分与亲属间协方差的这种关系,通过亲属间协方差来估算原因方差成分的。常用的亲属关系有亲子、半同胞、全同胞和双胞胎等。当不考虑座位同互作时,各类亲属的遗传协方差与原因方差成分的关系如下:1、子代与单亲子代与单亲的遗传协方差即亲本个体的基因型值G与其在群体内随机交配产生的子代平均基因型值SX(- OSX)之间的协方差。若亲子两代均以离均差形式表示,则利

13、用育种值的实际定义和线性函数间协方差的计算规则,可获得子代与单亲的协方差:COVop=COV(-M,G-M)=COV(A,A+D)=COV(A,A)+COV(A,D)= VA该协方差不受子代个体数的影响。一般说来,一个个体与许多亲属平均值的协方差等于该个体与这些亲属中任一个体的协方差。子代与单亲的相似程序用子代对单亲的回归系数bop表示。bop= =2、子代与中亲子代与中亲的协方差即子代均值与其双亲平均值的协方差。如果亲代方差VP1=VP2,则COVop1=COVop2,那么,根据线性函数求协方差的规则可得到子代与中亲的协方差为:COV=COV,P1+P2)=(COVop1+COVop2)=C

14、OVop=VA子代与中亲值的相似程度用子代对双亲的回归系数b表示。b= =由此可见,虽然COVop=,但bopb,子代与中亲比,子代与单亲更相似。亲子回归不受子代个体数影响,因为子代个体数不进入回归计算。亲子相关的计算需包括子代个体数。由于一个亲本的子代个体数往往是变动的,在动物和人类遗传研究中一般不因亲子相关。3、半同胞半同胞就是具有一个共同亲本的一组后代个体。根据育种值的实际定义,一组半同胞个体平均基因型值距群体均值的离差就是育种值的一半,即(1/2)A,而半同胞家系均值间的方差正好等于半同胞家系内的个体间的协方差,即半同胞间的协方差COVHS,因此:COVHS=COV(A,A)=V(A)

15、=VA半同胞间的相似程度用半同胞的组内相关表示。由于半同胞家系间方差即半同胞家系内的协方差COVHS,可根据公式t=得到半同胞组内相关系数:tHS=4、全同胞享有共同双亲的一组后代个体称为全同胞。设有双亲为P1和P2,其子代O1和O2的基因型效应(基因型值G与群体均值的离差)分别为:Go1=A1+A2+D1,Go2=A1+A2+D2A1和A2分别为双亲P1和P2的育种值,D1和D2分别为子代O1和O2基因型值的显性偏差。根据上式可推导全同胞个体间的协方差为:COVFS=COV(Go1,Go2)=COV(A1+A2+D1, A1+A2+D2)=COV(A1+A1)+2COV(A1+A2)+COV

16、(A2+A2+COV(D1+D2)= VA1+VA2+VD=VA+VD上式中,A1和A2彼此独立时,COV(,)=0,且VA1=VA2。若双亲基因型分别为A1A2和A3A4,则子代有4种基因型且各占,若一对全同胞的某一个体具某种基因型,则第二个个体具有相同基因型的概率为,即一对全同胞具有相同显性偏差(D)的概率为,所以COV(D1,D2)=VD。全同胞间相似程度以全同胞组内相关表示,与tHS=式同理,全同胞组内相关系数为:tHS=5、双胞胎双合子(异卵)双胞胎相当于全同胞,单合子(同卵)双胞胎相当于等基因型。因此,双合子双胞胎间的协方差为:COVDZ=VA+VD单合子双胞胎间的协方差为:COV

17、MZ=VG6、遗传协方差的一般式不包含上位性互作时,亲属间遗传协方差的一般式为:COV=rVA+uVdr为亲属个体育种值间的相关,又叫亲缘系数或理论相关。u表示因血缘关系而具有相同基因型的概率。如亲属个体间无其祖关系,则u=0。半同胞的r=(1+F)/4,u=0;全同胞的r=(1+f)/2,=(1+F)2/4。F为群体的近交系数。座位间存在上位性互作时,亲属间协方差的一般式为:COV=rVA+uVD+r2VAA+uVAD+u2VDD+互作方差对亲属间协方差的贡献一般不大,但其中育种值的互作对所有亲属间协方差均有贡献。另外,座位间存在上位性时,连锁会使同胞协方差中上位性方差的系数增大。但亲子协方

18、差不受连锁的连锁。三、环境协方差和表型相似遗传因素并非亲属间相似的唯一原因,亲属间共同的环境因素,母体效应和生长竞争等是影响亲属间协方差的外在因素。由于表型协方差=遗传协方差+环境协方差,当环境协方差得以充分控制的情况下,可由表型协方差直接得到遗传协方差的估计值,并以亲子回归和组内相关表示亲属间的表型相似程度。第四章基因效应分析与遗传模型检验我们知道,开始观测生物性状所得的观测值,通常属于表型值,而不同表型值当中所包含的基因效应种类和比例可能有所不同。那么,如何根据实测的表型值估算相应的基因效尖的数值及其所引起的群体内遗传变异的大小,是本节的中心内容之一,而另一中心内容是考查包含不同基因效应的

19、遗传模型的适合与否。第一节 尺度效应用不同尺度度量同一性状,可能得到不同的观测值。这意味着尺度的不同会影响观测值的大小,因此,尺度效应在讨论数量性状表现时,是不可忽略的因素。所谓尺度效应,通常指的是由于度量尺度不合适而引起的数量效应。换句话说,若采用适宜的度量尺度,观测值中可能不包含尺度效应,或者使尺度效应最小化。实验研究得到的数据,通常都是采用度量该性状最方便的尺度,但这种最方便的尺度不一定是最适宜。如果尺度不合适,观测值中会包含一定的尺度效应。由于尺度效应的存在,有可能使数据的分布形态、方差与平均数的关系以及呈现不同类型互作效应等方面偏离分析的需要。为此,数量遗传研究中,原始数据往往需要进

20、行适当的尺度转换,消除有关的尺度效应的干扰,使之表现出有关的基因效应或环境效应应有的作用。概括起来,进行尺度转换的主要目的有三个:1、使数值分布呈现正态或接近正态若原始数据的分布明显偏离正态,那和通过对数转换可以使分布形态趋于正态。不过如果变异系数20%时,尺度转换的作用不明显。2、使方差独立于平均数有些原始数据中方差的大小与平均数呈现特定的关联,那么,为了使方差的数值大小不受平均数数值的制约,也需要进行对数转换。在进行对数尺度转换中,有时,可以不必把原始数据逐一转换,可根据下式直接求得转换后的平均数与方差。对数平均数()=-log2(CV)2对数方差2logx=0.4343log1+(CV)

21、23、消除某些效应间的互作某些种类的尺度效应有时会以不同形式的互作表现出来,因而,它们有时会与等位基因间的互作(显性效应)或非等位基因间的互作(上位性效应)等相混结。另一方面,上位性互作、基因型环境互作,有时也可通过特定尺度转换而消除或减少,而从遗传变异分析角度来说,应该保留这类工作,因此,对于它们的取舍要合理。总之,尺度转换只是简化分析过程的一种统计策略,通过特定的尺度转换,使得数量遗传研究中数据分析得以正常进行或被简化,而且,有时还有助于分析得以正常进行或被简化,而且,有时还有助于分析结果的解释或说明;但是,要注意防止尺度转换削弱遗传效应表现的趋势。在数量遗传分析中,对基因的遗传效应的分析

22、,往往是通过尺度检验来实现。第二节 尺度检验单一尺度检查法,是1949年由KMather提出来的,由于独立性的检验。在分析过程中涉及三个分离世代,常用A、B、C表示,因此又称ABC检验。常用公式为:A=2 -=0B=2-=0C=4-=0假定上位性互作不存在,根据双亲F1、F2、B1、B2等世代群体的均值组成,可推导出以上三式的理论值均为0。那么,根据线性函数求方差的规则,可以分别求得以上三式的方差V(A)、V(B)、V(C):V(A)=4VB1+VP1+VF1V(B)=4VB2+VP2+VF1V(C)=16VF2+4VF1+VP1+VP2开方后得相应的标准误:SEA=、SEB=、SEC=将实测

23、的P1、P2、F1、F2、B1、B2等世代均值和方差代入相应的A、B、C式,同时,求出相应的标准误,然后进行t检验,就可判断A、B、C与0之间是否有显革差异。若该三式均不显著,说明尺度合适,亦即加性显性模型合适。若任何一式显革,都说明有某种类型的上位性互作效应存在。例:现以两个大青品系每穗粒数为例进行A尺度检验。表41 两个大麦品系及其杂交后代每穗粒数的观察结果世代平均数() MS 自由度(Df)=9.125 MS N-1=9=5.500 0.091 N-1=9=7.500 0.100 N-1=9BG)F表中标准误指样本标准差。样本平均数的方差可由每个家系内个体值的方差来估计。例如:VP1是P

24、1家系内个体值的方差,则P1的平均数的方差VP1用VP1/n,n为每个家系内的个体数,所以P1的标准差=。将上述表内数据代入,A=27.500-9.125-5.500=0.235。 SEA=0.235。这时,需要对A进行检验,如果t(t=(A- )SEA)值t0.05,即表示不显著。式中为A的期望值,即=0。根据以上计算结果,t=1.596。统计量A的自由度等于它所涉及的每个世代方差自由度之和,即9+9+9=27。当自由度等于27时,即在0.05的水准下A与0的差异不显著。说明在A尺度检验下用加性显性模型来描述这些基因型间的度量关系是合理的。用同样方法可以进行B和C的检验。如果A、B、C中有任

25、何一个明显不等于零时,就可以认为模型是不合适的。若A、B、C中均不显著,则表明模型能符合实际资料,按照模型的假定可以被接受。当研究中所用世代数超过6代,即分离世代超过3代时,每超过一个分离世代就得增加一个新的比较式。例如,在上述六个世代的基础上,在增加一个F3代,则尺度检验应在原有A、B、C基础上再增加一个D,V(D)和(D-)/SED。=+D=-3-3-2V(D)=64VF3+9VP1+9VP2+4VF1t=(D-)/SED在A、B、C测验中,一般来说,C值比A、B灵敏性大一些,因为它包含有F2代,遗传基础更为广泛。第三节 联合尺度检验采用ABC检验,每次只能检验一个式子,每个式中只包含少数

26、世代群体的数值,因而,这种检验不够全面,而且,不能估算基因效应的具体值。联合尺度检验法是由LLCaralli(1952)根据数学上最小二乘法原理提出来的,该法可以同时综合任何世代群体的信息;可以估算模型的参数m、a、d等的数值,也就是基因效应分析;同时,可检验遗传模型的适合度。一、参数的估算首先利用世代均值的理论构成与实测值建立联合尺度检验方程,然后借助加权最小二乘法进行分析。其实质是以世代均值为依变量,以世代均值构成系数为自变量来求解m、a、d的多元回归过程。其步骤如下:1、列出各世代的平均数、标准误、加权值及其要估算的遗传参数m、a、d的理论系数。加权值(即权量用W表示)是各世代平均数的方

27、差的例数。2、采用最小二乘法获得三个正规方程,用以求解三个参数(m)、(a)、(d)的估值。具体估算采用加权法,其方法是:用权量乘以各世代参数的系数以及各世代平均数(依变量),蛮即各世代平均数方程,然后再求得所有世代的总和方程,即构成第一个正规方程。A11m+A12a+A13d=Y1。用a的系数乘以各世代平均数方程,再求得所有世代的总和方程,构成第二个正规方程。A21m+A22a+A23d=Y2。用d的系数乘以各世代平均数方程,再求得所有世代的总和方程,构成第三个正规方程。A31m+A32a+A33d=Y3。3、将上述三个方程用矩阵(A、B、Y)的形式表示出来。= 即Y=Ba b=YA-1(b

28、为m、a、d的最小二乘估计)4、求出A矩阵的逆矩阵,A-15、得出m、a、d的估值。在A-1矩阵对角线上的三个值(A11、A22、A33)正是三个参数m、a、d估计值的方差。所以,这三个数的平方根就是m、a、d的标准差,即Sm、Sa和Sd。另外,在利用双亲杂交后代进行基因效应分析时,应注意被研究性状在双亲间所表现的差异,-差异越大,表明同效基因的集中程度越高。如果-差异不显著,就无法区分差异究竟属于遗传差异,还是取样误差。所以一般要求-至少要大于两者差异标准误的两倍,才能进行分析。二、遗传模型的适合度1、根据m、a、d各参数估值,求出P1、P2、F1、F2、B1、B2等各世代平均数的期望值(E

29、);=m+a =m+d=m-a =m+a+d=m+d =m-a+d2、根据各世代实测平均数(O)与期望值(E)二者之差进行卡方测验,以判断加显模型是否适合。X2=(W)式中:W为各世代权量,所用自由度df=世代数-3。若经检验认为模型不合适,期望值与观测值差异显著,说明加性显性遗传模型(三参数模型)不合适,应进一步拟合包含上位性效应的模型。例42,现以1975年Virk的烟草株高试验资料为例运算如睛:(1)列出各世代的平均数、标准误、权量及其要估算的遗传参数m、a、d的理论系数。见表42。表42 烟草株高试验资料世代 株数 平均值 标准误 方差 权量 模型 期望值X S MS W m a dP

30、1 20 116.300 1.0017 1.0034 0.9677 1 1 0 116.522P2 20 98.450 1.2052 1.4525 0.6688 1 -1 0 99.122F1 60 117.675 0.9848 0.9699 1.0310 1 0 1 117.381F2 160 111.778 0.7011 0.4916 2.0342 1 0 112.351B1 120 116.000 0.6991 0.4888 2.0458 1 116.451B2 120 109.161 0.7833 0.6135 1.6299 1 - 108.252(2)采用最小二乘法获得三个正规方程。

31、见表43。表43 第一正规方程m a d W=Y0.9677 +0.9677 +0 =112.54330.6688 -0.6688 +0 =65.84341.0310 +0 +1.0310 =121.32292.0342 +0 +1.0171 =227.37882.0458 +1.0229 +1.0229 =237.31281.6299 -0.8149 +0.8149 =177.92158.3774m +0.5069a +3.8859d =942.3229第二、第三正规方程是在第一正规方程的基础上,分别用a、d的系数去乘以六个世代平均数方程,然后再加和而得到。第二正规方程m a d0.9677

32、 + 0.9677 + 0 =112.5435-0.6688 + 0.6688 + 0 =-65.84340 + 0 + 0 =00 + 0 + 0 =01.0229 + 0.5115 + 0.5115 =118.6564-0.8149 + 0.4075 - 0.4075 =-88.96010.5069m + 2.5555a+ 0.1040d =76.3964第三正规方程m a d0 + 0 + 0 = 00 + 0 + 0 = 01.0310 + 0 + 1.0310 =121.32201.0171 + 0 + 0.5086 =113.68941.0229 + 0.5115 + 0.5115

33、 =118.65640.8149 + 0.4075 + 0.4075 =88.96103.8859m + 0.9190a +2.4586d =442.6288(3)将三个方程用矩阵形式表示:A= = (4)求A矩阵的逆矩阵,A-1A-1=(5)得出m、a、d的估值b= = (6)计算六个世代的期望平均数,然后进行X2测验,以判断加显模型是否适合。经X2测验结果表明,期望值与观测值很接近,说明加性显性模型对于烟草株高性状是合适的。 第四节 世代平均分析一、世代平均值分析的概念联合尺度检验虽然比单一尺度检验更为全面,能估算m、a、d等效应,并能检验模型适合性,但如若想同时估算包括上位性效应在内的各

34、种基因效应及其遗传变异,则需要采用世代平均值分析。由于各个不同世代群体平均值的差异是它们所包含的基因效应种类及其比例不同的反映。因而,在相同环境条件下,比较不同世代群体平均值,并利用回归分析求得有关基因效应及其相应变异的估值,这个过程就是世代平均值分析。二、世代平均值分析的一般原理及方法1、统计遗传原理多元回归分析程序适用于各种世代平均值分析模式,现以Mather与Jinks(1971)模式为例加以说明,假如双亲均为纯合系统,那么,双亲有差异位点的群体平均值可表示如下: =m+a+aa, =m-a+aa=m+d+dd, =m+d+dd=m+a+d+aa+ad+dd =m-a+d+aa-ad+d

35、d式中为高值亲本平均值;为低值亲本平均值;和分别是杂种一代及杂种二代平均值;是P1的回交群体平均值;是F1P2的群体平均值。同时,a=总的基因加性效应;d=总的基因显性效应;aa=加性加性上位效应的总估值;ad=加性显性上位效应的总估计值;dd=显性显性上位效应的总估值。首先,把上述各世代平均值的表述式换成相应的期望值,可得到下表:基因效应 m a d aa ad dd P1 1 1 0 1 0 0P2 1 -1 0 1 0 0F1 1 0 1 0 0 1F2 1 0 1/2 0 0 1/4B1 1 1/2 1/2 1/4 1/4 1/4B2 1 -1/2 1/2 1/4 -1/4 1/4该表

36、说明世代平均值是随着其所包含的基因效应值的不同而变化的。特定的群体有其特定的基因效应,其数值则是该群体重要的遗传参数。如果将上表所列的六个遗传参数m、a、d、aa、ad、dd和dd分别用0、1、2、3、4、5来表示,其相应的系数分别用X0、X1、X2、X3、X4、X5表示,各世代平均值用Y表示,则可得到世代平均值Y依基因效应及其相应系数X而变化的一组回归方程:Y=0+1X1+ 二参数模式Y=0+1X1+2X2+ 三参数模式Y=0+1X1+2X2+3X3+ 四参数模式Y=0+1X1+2X2+3X3+4X4+ 五参数模式Y=0+1X1+2X2+3X3+4X4+5X5+ 六参数模式式中表示随机误差。

37、上述三参数模式是仅包含m(即0)、a(即1)和d(即2)的加性显性模式;而六参数模式则是包含所有基因效应类型的加性显性上位模式。为也估算各类基因效应及其相应方差,必须从二参数模式开始,分别代入世代平均值Y和系数X的实际值,从而求得0和1(即m和a)的估值。再逐次拟合三参数直到六参数模式,从而得到2、3、4、5亦即d、aa、ad和dd的估值。现将这一过程用矩阵表示:世代平均值向量 Y= 基因效应向量(或称参数向量)=由前面的表可得到系数矩阵X:X= 随机误差向量= 有了这些向量和矩阵,可将上述世代平均值的回归方程组表示为:=于是则有回归方程:Y=X+上式的正规方程矩阵形式则是:(XX)b=XY从

38、而可得到的最小二乘估值:b=(XX)-1XY现以三参数模式为例,进一步加以说明:回归方程Y=X+可具体化为:=+其正规方程则是:(XX)b=XY上式可进一步表示为:=亦即:XX= XY=求得矩阵XX的逆矩阵(XX)-1之后即可算得b值。其最小二乘解b=(XX)-1XY可具体化为:=2、平方和的分剖:依变量Y的总平方和:SST=YY-n回归平方和:SSR=bXY- n剩余平方和:SSr=YY-bXY为了进一步估算各基因效应平方和,首先从包含m的一参数模式说起。这时的回归方程是:=0+对于同一套数据其总平方和为定值,即:SST=YY- n式中n是校正值。由于一参数模式中仅有截距0(即m),这时的理

39、论线是一条平行于X轴的直线,显然Y与X无关系,即回归平方和为零。SSR1=b1XY- n=0 于是有:b1XY= n因此,一参数模式的未校正回归平方和乃是由于截距0存在于模式中引起的平方和:SS(b0)=n n=SSm二参数模式: Y=0+1x1+这时未校正的回归平方和乃是由于模式中既包含0,又包含1所引起的,即是:SS(b0,b1)=b2XY将这一平方和进行校正,则得到二参数模式的回归平方和:SSR2=b2xy- n= SS(b0,b1)-SS(b0)由上式可见,二参数模式的回归平方和乃是由于模式中增加1(即加性效应)所引起的回归平方和的增量。显然这是1(即a)的回归平方和:SS(b1,b0

40、)= SS(b0,b1) SS(b0)=SSR2=SS1同理,三参数模式未校正的回归平方和:SS(b0,b1,b2)=b3XY,校正后得到:SSR3=b3XY- n=SS(b0,b1,b2)-SS(b0)这时SSR3与SSR2的数值不同的原因是在二参数(m、a)的基础上加上了第三个参数d(2),它所引起的回归平方和增量,则是:SS(b31,b0,b1)=SSR3-SSR2=SSD同理可得:SS(b21,b0,b1,b2)=SSR4-SSR3=SSaaSS(b41,b0,b1,b2,b3)=SSR5-SSR4=SSRaSS(b51,b0,b1,b2,b3,b4)=SSR6-SSR5=SSdd上述

41、分剖程序完全符合遗传现象的生物学实质。另外,剩余平方和:SSr=SSt-SSR=XY-bXY其中,重要的是三参数模式和六参数模式的剩余平方和。SSr3=SST-SSR3=XY-b3XY乃是Y的总变异(即世代平均值的总变异)中去掉由m、a和d所引起的变异之后剩下的部分。若世代平均值差异纯属遗传差异,那么,SSr3应该是由上位效应引起的变异部分,因而,若SSr3显著,可将其进一步分剖为aa、ad和dd三部分。显然,如果世代平均值中不包含环境效应,那么则有SSr6=0。综上所述,可将各类基因效应及其相应平方和、自由度的分剖概括于下页左表:变异来源平方和自由度算式世代ad离差aaadddSSTSS(a|m)SS(d|m,a)SS(aa,ad|m,a,d) SS(aa|m,a,d) SS(ad|m,a,d,aa) SS(dd|m,a,d,an,ad) 5113111SSR2SSR3-SSR2SSR

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1