6-1单因素方差分析.ppt

上传人:本田雅阁 文档编号:3468945 上传时间:2019-08-30 格式:PPT 页数:63 大小:2.37MB
返回 下载 相关 举报
6-1单因素方差分析.ppt_第1页
第1页 / 共63页
6-1单因素方差分析.ppt_第2页
第2页 / 共63页
6-1单因素方差分析.ppt_第3页
第3页 / 共63页
6-1单因素方差分析.ppt_第4页
第4页 / 共63页
6-1单因素方差分析.ppt_第5页
第5页 / 共63页
点击查看更多>>
资源描述

《6-1单因素方差分析.ppt》由会员分享,可在线阅读,更多相关《6-1单因素方差分析.ppt(63页珍藏版)》请在三一文库上搜索。

1、第六章 方差分析,第一节 单因素方差分析,第二节 双因素方差分析,方差分析(analysis of variance)就是采用数理统计方法对数据进行分析,以鉴别各种因素及因素间的交互作用对研究对象某些试验指标的影响大小的一种有效方法.,第一节 方差分析,一、问题的提出,注:方差分析简记为ANOVA.,例1 检验不同饲料对鸡增重的效应。选用三种饲料:A1 以鱼粉为主,A2 以槐树粉为主,A3 以苜蓿粉为主。特选 24 只相似雏鸡随机分三组,每组各喂一种饲料, 60 天后观察其重量,试验结果如下,几个概念:(1)所考察的试验结果(如产品质量、数量、销量、成本等)称为试验指标,简称指标。例中为鸡的重

2、量。,(2)在试验中对所关心的“指标”有影响的、要加以考察改变状态的原因称为因子, 用 A,B,C 等大写英文字母表示。例中为饲料。,(3)因素在试验中所取的各种不同状态称为因子的水平. 因素 A 的 r 个水平常用 A1,A2,Ar 表示,其中 r 称为因素 A 的水平数。例中有 1 个因素,3 个水平。,(4)若只考察一个因素对指标的影响,这种试验称为单因素试验,相应的方差分析就称为单因素方差分析; 例中为单因素试验。 若一个试验中同时考察两个因素,则这时对试验所作的方差分析称为双因素方差分析;因素多于两个,相应的称为多因素方差分析.,试验中,使用配方 Ai下第 j 只鸡的重量记为 yij

3、, i=1,2,3; j =1,2,8. 我们的目的是研究不同饲料对鸡增重的影响是否相同。,例1(续) 对原始数据作如下变换:每个数-1000 (为了处理更加简便),(图形分析散点图),二、单因素方差分析的统计模型,考虑的因素记为 A,假定它有 r 个水平,记为 A1,A2, , Ar . 在每一水平下考察的指标可看成一个总体,共有 r 个总体. 作如下假定:,(1)每一总体服从正态分布 N(i , i2), i=1, 2, r ; (2)各总体同方差, 即 12 =22=r2= 2; (3)从每个总体中抽取的样本是相互独立的, 即所有试验结果 yij 都独立.,简而言之, 每一总体独立地服从

4、同方差的正态分布. 且这些假定的成立与否都可用统计方法进行验证.,单因素方差分析(single factor analysis of variance)是要判断因素对指标是否有显著影响,归结为判断不同总体是否有相同分布的问题.,因为各总体方差相同,所以要判断因素对指标是否有显著影响,就化为比较各水平下的均值是否相同即检验,其备择假设为:,2 ,r 不全相同.(常省略不写),对水平 Ai 作了 m 次观察,第 i 水平的第 j 次观察为yij ,这样可得观察资料(若各水平观察次数不同时,略有不同,后叙),称第 i 水平下的均值与总均值的差 为因子 A 的第 i 水平的主效应, 简称 Ai 的效应

5、. 易见,记总均值为,设 是来自总体 的简单随机样本,则单因子方差分析的统计模型为,其中ij = yij -i 称为 随机误差,单因子方差分析的统计模型可改写为:,可改写为,方差分析是通过对误差的分析研究来检验具有相同方差的多个正态总体均值是否相等的一种统计方法.,对水平 Ai 作了 m 次观察,第 i 水平的第 j 次观察为yij ,这样可得观察资料(若各水平观察次数不同时,略有不同,后叙),记总观察次数 ,组平均值 ,,三. 平方和分解,总平均值 及,1. 组内偏差与组间偏差,与,(图形分析散点图),组间偏差:,反映了组内数据与组内平均的随机误差,组内偏差:,反映了随机误差和第 i 个水平

6、的效应,则,2. 偏差平方和与自由度,设有 k 个数据 x1, x2 , .,xk ,且 ,偏差平方和:,反映了数据的集中或分散程度,即数据波动的大小,自由度:平方和中独立的随机变量的个数.,均方和:,反映了每个自由度上数据的离散程度,排除了自由度的干扰,3. 总平方和分解公式,总偏差平方和:,它反映了观测数据 总的变异程度,组间(因子A的)偏差平方和:,反映因子A的不同水平效应间的差异,组内(误差)偏差平方和:,反映了随机误差ij对 试验结果影响的总和,ST =SA +Se , f T = f A +f e 平方和分解公式,定理1:,(1) Se /2 2 (n - r), 从而 E(Se)

7、=(n-r),进一步,若0成立,则,定理2:,(2),SA /2 2 (r-1),(3) SA 与 Se 独立.,对水平 Ai 作了 m 次观察,第 i 水平的第 j 次观察为yij ,这样可得观察资料(若各水平观察次数不同时,略有不同,后叙),4. 检验方法,若SA显著地大于Se,说明 间的差异显著地大于随机误差,那么 H0 可能不成立.,取检验统计量,当 H0 成立时,因此拒绝域为,5、方差分析表 (analysis of variance table):,注:数据复杂时,采用EXCEL软件可得到分析结果,并可给出检验的 p 值即 p=P(XF), 其中X F(r-1,n-r),判断:,例

8、1(续1) 试验结果如下,试检验不同饲料对鸡增重的效应。,解(1)列出数据计算表(对原始数据作一个线性变换(yij-1000),合计,48,29,32,22,21,80,29,93,A3,1,122,74,90,109,-10,92,107,A2,28,9,12,2,1,60,9,73,1,数据(原始数据-1000),水平,线性变换不影响方差分析的结果,取=0.05.得0.95(2,21)=3.47, 而F=3.5953.47.拒绝 0.,故认为因子A是显著的,即三种饲料对鸡的增重有明显差别.,四. 数据结构式及其参数估计,1. 数据结构式,其中为总体均值,i为第 i 个水平的效应, 且,ij

9、 为试验误差,在上述结构式下,i=1,r, j=1, ,m 且独立,2. 点估计,用最大似然估计法可求出一般平均,各主效应i 和误差方差2的估计.,总平均的估计:,主效应i 的估计:,误差方差2 的估计:,各水平均值i 的估计:,由于它不是2 的无偏估计, 实用中采用:,MSe,置信区间,由于,且两者独立, 故,故,各水平均值i 的1- 置信区间为, Se /2 2 (n - r),注:单因子试验的统计分析可得如下三个结果:,(1) 因子 A 是否显著.,(2) 试验的误差方差 2 的估计.,(3)各水平均值i 的点估计与区间估计. (此项在因子A不显著时无需进行),五. 重复数不等情形下的方

10、差分析,1. 数据略有不同,设因素 A 有 r 个水平A1,A2, , Ar . 且第 i 水平Ai下重复进行mi 次试验, i=1, ,r, 获如下数据:,2. 基本假定、平方和分解、方差分析及判断准则相同 计算公式稍有不同。特别注意 SA 的计算公式!,统计模型为:,记,则各平方和公式为:,例2 茶是一种饮料,它含有叶酸(folacin),这是一种维他命B。如今要比较各种茶叶中的叶酸含量。现选定绿茶,这是一个因子,用A表示。又选定四个产地的绿茶,记为A1, A2, A3, A4,它是因子A的四个水平。测定试验误差,需要重复。选用不平衡设计,即A1, A2, A3, A4分别制作了7,5,6

11、,6个样品,共有24个样品。试对之进行方差分析,从中可得到什么结果?,若取显著性水平=0.05查表可得,由于F3.10,故应拒绝原假设,即认为四种绿茶的叶酸平均含量有显著差异,从方差分析表上还可以获得,诸均值的参数估计,故均值,的95%的置信区间是7.13,9.41,思考: 方差分析中的检验与两个独立正态总体(方差未知且相等)中均值差的检验有何异同?,补充一:多重比较,在确认因子 A 的 r 个水平均值间有显著差异的情况下,进一步要问:哪些水平均值间确有显著差异,那些水平均值间无显著差异,这就要进行多重比较,同时比较任意两个水平间有无显著差异的问题称为多重比较问题,譬如,r=3 时,同时检验如

12、下三个假设,若r较大,要同时检验 个假设,即:,多重比较,因此拒绝域形式:,同时考虑,考察因子A的r个水平,每个水平下重复数为mi .假设诸试验数据,下面讨论临界值 cij 的确定:(分两种情况),(1)重复数相等情况的多重比较 (Tukey 法),经计算,对给定显著性水平,拒绝域形式:,在各水平试验次数相同时,诸临界值可认为相同,记为c,例(第一节中例续)检验不同饲料对鸡增重的效应中,饲料因子显著试进行多重比较,()重复数不等情况的多重比较(Scheffe法),考察因子A的r 个水平均值,每个水平下的重复数分别为,且有,当 成立时,有,且Fij不应过大,过大应拒绝 .,在各mi不同时,诸临界值也不相同,但可要求,拒绝域形式:,同时考察r2个假设时,至少有一个假设不成立就构成该多重比较的拒绝域:,Scheffe证明了,则对给定显著性水平 ,取定临界值,从而,(这里为近似分布,不是渐近分布),补充:方差齐性检验,方差齐性是进行方差分析的三个基本假定之一,需要确认 实际确定:如,两个车间的设备相同,操作技术水平相当,可确认两车间生产的产品的误差近似相等 统计确定:要对如下的假设作出判断:,(齐性,即相等),

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1