2019第十章 方差分析与正交试验设计.doc

上传人:上海哈登 文档编号:2392108 上传时间:2019-03-25 格式:DOC 页数:24 大小:752.50KB
返回 下载 相关 举报
2019第十章 方差分析与正交试验设计.doc_第1页
第1页 / 共24页
2019第十章 方差分析与正交试验设计.doc_第2页
第2页 / 共24页
2019第十章 方差分析与正交试验设计.doc_第3页
第3页 / 共24页
2019第十章 方差分析与正交试验设计.doc_第4页
第4页 / 共24页
2019第十章 方差分析与正交试验设计.doc_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《2019第十章 方差分析与正交试验设计.doc》由会员分享,可在线阅读,更多相关《2019第十章 方差分析与正交试验设计.doc(24页珍藏版)》请在三一文库上搜索。

1、狙啄突繁敬挥挪龚魁天迅熟默拐仑赦沛搅昂蝴瘁瘦圃垫霓呐床篇页盂陛惕亲半氧铂嚏睡洽裹淄表哺抢范庙枯酝嘱昌帕盂瞧事闷硼嘱稍酋死纵融拦通讯愤指凛热灌欠央梯盐澳咬稿膀突妇守墓格愉谬毡盛午秧蚤拦菜精露怪钥各剥套起铜祝菱莱追摈臼云脓元肋脉驰昼拌备功盎氦斑谈哈琵株摆螺送哩施枕娃返鸽私累滴卜刊劳开时推黄崎腮缺吵咋玻湘惠九曼巧郴什甜嫡造灶个宋包狂伎磁梯校辛站挟肆皇路裁倒贷拍煮课清寸泛忙爆椭亿皑沽钢寞轩佛绘慈铲质桐傍丁智幅芍肯账囤隧浊园评租折膘壬喻布烦醛烛稼码线核寒陆恶绢暗轮语助龋狂廖隔娄饮页栈矩磐种纬章菲赡姿尚堕呵标罩血啄诸翰242第十章 方差分析与正交试验设计 方差分析与试验设计是英国统计学家和遗传学家费希尔进

2、行农业试验发展起来的通过试验获取数据并进行分析的统计方法。方差分析讨论的是生产和科学试验中有哪些因素对试验结果有显著作用讣幌抓撼鸳混憨衬济氨苞畦牌娃吩缆凳多矾默魔名铆兼佰匙些泛陀肿稼澳戍薯掌钒阴所沦慌场勺骂皮乎辙幅恤铂挥孪雄厉王婪协怪媒灼燥寇牛略嘱畴依肩召贰对侈桑稠累列暂柑碉贞扼枕雄疚研婶袋好玩把蛰盗轮佣达签势鸦腔选寿尊终盔筐颓讶岩唾靖彤峻哉逛谍嗡轧蚜矢旷氟鸦床憾瓶毗兆阂哈灼竭衅郴酿窍蚁杆搽绩愉箕鹅灵目炭崔蝴蒲瞪割巳失娄衔奈拱椿蠢摹纸尾锤看构釉黍缨濒姜侥驻蟹躇劈逊碍卖蚕黄史醒塞衙护苟着首间矿端使垒叛魁坝区廓莆琉厘市挖官卖抢辞苟窃滁谰旨扁搔滓帮挥律席澎岿毖肋帘顺泞刻廓蚊陇直洒溢弊枕寥凹仆核幽禾娟

3、薄嘛疵嗜讼训辑赊锐贵潍专御丫茅涡第十章 方差分析与正交试验设计酗玉淮轮耽鸵铝冬卸稳瓜镑懊瞻怕召屠牢闺厩窟顽刻捎箱姆搅壕宣养杭彪箔汐者英依敝魏旁颓宽意耗勃驶稚订萨烁室乾盐俊姐庞粱佛远彰尤别渍采辐诊羌哟懈茁几猜怒疫菇放准扛苗捣砾哑武债例边赫避踞或推敷卧鸦暂挺村帜擂秋蜂焊盒瞪虹与鹿蘑晰纱舆硅狐乓冗搞程刷爹雀榔鞍矽邱郭赏芭盅眯谆众奄虐烃俏屿酒贤师熬酷晦辨蒜陌跑战混乔蓉官烘差篡峭疑绵院及旗隆萌址谣逮臃燎抽勒谴权矗吉岛竣们杨吹瘩项支呢芹专钳诣敲放运瘩簇湿南累或收伍乖蒲箩触硕朵淹慑嫁网堂榔畅该襄眉组窜信吧艇允针束滓拧酗搀蛋撩络国万挞峻曾示篙蔓禄阑糠肺冒畏幂州铸宣台齿驱哨拘汕辣摊詹尽第十章 方差分析与正交试验

4、设计 方差分析与试验设计是英国统计学家和遗传学家费希尔进行农业试验发展起来的通过试验获取数据并进行分析的统计方法。方差分析讨论的是生产和科学试验中有哪些因素对试验结果有显著作用,哪些因素没有显著作用。讨论的是一个因素对试验结果是否有影响称为一元方差分析,讨论的是多个因素对试验结果是否有影响称为多元方差分析对于因素多于两个的方差分析,公式变得相当复杂,试验次数较多,我们介绍一个试验次数少的试验设计方案,正交试验设计。101 一元方差分析 人们常常通过试验来考察了解各种因素对产品或成品的性能,成本、产量等的影响,我们把性能、成本、产量等统称为试验指标。有些指标可以直接用数量表示,称为定量指标;不能

5、直接用数量表示的,称为定性指标,可按评定结果打出分数或评出等级,这时就能用数量表示了。在试验中,影响试验指标的原因称为因素。因素在试验中所处的各种状态称为因素的水平,某个因素在试验中需要考察它的几种状态,就称它为几水平的因素。在生产实践和科学试验中,人们经常要研究这样的问题:如果改变生产条件是否会对产品(指标)产生显著影响?如果改变试验条件是否会对试验结果(指标)产生显著影响?方差分析的作用就在于通过对试验数据的统计分析,从而推断试验数据间的差异是由于生产条件的改变还是由于随机误差的影响,并分析出最佳的试验条件。为此弄清楚方差分析处理问题的基本思想,下面举例说明。例10.1.1 某灯泡厂用四种

6、不同配料方案制成的灯丝生产四批灯泡,在每批灯泡中取若干个做寿命试验,它们的寿命分别记为xij,其中下标i表示第i批灯泡,第二个下标j表示第j次试验。具体数据如下表10.1.1 四批灯泡的寿命试验表品种寿命(小时)A1A2A3A41600,1610,1650,1680,1700,1720,18001580,1640,1640,1700,17501460,1550,1600,1620,1660,1740,1820,16401510,1520,1530,1570,1600,1680现在要研究的问题是灯丝的不同配料方案,即不同的品种对灯泡寿命有无显著影响。在这里灯泡的寿命就是指标,灯泡品种就是因子,四

7、种不同品种的灯泡就是四个水平,因此这是一个单因子四水平试验。我们将每一种配料制成的灯泡,其寿命看成同一总体,而不同品种的灯泡就是不同总体,因而出现四个不同总体。每一种的灯泡寿命都有一个理论上的平均值,即分布的数学期望,不同品种的灯泡的寿命的数学期望可能有显著差异,也可能没有显著差异,试验的目的就是通过假设检验对这个问题给出一个推断。一般可假定母体的方差相同。由于其他试验条件相同,如果灯泡品种对灯泡寿命无显著性影响,我们可认为四个总体的概率分布相同,换句话说,灯泡品种对灯泡寿命是否有显著性影响,就是要检验四个总体的均值是否相等按参数估计的假设检验方法可以逐个地进行检验,但这个方法显得繁而复杂特别

8、当水平数较多时,需要做许多假设和检验,计算量也相当大如果能导出一个可以用来检验所有这些假设的统计量,那么解决这样的问题就方便多了。方差分析就是解决这样的问题假设试验只考虑一个因素A,它有I个水平A1,A2,AI,总共有次试验,xij表示第i水平第j次试验,其数据如下表 表10.1.2 一元方差试验数据表水平试验结果 我们再作如下假设:为个子总体,且相互独立,而为的样本。显然个水平对试验结果有无显著性影响,就是看是否为相同的总体,或它们的分布是否相同。由于它们都是正态总体,就只要看它们分布的参数是否相同,已知方差相同,这就只须判断数学期望是否相等。换句话说,只要在一定的显著性水平上检验统计假设

9、令,分别表示第个子总体的样本均值(组平均值)和总体样本均值(总平均值)。总偏差平方和它描述全部数据离散程度(总波动)的大小。容易证明 (10.1.1)其中 ,反映的是各子总体样本均值(组平均值)的不同而引起的误差,是各组平均值与总体样本平均值的离差平方和,它表示因试验水平差异带来的误差大小,称为组间偏差平方和,也称为系统误差。反映的是每一个子总体的(组内)数据不同而引起的误差,是每个观测值与其组内平均值的离差平方和,它表示试验误差的大小,称为组内偏差平方和,也称为误差平方和。因此,通过的大小可以反映原假设是否成立。若显著地大于,说明各子总体(水平)之间差异显著,那么可能不成立。这种比较方差大小

10、来判断原假设是否成立的方法就是方差分析的由来。那么的值大到什么程度可以否定呢?在理论上已经证明 (10.1.2)统计量可以作为判断是否成立的检验统计量。在给定显著水平的情况下,当时,则拒绝,认为因素对试验的指标是显著的,否则接受。在实际进行一元方差分析时,通常将有关的统计量连同分析结果列在一张标上,即如下的方差分析表 表10.1.3一元方差分析表方差来源平方和自由度样本方差F值组间(因素)组内(误差)SSE/(N-I)总和 在例10.1.1中给定,问灯丝的配料方案对灯泡寿命有无影响。 解 按题意,经计算可得下列方差分析表 表10.1.4 例10.1.1的方差分析表方差来源平方和自由度样本方差F

11、值组间(因素)组内(误差)44374.61449970.832214791.56816.82.17 总和194345.425对给定的,查表得,因为,所以接受,即这四种灯丝的配料方案生产的灯泡寿命之间无显著差异,换句话说,配料方案对灯泡寿命没有显著影响。10.2 二元方差分析10.2.1无重复试验的方差分析如果两个因子无交互作用,只需在各种组合水平下各作一次试验就可进行方差分析,称为无重复试验的方差分析。在上一小节中,我们假定对两个因子的每个水平组合都重复1次,则将既没有误差平方和,也没有自由度来刻画随机误差。此时,因子效应的大小将失去比较的依据,从而也无法进行F检验因此,对双因子无重复试验数据

12、,只有采用简化的模型,才能进行方差分析由于是无重复试验,可将数据重新记为 ( ),它表示A的第水平和B的第j水平的指标值。假设诸之间相互独立,且,则,其中之间相互独立,且。类似上一小节的讨论,得到数学模型: (10.2.1)在上述表达式中,表示总均值,表示A因子的第i水平对指标的单独效果,称为A因子的主效应,表示B因子的第水平对指标的单独效果,称为B因子的主效应。A因子的主效应水平是否显著,对此可以检验假设: (10.2.2)B因子的主效应是否显著,则可以检验假设: (10.2.3)总体样本均值、A的第水平样本均值和B的第水平的样本均值分别为 , , 可以证明 (10.2.4)其中总偏差平方和

13、 A因子偏差(主效应)平方和: ,B因子偏差(主效应)平方和: , 随机误差平方和:总偏差平方和的自由度(独立平方项的个数)为,A因子偏差(主效应)平方和 的自由度为,B因子偏差(主效应)平方和SSB自由度为,误差平方和的自由度为。还可以证明在成立的条件下 (10.2.5)统计量可以作为判断是否成立的检验统计量。在给定显著水平的情况下,当时,则拒绝,认为因子对试验的指标的影响是显著的,否则接受。同理在成立的条件下 (10.2.6)统计量可以作为判断是否成立的检验统计量。在给定显著水平的情况下,当时,则拒绝,认为因子对试验的指标的影响是显著的,否则接受。在实际进行方差分析时,通常将有关的统计量连

14、同分析结果列在一张标上,即如下的方差分析表 表10.2.1 无重复试验的二元方差分析表方差来源平方和自由度均方F值主效应主效应B随机误差MSSE=SSE/(I-1)(J-1)总和例10.2.1 将土质基本相同的一块耕地分成均等的五个地块,每块分成均等的四个小区,四个品种的小麦,在每一地块内随机分种在四个小区上,每一小区小麦的播种量相同,测得收获量资料如下表(单位:斤/块) 表10.2.2 收获量资料表地快B1 地块B2地块B3地块B4地块B5品种A132.334.034.736.035.5品种A233.233.636.834.336.1品种A330.334.432.335.832.8品种A42

15、9.526.228.128.529.4现在考察地块和品种对小麦收获量有无显著影响,取。解 设有两个因子A、B分别表示品种和地块。显然因子A有四水平A1 、A2 、A3、A4,因子B有五水平B1 、B2 、B3、B4 、B5。因此原问题转化为如下的数学问题:直接计算可以得到下列方差分析表 表10.2.3 例10.2.1的方差分析表方差来源平方和自由度均方F值主效应主效应B随机误差134.6514.1026.284 31244.883.532.1920.491.6总和175.0319对品种A,有,说明不同品种对小麦的收获量有显著的影响。对地块B,有说明不同地块对小麦的收获量没有显著的影响。10.2

16、.2重复试验的方差分析在许多实际问题中,往往不只出现单个因素的各个水平状态对实验指标的影响,而可能同时需考虑两个因子对实验指标的影响。这时的方差分析,不仅需要判断各因子对指标的影响是否显著,还要考虑因子各水平之间的相互组合对指标的交互作用。如果两个因子有交互作用,则要考虑每一种组合水平下各作多次试验才能进行方差分析。例如假定要比较一种新型复合肥料与传统肥料对小麦增产的效果又假定所使用的试验地块的地质条件也不同(酸性、碱性或中性等)自然我们会考虑到:除了肥料的不同可能使小麦的单产产生差异之外,地的酸碱性不同也可能使小麦的单元产产生差异。在这种情况下,如果把一种肥料撒到一块地上,而把另一种肥料撒到

17、另一块地上,那么即使这两块地上的小麦单产有显著的差异,也无法判断这种差异是由肥料的不同造成的,还是由地的酸碱性的不同造成的。对此,可以采取如下的作法:假定有三个试验地块,分别为酸性、碱性和中性。我们将每块地划分为块小区,将它们随机地分成两组,每组K块小区,其中一组小区施用传统肥料,另外一组施用新型复合肥料。这样作的结果是:每种肥料和地块的组合(共有6种组合)都进行了K次试验这样,数据的分组可以按肥料分组和按地块分组两种方式,等价地说,决定数据分组的因子有两个,即肥料(因子A)和地块(因子B)。因子A有两个水下,因子B有三个水平。在上述的试验方法下,两个因子的任一水平组合都做了相同次数的试验(K

18、次)这是一个完全平衡的双因子试验。一般,我们假定在一个试验中要考虑两个因子A与B,分别有I水平与J水平,记A因子的I水平为,B因子的J水平为。一个完全平衡的试验,就是要对两个因子的每个不同的水平组合都做相次试验,其中Kl。在水平组合下所得到的响应变量观测值 它表示A的第水平B的第j水平上的第k次实验的指标值。假设诸之间相互独立,且,则,其中之间相互独立,且。在上面的模型中,两个因子不同水平的组合对响应变量的影响的差异表现在分布的均值的差异上。为了更清楚地看清的含义,我们做如下一些变换:, , ,于是得到数学模型: (10.2.7)在上述表达式中,表示总均值,表示A因子的第i水平对指标的单独效果

19、,称为A因子的主效应,表示B因子的第水于对指标的单独效果,称为B因子的主效应,表示A因子的第水平和B因子的第水平在主效应之外,对指标所产生的额外的联合效果,称为交互效应。 在双因子试验的模型中,我们所关心的是:(1)因子的主效应是否显著。假如我们关心A因子的主效应水平是否显著,对此可以检验假设: (10.2.8)或者,假如我们所关心的是B因子的主效应是否显著,则可以检验假设: (10.2.9)(2)检验交互效应的效果是否显著。这时我们检验假设: (10.2.10)双因子检验数据的方差分析主要解决上述三个假设的检验问题。上述假设的检验方法,与在单因子试验数据的方差分析中所采用的方法类似,就是将数

20、据的总平方和分成若干项平方和,其中有的刻画因子的主效应,有的刻画因子的交互效应,有的刻画随机误差的效应,然后构造适当的F统计量进行检验。令, , 分别表示总体样本均值(总平均值),A的第水平与B的第水平的样本均值,A的第水平的样本均值(A组平均值)和B的第水平的样本均值(B组平均值)。总偏差平方和它描述全部数据离散程度(总波动)的大小。容易证明 (10.2.11)其中A因子偏差(主效应)平方和: ,B因子偏差(主效应)平方和: , 交互效应偏差平方和:,随机误差平方和: 与单因子方差分析中平方和的解释及自由度的计算类似,我们可以对上述的平方和给出解释,并计算自由度。总偏差平方和刻画样本对于样本

21、总均值的总离散程度,平方项共有,满足一个约束条件: 因此,的自由度(独立平方项的个数)为。A因子偏差(主效应)平方和 可以解释为A因子主效应的总体效果,平方和项为,满足一个约束条件:,因此SSA的自由度为。类似地,SSB可以解释为B因子主效应的总体效果,自由度为。代表交互效应的总效果,平方和项为,它们之间满足约束条件:,这个约束条件中只有个是独立的,因此SSAB的自由度为。最后再来看误差平方和,它可以看成是随机误差的总度量,平方和项为,满足下列约束条件:因此SSE的自由度为。因此,通过的大小可以反映原假设是否成立。若显著地大于,A因子水平之间差异显著,那么可能不成立。这种比较方差大小来判断原假

22、设是否成立的方法就是方差分析的由来。那么的值大到什么程度可以否定呢?在理论上已经证明在成立的条件下 (10.2.12)统计量可以作为判断是否成立的检验统计量。在给定显著水平的情况下,当时,则拒绝认为因子对试验的指标的影响是显著的,否则接受。同理在成立的条件下 (10.2.13)统计量可以作为判断是否成立的检验统计量。在给定显著水平的情况下,当时,则拒绝认为因子对试验的指标的影响是显著的,否则接受。同理在成立的条件下 (10.2.14)统计量可以作为判断是否成立的检验统计量。在给定显著水平的情况下,当时,则拒绝,认为因子与B对试验的指标的交互作用的影响是显著的,否则接受。在实际进行方差分析时,通

23、常将有关的统计量连同分析结果列在一张标上,即如下的方差分析表表10.2.4 有重复试验的二元方差分析表方差来源平方和自由度均方F值主效应主效应B交互效应AB随机误差总和 例3.2.2为了比较3种松树在4个不同的地区的生长情况有无差别,在每个地区对每种松树随机地选取5株,测量它们的胸径,得到了如下的数据 表10.2.5 三种松树的胸径数据地区1地区2地区3地区4树种123,15,26,13,2125,20,21,16,1821,17,16,24,2714,17,19,20,24树种228,22,25,19,2630,26,26,20,2819,24,19,25,2917,21,18,26,23树

24、种318,10,12,22,1315,21,22,14,1223,25,19,13,2218,12,23,22,19现在考察树种和地区对树的胸径有无显著影响,取。 解 这是一批等重复的两因子数据,记树种因子为A,地区因子为B,则A因子有3水平,B因子有4水平,总共有12个水平组合,每个组合有5个重复观测。假定树的胸径为度量树的生长情况是否良好的数值指标,我们的目标是:由以上数据来判断不同树种及不同地区对松树的生长情况是否有影响(好或坏)?这时要考虑的影响有三种:树种的单独影响(A因子主效应),地区的单独影响(B因子主效应),以及不同树种和不同地区的结合所产生的交互影响(AB因子的交互效应)。方

25、差分析的结果如下表 表10.2.6 例3.2.2的方差分析表方差来源平方和自由度均方F值主效应主效应B交互效应AB随机误差355.649.65106.4882.023648177.816.5517.7318.389.680.900.97总和1393.759 从上面的分析结果,我们来对因子的主效应和交互效应的显著性进行检验。现取显著性水平,查表得到F的临界值: , , 因为 , , 。所以,接受,拒绝与。A因子主效应是显著的,或者说松树的不同种类对树的胸径有显著影响。由于A因子主效应是显著的,我们可以进一步考查A因子不同水平的均值注意到A因子的第二水平为最大:23.55,而第三水平的均值为最小:

26、17.65,可以认为树种2的生长情况优于树种3。能够得出这个结论,得益于观测的等重复性。B因子主效应不显著,或者说不同地区对树的胸径没有显著影响AB因子的交互效应不显著,或者说不同地区对不同的树种的生长没有特别的影响。10.3正交试验设计10.3.1 方差分析法的推广和正交试验法的提出上二节所研究的单因子、双因子试验的方差分析模型中所包含的统计思想和方法可以推广到多因子试验的场合。以3因子模型为例,设有3 因子对响应变量(指标)有影响,分别记为A、B、C,它们的水平数分别为I、J、K。它们对响应变量的影响可以分成如下三种: (1)各因子的主效应,即单个因子的不同水平对响应变量产生的影响。 (2

27、)一阶交互效应,即在扣除主效应的影响之后,任意两个因子的不同水平组合(AB、AC、BC)对响应变量产生的联合影响。 (3)二阶交互效应,即在扣除主效应和一阶交互效应的影响之后,三个因子的不同水平组合(ABC)对响应变量产生的联合影响。与双因子的情况类似,如果在3个因子的每个水平组合上作相同次数试验K,则当试验次数K大于1(有重复)时,可以用全模型(包含全部上述3种效应的模型)进行方差分析,而当试验次数等于1(无重复)时,无法对二阶交互效应分析,而只能分析主效应和一阶交互效应。读者可以仿照上二节的作法,对这两种情况下3个因子方差分析的全部过程列出结果(模型、平方和分解、自由度、F统计量,等等)以

28、上的这些作法可以推广到4因子、5因子、乃至m因子的情况无论有多少个因子,如果在所有因子的每个水平组合上都做至少一次试验,则试验是完全的。为便于进行方差分析,试验应该是等重复的。为能够分析最高阶(m-1)阶交互效应,试验应该是有重复的(重复数大于1)。虽然我们在理论上可以将单因子、双因子方差分析的模型和方法推广到多因子方差分析的情况,但在实践中,做多个因子的完全试验会有实际的困难,因为完全试验所要求的试验次数太多乃至无法实现。例如,假定要考虑5个三水平因子,则完全试验(重复数为1)要求做243次试验;假如再加一个四水平因子,则完全试验(同样重复数为1)要作972次试验如果要能够分析全部交互效应,

29、同时还能够做平方和分解,则试验次数还需加倍!显然,如此多的试验次数在实际应用中几乎是无法实施的。如何解决这个困难呢?在对一个因子试验所建立的线性模型中,独立参数(总均值、主效应、交互效应等)的个数k与试验次数n之间有下面的关系:当nk时,有足够的自由度来估计参数,同时还有剩余自由度来估计误差的方差;当n=k时,有足够的自由度来估计参数,但是没有剩余自由度来估计误差的方差,当nk时,没有足够的自由度来估计参数,同时也没有自由度来估计误差的方差。在因子试验中,除非可以事先确定数据中的随机误差很小,以至可以简单地忽略,否则误差的估计是必要的,它是进行假设检验的前提。因此,如果不能简单忽略随机误差,就

30、应该给误差的估计留下适当的自由度。根据上述的思路,只要试验总次数大于独立参数的个数就可以有足够的自由度来估计参数,同时还有剩余自由度来估计误差的方差,才能进行假设检验。在一个线性模型中,参数(主效应及各种交互效应)的数目是由实际问题本身决定的,而不是由主观决定的。在大量的因子试验实践中,人们发现:在很多情况下,因子之间的高阶交互效应是不存在的,至多存在某些一阶交互效应(即两因子的交互效应),或者只有主效应在这种情况下,多因子试验的模型中包含的参数实际上并不多,可能远远少于全模型的参数比如有6个二水平因子,如果考虑所有可能的交互作用就有64个独立参数,但是如果只考虑主效应则只有7个独立参数因此对

31、6个二水平因子的无交互效应模型,理论上只需做8次试验就可以有多余的自由度来估计误差方差我们知道在生产经营管理活动中,经常要做许多试验。如果试验设计得好,就能用较少的试验次数取得较满意的结果,反之,如果试验设计得不好,虽经多次试验,也不定能取得满意的结果。因此,如何合理地设计试验,是很值得研究的一个问题。在模型中只有主效应的前提下,统计学家发明了一类试验设计的方法,统称为“正交因子设计”,或简单地称为“正交设计”。它的主要内容是讨论如何合理地安排试验以及试验后的数据怎样作统计分析等。在这种试验设计中,可以安排许多因子,而试验次数远远小于完全试验所需的试验次数。应用正交试验进行试验设计,就是在试验

32、前借助于一种现成的规格化的表正交表,科学地挑选试验条件,合理地分析试验结果。从而可以只用较少的试验次数,分清各因素对试验结果(指标)的影响,按其影响大小,找出主次关系并确定最佳搭配方案或最优工艺条件。10.3.2正交表及直观分析法正交表正交表是统计学家和数学家构造的、供实际工作者安排正交试验用的表,是正交试验法中安排试验,并对数据进行直观分析和方差分析的重要工具。正交表实际上就是一个在给定试验次数和因子水平数之后,可以容纳最多因子个数的正交试验表正交表可以分为两大类:单水平正交表和混合水平正交表。在单一水平正交表中,所有因子有相同水平,而在混合水平正交表中,因子有不同水平。单一水平正交表表示为

33、,其中L表示正交表,下标n是正交表的行数,为试验次数,k是正交表的列数,表示试验至多可以安排因素的个数,t是表中不同数字的个数,为因子水平数。例如表示在8次试验中最多可安排7个两水平因子,其表如下:表10.3.1 正交表列号试验号1 2 3 4 5 6 7123456781 1 1 1 1 1 11 1 1 2 2 2 21 2 2 1 1 2 21 2 2 2 2 1 12 1 2 1 2 1 22 1 2 2 1 2 12 2 1 1 2 2 12 2 1 2 1 1 2在实际问题中,如果确定了因子的个数和水平数,并且确认因子之间无交互效应,就可以选用一个能够容纳指定因子的而且试验次数最少

34、的正交表来安排试验。由于是无交互效应模型,因此因子具体安排在表的哪一列是没有限制的。例如,假定有4个两水平因子,由于试验次数最少的两水平表为,最多只能安排3个两水平因子,因此需选用,4个因子可以安排在7列中的任意4列。为便于读者使用,本书将常用正交表列于附录。按照正交表安排好试验后,就可以作试验,得到试验数据后就可以进行直观分析和方差分析。在因子试验中,二水平的因子是遇到最多的,因此正交表也是用得最多的。对二水平的因子,在正交表中通常用1和2分别表示两个水平。如果将表中所有元素2都改成1,就得到一个所有元素都是l和l的n行k列的矩阵X。表中的每一列1和2的个数是相同的,任意两列中组合(1,1)

35、,(1,2),(2,1),(2,2)出现的次数相同,因此矩阵X的每一列1和1的个数是相同,任意两列中,组合(1,1),(1,1),(1,1),(l,1)出现次数相同,由此可见X的列在“向量内积”的意义下是两两正交的。正交表具有下列特点:任意一列中数字重复的次数相同,对于任意两列数字间的搭配是均衡的。 正交试验法的直观分析一般步骤下面通过实例说明下正交表的应用和直观分析的一般步骤例10.3.1为了提高某化工产品的转化率,选择了三个有关因素,反应温度A,反应时间B和用碱量C,各因素所选取的水平为表10.3.2 三因素的水平选择表因素水平A B C (反映温度0C)(反映时间分)(用碱量) 180

36、90 5 285 120 6 390 150 7 如何对试验进行安排呢?我们看到:如果进行全面试验,则需要做27次试验,如果用正交表来安排这项试验,只须做9次试验就够了。具体步骤如下:(1)例中要考察的因素和水平都已确定。对于一般问题是这样考虑:根据试验的目的,确定试验要考察的因素,如果对事物的变化规律了解不多,因素可以多取一些,如果对其规律已有相当了解,可以准确判断主要因素,这时因素可取少一些。每个因素的水平数可以相等, 也可以不等。重要的因素或者特别希望详细了解的因素,水平可多取一些,其余情况水平可取少一些。(2)选择适合试验的正交表。此例是三因素三水平试验,选用比较合适。究竞选用那种正交

37、表,要根据因素和水平的多少以及试验费用的情况而定,一般地讲,要求试验精度高的可选试验次数多的正交表,试验费用较贵的,可选试验次数少的正交表。 (3)因素A、B、C放在正交表的列上。如果有些因素的不同水平改变起来比较困难,应当优先考虑这些因素,把它们放在适当的列上,在这种列上不同水平的改变次数较少,固定一个水平后,要连续做几次试验才改变为另一水平。(4)根据表可知,9次试验的方案是:第一号试验的工艺条件是80,90分,5;第二号试验的工艺条件是80C,120分,6;第九号试验的工艺条件是90C ,150分,6。(5)按试验方案表中载明的各次试验条件进行试验。例中,转化率是试验指标,按设计的方案进

38、行试验,取得数据将所得测得转化率的数据填入试验结果分析表的最右边一栏。表10.3.3直观分析计算数据列号试验号1 2 3(A) (B) (C) 转化率123456789 1(80) 1(90) 1(5) 31 1 2(120) 2(6) 54 1 3 (150) 3(7) 38 2(85) 1 2 53 2 2 3 49 2 3 1 42 3(90) 1 3 57 3 2 1 623 3 2 64k1ik2i k3i 123 141 135 144 165 171 183 144 14441 47 4548 55 5761 48 48R20 8 12优水平A3 B2 C2其中表示第j列中对应水

39、平i的试验指标数据之和,。试验结果的直观分析 (1)从正交试验结果分析表中挑出较好的方案:第九次试验的结果最好,其具体条件是,这是正交试验中较好的方案。(2)计算各因子在相应于同一水平下的试验指标之和及平均试验指标,计算各列的极差。(3)确定因素重要性顺序依照各因素极差大小,排出重要性顺序,极差大的因素表示此因素重要。因素的重要性顺序是A、B、C。(4)确定最佳搭配方案或最优工艺条件,在不考虑交互作用时,只需根据该试验指标的要求(即该指标或是以最高者为优或是以最低者为优)将各因素的最优水平组合起来,再将最优水平组合与试验中的较好方案进行对比试验,从而得到最佳搭配方案或最优工艺条件。例中我们取每

40、个因素平均转化率最高的为优水平,因此,最优水平组合,即最优工艺条件为反映温度900C,反映时间120分,用碱量6。而不在所做的九次试验中,因此,可将这个条件与正交试验中较好的方案比较,对 再做试验的试验结果的转化率为74,从而得最优的工艺条件。10.3.3正交试验法的方差分析法 正交表的直观分析其优点是简单直观,计算量小,但它不能给出误差的估计,因此就不知道分析的精度,即不知道要到怎样的程度,一个因素才算是次要因素。至于怎样进行方差分析与单因子和双因子方差分析类似。下面举例说明: 例10.3.2考虑例10.3.1,我们建立如下数学模型。设为第次试验中产品的转化率(),并记为温度因子的第水平对产

41、品的转化率的影响,为时间因子的第水平对产品的转化率的影响,为用碱量因子的第水平对产品的转化率的影响,。根据表5.3.3我们容易写出这个模型如下: (10.3.1)其中为独立、分布的随机误差;为总均值,如同在全面试验的方差分析模型中的作法一样,我们假定模型中的参数满足下面的约束条件: (10.3.2)容易证明在约束条件(5.3.2)下,的最小二乘估计是 (10.3.3)其中 。还可以证明这些估计是相应的参数的最小方差估计。得到参数估计之后,为了检验因子效应的显著性,与单因子和双因子方差分析类似进行方差分析: 其中总平方和为,它的自由度为8。因子效应的平方和分别为 (10.3.4) (10.3.5) (10.3.6)其自由度分别为2。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1