两水平2k析因分析-1.ppt

上传人:本田雅阁 文档编号:2589674 上传时间:2019-04-13 格式:PPT 页数:72 大小:1.82MB
返回 下载 相关 举报
两水平2k析因分析-1.ppt_第1页
第1页 / 共72页
两水平2k析因分析-1.ppt_第2页
第2页 / 共72页
两水平2k析因分析-1.ppt_第3页
第3页 / 共72页
亲,该文档总共72页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《两水平2k析因分析-1.ppt》由会员分享,可在线阅读,更多相关《两水平2k析因分析-1.ppt(72页珍藏版)》请在三一文库上搜索。

1、1,两水平(2k)析因分析,2,析因设计的基本概念,析因设计(factorial design)是一种多因素的交叉分组实验设计类型,其实验分组由各研究因素的水平全面组合而成。 通过析因设计不仅可检验每个因素各水平间的差异,而且可检验各因素间的交互作用(interaction)。 两个或多个因素间存在交互作用,表示各因素不是各自独立的,而是一个因素的水平有改变时,另一个或几个因素的效应也相应有所改变;反之,如不存在交互作用,表示各因素具有独立性,一个因素的水平有改变时不影响其他因素的效应。,3,2*k因子设计,假设试验中共有k个因子,每个因子都只有两个水平,这些水平既可以为数量性的,如温度、压力

2、;也可以是非数量性的即质量性,如两台机器,两种方法等。设计的安排总共有个2k不同的组合,每个组合下取一个值,总共有2k个,称作2k因子设计或析因分析。,4,22设计,22设计是简单2k因子设计。2个因子,每个因子有2个水平,一般地用“高”或“低”表示。 假设每一个水平组合下作n 次重复实验。 记A表示因子A的效果,B表示因子B的效果,AB表示交互作用AB的效果。 a表示因子A在高水平,因子B在低水平的实验值之和; b表示因子B在高水平,因子A在低水平的实验值之和; ab表示因子A和B都在高水平的实验值之和; l表示因子A和B都在低水平的实验值之和。,5,22设计的因子水平组合,ab=90,b=

3、60,l=80,a=100,因素B,高,1,低,0,因素A,高,1,低,0,6,22设计的因子水平组合,ab=90,b=60,l=80,a=100,因素B,高,1,低,0,因素A,高,1,低,0,因子A的平均效果: 在B的低水平下为:a-l/n 在B的高水平下为:ab-b/n 总平均效果是这两个数的平均值,即 A=ab-b+a-l/2n =ab+a-b-l/2n 因子B的平均效果: 在A的低水平下为:b-l/n 在A的高水平下为:ab-a/n 总平均效果是这两个数的平均值,即 B=ab-a+b-l/2n =ab+b-a-l/2n,7,22设计的因子水平组合,ab=90,b=60,l=80,a=

4、100,因素B,高,1,低,0,因素A,高,1,低,0,交互作用AB的平均效果: 它是在B高水平下与在B的低水平下,A的平均效果之和,即 AB=ab-b+ a-l/2n =ab+a-b-l/2n 在B的低水平下为:a-l/n 在B的高水平下为:ab-b/n 也可以看成是在A高水平下与在A的低水平下,B的平均效果之和,即 AB=ab+l-a-b/2n,8,22设计,因此,因素A,B及AB的效应平方和分别为: 因素A效应的平方和: SA=ab+a-b-l2/4n 因素B效应的平方和: SB=ab+b-a-l2/4n 因素AB效应的平方和: SAb=ab+l-a-b2/4n,9,22设计,某化学反应

5、过程,因素A为反应物的浓度,两水平(15%,25%),因素B为催化剂的使用,两水平(用,不用),每种组和做3次实验。实验数据见表:,10,22设计,SA=208.33 SB=75.00 SAB=8.33 根据方差分析中的总偏差平方和 ST=323.0 SE=31.34,11,22设计,方差分析表,对A,B给出=0.01,对AB给出 =0.05,有 F0.01(1,8)=11.26,F0.05(1,8)=5.23,12,22设计,结论 A,B因素均为重要因素,对化学反应有显著影响。其中A的影响更显著。 交互作用AXB无显著影响。 本案例方法通常称为2k因子设计的标准分析方法。,13,22设计,2

6、2设计的符号规则。 各因子的线性组合按顺序l,a,b,ab写出来,称为标准序,用这个标准顺序表示因子的效果,各项的系数如表。,14,22设计,如果引进符号I表示整个试验的总和全用“+”号,将“+1”“-1”。简化为“+”“-”,并将行与列交换,即得到完整的符号表。,性质: (1)除I列,各列中“+”“-”号个数相等; (2)任意两列同行系数乘积之和为0,即具有正交性。,15,有关析因设计的基本特点,析因设计比单因素设计能提供更多的试验信息,可比较各因素内水平间的差异,还能反映因素间的协同或拮抗作用。 实际工作中可用于筛选最佳治疗方案、药物配方、实验条件等方面的研究。 析因设计的缺点:当因素个数

7、较多时(三个因素以上),所需实验单位数、处理组数和数据处理的计算量剧增。,16,STATISTICA 6.0中Experimental Design模块的主要功能,17,2*6全析因实验设计及分析,一着色剂生产的情况,由于过程的化学机理不是完全清楚,需进行影响因素的试验研究。研究的响应是产品的强度、色泽和亮度,考虑过程的主要影响因素为聚硫化物、回流、摩尔数、时间、溶剂和温度六个,试验采用两水平的全析因设计,共有2*664次试验,所确定的六因素高低限如下表所示:,Factor Setting Low High 聚硫化物 6 7 回流 150 170 摩尔 1.8 2.4 时间 24 36 溶剂

8、30 42 温度 120 130,18,2*6全析因实验设计及分析,最终64组试验数据的全部结果见Textile.sta。部分数据如下:,在许多情形下,考虑两水平下因素对过程的影响是可以的,通过全析因设计,组合各种可能性。但是,随着因素的增加,试验次数将以几何倍数增长,如对一个十因素的两水平全析因设计,需进行2*101024次试验,一般不可能这样去做,这时需考虑部分析因设计。,19,2*6全析因实验设计及分析,部分析因设计的基本做法是使考察主效应(影响)和交互作用都能实现,仅忽略高价交互作用效应。 部分析因设计主要用于筛选实验,从众多因素中找出有大效应的那些因素。在实验的早期阶段,考虑的一些因

9、素有可能对响应只有小的效应或没有效应,这时采用部分析因设计,可有效节省实验工作量。这样能在随后的实验中对那些被确定为主要的因素进行更为深入的研究。 如考虑一个两水平三因素的部分析因设计,可以选2*(3-1)4种实验组合,即A(+,-,-),B(-,+,-),C(-,-,+)和ABC(+,+,+),括号内加减符号表示为水平的高低取值。下表将两水平三因素的全析因设计列出,则两水平三因素的部分析因设计为表中的上半部分。,20,2*6全析因实验设计及分析,2*3全析因设计的符号表,其中I=ABC为设计的定义关系,21,2*6全析因实验设计及分析,有了析因设计及实验结果后,就可选用STATISTICA主

10、窗口中Experimental Design模块的2*(K-p) design (two-level factorial designs) 进行统计分析。 其中 表示区组个数, 表示区组大小。 Experimental Design模块主要进行两方面的工作:如何优化设计实验和分析实验结果。在设计实验时,可根据不同的目的选择相应的方法,这时要注意的是实验评价应该能达到无偏的情况,即改变某因素的设定值,不会对研究其它因素造成影响,各因素和因素间的相互作用关系都清楚。在分析实验结果时,可利用众多的方法和图表来进行统计的分析。,表示区组个数,,22,2*6全析因实验设计及分析,Experimental

11、 Design模块提供了几种图示方法来反映各种因素的影响,其中主要的是因素的正态概率图和Pareto图。 除了聚硫化物、温度和时间之外,其它的主效应和交互作用都集中在一起,且随机分布在零的两边,数据点几乎形成一直线,这充分说明了主效应回流、摩尔数、溶剂以及各种因素间的交互作用对强度作用的影响小。 主效应聚硫化物。温度和时间明显偏离零点,相互分开在图的右上方,说明这三个因素是影响强度的主要因素,且相互之间没有关联,同上面ANONA分析的结果相一致。,23,2*6全析因实验设计及分析,由于主效应模型就可以描述因素间的关系,因此选择无交互作用后,也可作Pareto图(见图)。这图同样清楚地表明了强度

12、主要由聚硫化物、时间和温度这三个因素来决定,并用三因素的线性关系就可描述。 从本例可看到,对正交实验结果用ANOVA来分析处理,就可得到明确的结果,如是非线性的问题,在这样的分析基础之上需作进一步的分析工作。,24,2*6全析因实验设计及分析,25,2*6全析因实验设计及分析,文件的寻找: PROGRAM FILE STATSOFTSTATISTICA 6EXAMPLEDATASETSTEXTILE.STA,26,2*6全析因实验设计及分析,27,2*6全析因实验设计及分析,菜单:STATISTICAINDUSTRIAL STATISTICS & SIX SIGMAEXPERIMENTAL D

13、ESIGN(DOE),28,2*6全析因实验设计及分析,29,2*6全析因实验设计及分析,30,按钮ANOVA TABLE,31,2*6全析因实验设计及分析,32,2*6全析因实验设计及分析,SUMMARY :EFFECT ESTIMATE,33,NORMAL PROBABILITY PLOT t1有一定影响;t2有重要影响;t1影响不大。,34,2*6全析因实验设计及分析,PARETO CHART ,35,如何得到没有交互影响的PARETO图?,在MODEL 卡片NO INTERACTION,36,2*6全析因实验设计及分析,37,2*6全析因实验设计及分析,38,中心复合或响应曲面的 实验

14、设计与分析,研究化工过程中温度和时间对产率的影响是一典型的问题。一般来说,它们之间的关系是非线性的,这时采用响应曲面法来设计和分析是首选的方法之一。这里介绍从试验的设计开始。在Experimental Design模块中,启动Analysis的Startup Panel,选择Central composite, non-factorial, response surface designs,打开 Central Composite (Response Surface) Designs 对话窗,采用两因素标准中心复合设计,进行10次试验,分两区组,即2/2/10。,39,中心复合或响应曲面的 实

15、验设计与分析,从Display/save/print design可看到如下表格:,2*(2) central composite, nc=4 ns=4 nc0=1 ns0=1 Runs=10 - Block A B - 1 1 -1.00000 -1.00000 2 1 -1.00000 1.00000 3 1 1.00000 -1.00000 4 1 1.00000 1.00000 5 (C) 1 0.00000 0.00000 6 2 -1.41421 0.00000 7 2 1.41421 0.00000 8 2 0.00000 -1.41421 9 2 0.00000 1.41421

16、 10 (C) 2 0.00000 0.00000,40,中心复合或响应曲面的 实验设计与分析,表中值为因素水平的标准取值(即因素编码值),为便于用试验数据表示结果及分析,可输入因素设置。用Factor names, values, etc.,输入因素的高、低及中心值,有下表:,| Factor Low Low Center Center High | Name Value Label Value Label Value -+- - A (1) | Time 80.0000 Low 90.0000 CenterPt 100.0000 B (2) | Degrees 140.0000 Low 1

17、45.0000 CenterPt 150.0000,41,中心复合或响应曲面的 实验设计与分析,再从Add to the design中,每区组增加一相同的中心试验。这样做的原因如下:在某些点进行重复试验,可以估计随机测量响应的可靠性,检验残差的统计显著性(这从因素和其交互作用中得不到,见下面的结果与讨论)。如果检验残差是统计显著的,就表明采用的统计分析模型不合适(lack of fit)。,42,中心复合或响应曲面的 实验设计与分析,2*(2) central composite, nc=4 ns=4 nc0=1 ns0=1 Runs=10 + 1 center points per blo

18、ck -+- | Block Time Degrees -+- 1 | 1 80.0000 140.0000 2 | 1 80.0000 150.0000 3 | 1 100.0000 140.0000 4 | 1 100.0000 150.0000 5 (C) | 1 90.0000 145.0000 6 (C) | 1 90.0000 145.0000 7 | 2 75.8579 145.0000 8 | 2 104.1421 145.0000 9 | 2 90.0000 137.9289 10 | 2 90.0000 152.0711 11 (C) | 2 90.0000 145.000

19、0 12 (C) | 2 90.0000 145.0000,43,中心复合或响应曲面的 实验设计与分析,本例涉及到了区组问题。有很多问题,不可能在一个区组内完成全部的析因实验,需将其安排在多个区组内进行,这就是混区设计,这时每个区组内都包含一个部分析因设计。如果考虑区组有2*p个部分析因的情况,而相应的2*k是全析因设计(pk),则部分析因设计将在两区组或四区组内实现。如对一2*2的实验设计,需进行四次实验,而每次实验都需一定量的原材料。当每批原料只够做两次实验,就需两批原料。如把原料的批看作区组,则必须把四次实验中的一半分派到每个区组。,44,中心复合或响应曲面的 实验设计与分析,在Cent

20、ral composite, non-factorial, surface designs 的Analyze results中,选产率为应变量响应,自变量因素是时间和温度,区组变量为区组,就可进入与上例类似的各种数据统计分析选择及结果的界面。 首先来看方差分析。如上所述,本例在试验设计中每区组增加了一个相同的中心点,以消除试验误差带来的影响。用线性模型(Linear main-effects only),从ANOVA表中,可得下面结果:,45,中心复合或响应曲面的 实验设计与分析,从表中可以看出,只有Lack of Fit是边际显著的(p0.1),表明线性模型太简单了,属于模型不合适的情况。,

21、ANOVA; Var.:YIELD; R-sqr=.11794; Adj:0. (composit.sta) -+- | 2 factors, 2 Blocks, 12 Runs; MS Pure Error=2.3525 | DV: YIELD: Yield of process in grams -+- Factor | SS df MS F p -+- Blocks | 8.6700 1 8.67000 3.68544 .194876 (1)TIME (L) | 15.3177 1 15.31769 6.51124 .125348 (2)DEGREES (L) | 1.0482 1 1.

22、04823 .44558 .573152 Lack of Fit | 182.5357 6 30.42262 12.93204 .073506 Pure Error | 4.7050 2 2.35250 Total SS | 212.2767 11,46,中心复合或响应曲面的 实验设计与分析,如用二次模型(选择Lin/quad main eff.+2-ways),再来看ANONA表: 结果显示出交互作用效应(? by ?)及二次效应(Q)不是统计显著的(p0.05)就是边际显著的(p0.1),都需在模型中加以考虑。,ANOVA; Var.:YIELD; R-sqr=.92737; Adj:.8

23、4021 (composit.sta) -+- | 2 factors, 2 Blocks, 12 Runs; MS Pure Error=2.3525 | DV: YIELD: Yield of process in grams -+- Factor | SS df MS F p -+- Blocks | 8.6700 1 8.67000 3.68544 .194876 (1)TIME (L) | 15.3177 1 15.31769 6.51124 .125348 TIME (Q) | 29.4122 1 29.41225 12.50255 .071510 (2)DEGREES (L) |

24、 1.0482 1 1.04823 .44558 .573152 DEGREES (Q) | 61.2562 1 61.25625 26.03879 .036325 1L by 2L | 95.0625 1 95.06250 40.40914 .023865 Lack of Fit | 10.7128 3 3.57094 1.51793 .420810 Pure Error | 4.7050 2 2.35250,47,中心复合或响应曲面的 实验设计与分析,有了这结果,就可看参数估计和系数。选择Main effects & interactions,有:,Std.Err. -95.% +95.%

25、 Factor Coeff. Coeff. Cnf.Limt Cnf.Limt -+- Mean/Interc. | 87.37500 .766893 84.07533 90.67467 BLOCK(1) | -.85000 .442766 -2.75507 1.05507 (1)TIME (L) | -1.38373 .542275 -3.71695 .94949 TIME (Q) | -2.14375 .606282 -4.75237 .46487 (2)DEGREES (L) | .36198 .542275 -1.97124 2.69520 DEGREES (Q) | -3.09375

26、 .606282 -5.70237 -.48513 1L by 2L | -4.87500 .766893 -8.17467 -1.57533,48,中心复合或响应曲面的 实验设计与分析,由表中系数项的数值可以写出产率预测的二次关联的表达式: 式中没有包含区组系数,原因是区组影响不重要。一般在预测式中,区组值取零。上式中的系数是根据编码因素值(1, 0, or a)回归得到的。,49,中心复合或响应曲面的 实验设计与分析,如用实际试验因素值,可从Regression coefficients中得到上面类似的结果:,Regressn Std.Err. Factor Coeff. Pure Err

27、 t(2) p -+- Mean/Interc. | -3958.53 558.7502 -7.08462 .019347 BLOCK(1) | -.85 .4428 -1.91975 .194876 (1)TIME (L) | 17.86 2.4779 7.20684 .018715 TIME (Q) | -.02 .0061 -3.53589 .071510 (2)DEGREES (L) | 44.73 7.1679 6.24102 .024726 DEGREES (Q) | -.12 .0243 -5.10282 .036325 1L by 2L | -.10 .0153 -6.3568

28、2 .023865,50,中心复合或响应曲面的 实验设计与分析,有了回归系数及公式,可以预测效应的值。从Predict dep. var. values中输入下面内容:,BLOCK(1): 0 TIME: 100 DEGREES: 150,Predicted Value; Var.:YIELD; R-sqr=.92737; Adj:.84021 -+- | 2 factors, 2 Blocks, 12 Runs; MS Pure Error=2.3525 | DV: YIELD: Yield of process in grams +- | Regressn Coeff.* Factor |

29、 Coeff. Value Value -+- Constant | -3958.53 BLOCK(1) | -.85 0.00 0.00 (1)TIME (L) | 17.86 100.00 1785.79 TIME (Q) | -.02 10000.00 -214.37 (2)DEGREES (L) | 44.73 150.00 6710.23 DEGREES (Q) | -.12 22500.00 -2784.37 1L by 2L | -.10 15000.00 -1462.50 Predicted | 76.24 -95.% Conf. | 71.02 +95.% Conf. | 8

30、1.46,得到的产率预测值是76.24。,51,中心复合或响应曲面的 实验设计与分析,同样,可以用Block(0),从Surface中得到响应面和等值线图:,52,中心复合或响应曲面的 实验设计与分析,53,中心复合或响应曲面的 实验设计与分析,54,中心复合或响应曲面的 实验设计与分析,CHANGE FACTOR NAMES, VALUS,et,55,中心复合或响应曲面的 实验设计与分析,ADD TO DESIGNNUMBER OF CENTRAL POINTS,56,中心复合或响应曲面的 实验设计与分析,增加中心点的重复试验:,57,中心复合或响应曲面的 实验设计与分析,FILEOPEND

31、ATASETS-COMPOSITE,58,中心复合或响应曲面的 实验设计与分析,STATISTICAINDUSTRIAL STATISTICS & SIX SIGMAEXPERIMENTAL DESIGN(DOE),59,中心复合或响应曲面的 实验设计与分析,60,中心复合或响应曲面的 实验设计与分析,61,中心复合或响应曲面的 实验设计与分析,ANOVAL TABLEP 0.1不重要(黑字),62,中心复合或响应曲面的 实验设计与分析,LINEAR+QUAD ,ANOVAL TABLEP 0.1不重要(黑字),63,中心复合或响应曲面的 实验设计与分析,LINEAR+QUAD+2WAYS P

32、 0.05重要(红字),64,中心复合或响应曲面的 实验设计与分析,65,中心复合或响应曲面的 实验设计与分析,66,中心复合或响应曲面的 实验设计与分析,方程回归系数: 根据编码(-1,0,1)获得方程系数。,67,中心复合或响应曲面的 实验设计与分析,实际实验因素值,回归得到的结果:,68,中心复合或响应曲面的 实验设计与分析,PREDICTION & PROFILINGPREDICTED DEPENDENT VARIABLE VAL,69,中心复合或响应曲面的 实验设计与分析,70,中心复合或响应曲面的 实验设计与分析,71,中心复合或响应曲面的 实验设计与分析,SURFACE PLOTBLOCK1,72,中心复合或响应曲面的 实验设计与分析,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1