南京理工大学应用数理统计PPT(第八章 正交实验设计).ppt

上传人:本田雅阁 文档编号:3318291 上传时间:2019-08-12 格式:PPT 页数:56 大小:950.04KB
返回 下载 相关 举报
南京理工大学应用数理统计PPT(第八章 正交实验设计).ppt_第1页
第1页 / 共56页
南京理工大学应用数理统计PPT(第八章 正交实验设计).ppt_第2页
第2页 / 共56页
南京理工大学应用数理统计PPT(第八章 正交实验设计).ppt_第3页
第3页 / 共56页
南京理工大学应用数理统计PPT(第八章 正交实验设计).ppt_第4页
第4页 / 共56页
南京理工大学应用数理统计PPT(第八章 正交实验设计).ppt_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《南京理工大学应用数理统计PPT(第八章 正交实验设计).ppt》由会员分享,可在线阅读,更多相关《南京理工大学应用数理统计PPT(第八章 正交实验设计).ppt(56页珍藏版)》请在三一文库上搜索。

1、1,第八章 正交实验设计 (experiment design ),8.1 因素(factor)与水平(level),因此如何合理地安排试验,如何对试验的结果进行科学的分析,就成为人们十分关心的问题。在工农业生产的推动下,这方面的实践和研究形成了统计学的一个重要分支试验设计,并得到了广泛的应用。,我们遇到的实际问题,一般都是比较复杂的,包含有多种因素,各个因素又有不同的状态,它们互相交织在一起。为了寻求合适的生产条件,就要对各种因素以及各个因素的不同状态进行试验。,2,例811 提高某种农药收率的试验 某农药厂生产某种农药,根据生产经验,发现影响农药收率的因素有4个,每个因素都有两种状态,具体

2、如下: A反应温度: 60 80 B反应时间: 2.5小时 3.5小时 C配比(某两种原料之比): D真空度: 500毫米汞柱 600毫米汞柱,3,我们通常称影响试验指标的因素为因子, 用大写字母A,B,C,表示; 可能处于的状态称为水平,用该字母加上足标表示。 例如, , 表示因子A的第一,第二,水平等。 我们把实验中需要考虑多个因子,而每个因子又有多个水平有待考查的试验问题称为多因子试验问题。,例8.1.1就是四个两水平的因子试验问题。,4,我们希望通过试验解决的问题是: (1)找出各因子对指标的影响规律,哪个因子是主要的,哪个是次要的?哪些因子除了各自的单独作用外,它们之间还产生综合效果

3、?这种综合效果有多大?对指标的影响,综合效果是主要的,还是因子的单独作用是主要的? (2) 选出各因子的一个水平来组合成比较合适的生产条件,以下通称最优生产条件,这里的最优是对试验所考察的因子和水平而言。,5,上面的问题对例8.1.1来说,从四个因子的每个因子的两个水平中选一个水平的所有搭配共有 种,显然,所有16种可能搭配都进行试验,再经过试验结果的处理就可以获得问题的圆满解决。,能否只作其中一小部分试验,通过分析就可以获得问题的圆满解决呢?在比较复杂的多因子试验中,这个问题就更突出了。,例如考查的因子有九个,每个因子有三个水平,则这一试验问题中,所有可能的搭配有 种,要逐个进行试验,显然是

4、不可能实现。,6,(1)所有可能搭配的试验次数与实际可行的试验次数之间的矛盾。 (2)实际所作少数试验与要求全面掌握内在规律之间的矛盾。,为了解决第一类矛盾,要求必须合理地设计和安排试验,以便通过尽可能少的试验次数,就可抓住主要矛盾。 为解决第二类矛盾,要求我们对试验结果作科学的分析,透过现象看本质,认识内在的规律,为解决问题提供可靠的依据。,因此多因子试验问题的突出矛盾是:,7,下面介绍的正交试验设计方法就是一种研究多因子试验问题的重要数学方法。它主要使用正交表这一工具来进行整体设计、综合比较、统计分析。,它使用正交表从所有可能搭配中一下就挑出若干必需的试验,然后再用统计分析方法对试验结果进

5、行综合处理,解决问题。目前试验设计已在冶金、化工、橡胶、纺织、医药卫生等方面得到了有效的应用。,8,若被考查的n个因子都取三个水平,则称为 因子试验问题。,多因子试验的分类。 在考查A,B,C,D,等n个因子对指标y的作用时,若每个因子都取两个水平,则称为 因子试验问题。,若被考查的因子有n+m个,其中,其中n个因子取两水平,m个因子取三水平,则称为 因子试验问题。,9,8.2 正交表,正交表是试验设计中合理安排试验,并对数据进行统计分析的主要工具。 正交表用符号 表示。 “ L ”代表正交表, “ p ”表示表中的行数,即要作的试验次数, “ m ”表示表中有m列,即最多允许安排的因子个数,

6、 “ n ”表示水平数。 可以证明:n,m,p满足,10,11,表称为正交表是因为它具有以下两个性质: (1)整齐可比性 每一列中,不同的数字出现的次数相等。 (2)均衡搭配性 任意两列中,将同一横行的两个数字看成有序数对时,每种数对出现的次数相等。这里有序数对共有四种:(1,1),(1,2)(2,1),(2,2),且它们各出现一次。 凡满足上述两个性质的表就称为正交表。,正交表还有如下性质: (3)正交表的任两行(或任两列)交换,它仍是正交表。 (4)某一列中各数码作对换或轮换,它仍是正交表。,12,8.3 正交试验设计,1、 试验计划的制订,表8.3.1 正交表,13,在表8.3.1的各因

7、子列中,在数字“1”和“2”中的位置分别填上各该因子的1水平和2水平,就得到一张试验计划表,如下:,14,在测得8个数据后,如何科学地分析这些数据,从而得出正确的结论,这是试验设计的重要步骤。在比较中要鉴别的内容是: (1) 在4个因子中,那些因子对收率的影响大,那些因子对收率的影响小? (2) 如果某个因子对试验数据的影响大,那么它取哪个水平对提高收率最有利? 第一个问题要在比较4个因子中获得解决,第二个问题要在比较每个因子的两个水平中获得解决。先解决第二个问题。,2、综合比较直观分析法,15,例如,对因子A(反应温度),怎样比较它的两个水平对收率的影响? 这里做了8次试验,直接从这8个数据

8、中两两比较是不行的,因为这8个试验条件没有两个是相同的,没有比较的基础。 如果把这8个试验数据适当组合起来,便会发现某种可比性,这就是正交设计特具的综合可比性。,以因子A为例。A的1水平 出现在上表中的第14号试验中,这四个试验收率的平均数是,16,A的2水平 出现在上表中的第58号试验中,这四个试验收率的平均数是,和 就具有可比性,因为在条件 下的四次试验中,因子B、C、D皆取遍两种水平,而且两种水平出现的次数相同,各为2次;同样,在条件 下的四次试验中,因子B、C、D也皆取遍两种水平,而且两种水平出现的次数相同,各为2次。,17,即对于在 下的四次试验和 下的四次试验来说,虽然其它条件(B

9、、C、D)在变动,但这种变动是“平等的”,所以 和 之间差异反映了A的两个水平的不同,由于,所以说因子A 取 时平均收率较高。 同样可以比较因子B、C、D的两个水平的好坏, 各项计算都可以在正交表上进行,十分简便。,18,19,我们从表的最后一行的正负可以看出,因子A取 比 时收率高; 因子B取 比 时收率高; 因子C取 比 时收率高; 因子D取 比 时收率高;,因此在只考虑因子单独作用的情况下, 可选择 作为最优生产条件。,20,直观上容易看出,一个因子对实验的结果影响大,就是主要的。所谓影响大,就是这因子的不同水平的平均收率之间的差异大。相反,一个因子对试验的影响小,就是次要的。即这因子的

10、不同水平的平均收率之间的差异小。从表的最后一行的绝对值的大小可见,因子C的两个水平之间的差异最大,是主要矛盾。其次是因子B和因子A,再次是因子D。注意:当试验范围或试验条件发生改变时,矛盾的主要和非主要方面可以相互转化。,现在,我们在A、B、C、D四个因子中,来分清主次,抓住主要矛盾,即解决开始时提出的问题 。,21,8.4 交互作用 (interaction),一、交互作用定义,一般在一个试验里,不仅各个因子在起作用,而且因子之间有时会联合起来影响某一指标,这种作用称为交互作用。,例841 某生产队对土地大体相同的四块大豆试验田,用不同的方式施用氮肥(N)和磷肥(P),结果第一块不加氮、磷肥

11、,平均亩产400斤;第二块只加6斤氮肥,平均亩产430斤;第三块只加4斤磷肥,平均亩产450斤;第四块只加6斤氮肥,4斤磷肥,平均亩产560斤。列表如下:,22,从表中看出,只加4斤磷肥,亩产增加50斤,只加6斤氮肥,亩产增加30斤,而氮、磷肥都加,亩产增加160斤。这说明,增产的160斤除了氮肥的单独效果30斤和磷肥的单独效果50斤以外,还有它们联合起来所发生的影响,而 (560400)(430400)(450400) =1603050=80(斤) 就反映了这种联合起来的影响。在正交试验设计中,把这个值的一半称为N和P的交互作用,记为NP。即,23,在正交试验设计中,把这个值的一半称为N和P

12、的交互 作用,记为NP。即,24,按此方法,我们可以计算出例8.1.1中因子A和B的交互作用,计算如下:,25,因子A 和因子B的交互作用AB就等于将上式乘以 1/2 ,即,同样可以算出AC,BC如下:,26,二、交互作用列,因子间的交互作用可在正交表 上直接算出。 例如AB的值,可看出恰好是表第3列“1”对应的y值减去“2” 对应的y值的平均。 也就是说,如果因子A放在第1列,因子B放在第2列,那么第3列就是它们的交互作用AB。 参照上面的算式和正交表 ,可见A与C的交互作用AC就是第5列,B与C的交互作用BC就是第6列。 8.4.1就是对应于 的交互作用表。,27,表8.4.1 两列间的交

13、互作用表,28,从8.4.2 可看出因子A、B的交互作用很大,超过A、B单独对收率的影响,我们应着重考虑AB,为此,根据表8.4.2算出A、B之间四种搭配下的平均值如下表8.4.3,29,从上表可见,A、B之间的最好搭配是 。 前面我们只根据各因子对收率的单独作用而选定最优生产条件 ,根据上面的分析,应改成 。 这个试验条件在所安排的8次试验中是没有的。但通过分析,好的生产条件将不会漏掉。 这是我们利用了正交表特具的综合可比性,选做一组(8次)有代表性的试验,对每个因子的所有水平全面进行了优选的缘故。,30,31,三、 正交表设计和直观分析的优缺点,优点: 利用正交表挑选一部分有代表的试验,减

14、少试验次数;利用正交表进行整体设计,可以同时做一批试验,缩短了试验的周期; 只需作少量的计算,就可获得重要的信息,可直接比较各因子,还可比较因子间交互作用对指标的影响,从而选出最优条件。 缺点:不能给出误差的估计,从而也就无法知道分析的精度。,32,四、自由度和正交表的选用原则,1选表和表头设计,正交试验设计在制定试验计划中, 首先必须根据实际情况,确定因子、因子的水平以及需 要考察的交互作用;,选取一张适当的正交表,把因子和需要考察的交互作用合理安排到正交表的表头上。 正交表的选用是很灵活的,没有严格的规定,必须具体问题具体分析。可遵循的一条原则是:要考察的因子及交互作用的自由度总和必须不大

15、于所选正交表的总自由度。,33,2、自由度的计算,(1)正交表的总自由度 =试验次数1; 正交表每列的自由度 =此列水平数1 (2)因子A的自由度 =因子A的水平数1; 因子A、B间的交互作用的自由度,34,3、一般表头设计的基本步骤,(1)首先考虑交互作用不可忽略(包括一时不知能否忽略)的因子,按不可混杂的原则,将这些因子及交互作用在表头上排妥。 (2)再将其余可以忽略交互作用的那些因子任意安排在剩下的各列上。 显然同一个试验问题,即使用同一张正交表,表头设计也可以不一样,对例8.1.1,35,如下的表头设计:表8.4.3,尽管和前面的表头设计不一样,实践证明这将不影响最终的分析结果,即判别

16、因子和交互作用所起影响的大小以及最优生产条件的选取是一样的。,36,8.5 水平数相等的多因子试验设计和分析,一、 因子的试验设计及其直观分析法,例851 在例8.1.1中在实践基础上明确要考察四个因子A、B、C、D和交互作用AB,而交互作用AC和BC希望在不增加试验次数的情况下能照顾考虑。 计算一下自由度,总的自由度为41+11=5,即最少需用 来安排试验计划,做8次试验。,(1)首先考虑要考察交互作用的因子A 和B,将A 放在第1列,B放在第2列,由 的交互作用表得AB占第3列。,37,(2)再考虑要照顾到交互作用的因子C,我们将C放在第4列,这时AC占第5列,BC占第6列,仍有7列空着可

17、以放因子D,于是得表8.4.3的表头设计。将A、B、C、D所在列抽出来就是试验计划。 如果在例8.1.1中,交互作用AB,AC,AD,BC,BD,CD都要通过试验考察,我们还是选用表 ,并将A放第1列,B放第2列,C放第4列,D放第7列。,38,交互作用间产生混杂,这种表头设计是不合理的。能不能重新设计以避免这种混杂现象发生呢?计算一下自由度可知, 共有8-1=7个自由度,现在要考察4个因子和6对交互作用,故自由度的总和为41+61=10,,39,显然,我们是用增加试验次数为代价来避免混杂的。凡是可以忽略的交互作用要尽量剔除,以便用较小的正交表来制定试验计划。而那些交互作用可以忽略必须依赖实践

18、经验和专业知识来判断。,可见 容纳不了这个多因子试验问题,只有选用更大的正交表如 才能避免这种混杂现象,所做的表头设计如下:,40,二、 因子的试验设计及其直观分析法,例851 研究氯乙醇胶在各种硫化系统下的性能,需要考察的因子及水平如下:,41,根据专业知识,交互作用可全部忽略。,(1)根据正交表,进行表头设计。 由于A、B、C都是三水平因子,故选用三水平正交表,三水平正交表与二水平正交表的重要区别:它的每两列的交互作用是另外两列,而不是一列。这是因为,三水平正交表每列的自由度为2,而两列的交互作用的自由度等于两列的自由度相乘,即22=4所以要占两个三水平列。有表可查。,在本例中,选三个三水

19、平因子在正交表中占三列,将A、B分别放在第1,2列,由于AB可忽略,所以改放其它因子,将因子C放在第3列上,得:,42,(2)试验设计与试验结果,试验计划如下,试验结果一列数值越接近零越好。,具体计算在正交表上直接进行,见表8.5.1,43,44,8.6 方差分析,对于多因子试验,试验结果差异是: 由于各因子水平变化所引起 试验误差(包括未加控制或无法控制的因子的变化)所引起。,方差分析的目的就在于将试验误差所引起的结果与试验条件的改变(即各因子不同的水平变化)所引起的结果差异区分开来,以便能抓住问题的实质。还要将影响试验结果的主要因子和次要因子区分开来,以便集中研究几个主要因子。,45,例8

20、61 某一种抗菌素的发酵培养基由黄豆饼粉、蛋白、葡萄糖、碳源1号、 、 、无机盐1号等组成。现打算对其中五个成分的最适配比,以及最适装量,按三种水平进行试验,并将其中两个成分(黄豆饼粉与蛋白)合并为一个因子,这样构成一个五因子三水平试验。 A黄豆饼粉蛋白() :0.5+0.5, :1+1, : 1.5+1.5 B葡萄糖() :4.5 :6.5 :8.5 C ( ) :0. :0.01 :0.03 D碳源1号() :0.5 :1.5 :2.5 E装量(毫升/250毫升三角瓶) :30 :60 :90,46,此外还需考察交互作用AB、AC、AE。 总自由度为5(3-1)+3(3-1)(3-1)=2

21、2, 为此查表 ,它有26个自由度,可选它来进行表头设计的尝试。得到了一张实现这一计划的试验结果。,47,表8.6.1 试验计划与结果,48,表8.6.2 计算表,49,50,如果还用直观分析法,就有以下两个问题: 由于没有对试验的误差进行估计,故无法分清某个因子的三水平所对应的试验结果的差异; 由于三水平因子的交互作用要占两列,根据直观分析就无法考察交互作用影响的大小。,(1)计算各因子水平变化引起的差异,,化简得,由于三水平因子间的交互作用占两列,所以因子间交互作用的偏差平方和应为两列的偏差平方和相加。例:,51,(2)误差的偏差平方和的计算 对于正交表中误差的偏差平方和的计算,可以利用正

22、交表中未排因子的空白列的偏差平方和来计算; 如果其它列的偏差平方和与空白列的偏差平方和相接近,那也以合并起来作为5误差估计。 , 及 原是考察AB、AE的,经计算其数值与空白列相近,说明A与B、A与E之间不存在交互作用。,52,因子及其交互作用的显著性检验 分别计算因子的F比如下:,53,方差分析表,54,对于显著的交互作用AC作如下的交互作用表: 交互作用表,注:要区分各因子对指标影响是否显著,须先求出误差的估计,而是通过正交表中的空白列获得的,我们在今后的表头设计中需留出一些空白列,供方差分析用。,55,一般所用的计算公式,(1) 各列偏差平方和 的计算,其中 分别为第列中与水平“1”,“2”,对应的数据 之和(在重复 m 次试验时, 表示同一号试验的m个 数 据的合计),p为列中水平的重复数,m为重复取样数,CT为不变项,56,9个试验点的分布,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1