试验设计和数据统计分析.ppt

上传人:本田雅阁 文档编号:3498186 上传时间:2019-09-04 格式:PPT 页数:68 大小:234.05KB
返回 下载 相关 举报
试验设计和数据统计分析.ppt_第1页
第1页 / 共68页
试验设计和数据统计分析.ppt_第2页
第2页 / 共68页
试验设计和数据统计分析.ppt_第3页
第3页 / 共68页
试验设计和数据统计分析.ppt_第4页
第4页 / 共68页
试验设计和数据统计分析.ppt_第5页
第5页 / 共68页
点击查看更多>>
资源描述

《试验设计和数据统计分析.ppt》由会员分享,可在线阅读,更多相关《试验设计和数据统计分析.ppt(68页珍藏版)》请在三一文库上搜索。

1、试验设计和数据统计分析 (第一部分),技术培训资料 徐泽平 2011年6月17日,试验设计,引言 科学研究 调查研究 发现新物种,新机制,发现新原理 达尔文,鸟喙,环境导致变化,生物进化,物竞天择;同一器官不同生物的比较研究,物种起源 比较的是差异 技术系统进化 科学实验 新元素、新物质,居里夫人 新工艺、新装备,航空动力燃料、催化剂 新功能,新用途,阿司匹林,试验设计,实验-试验,课题-小项目,大问题-具体内容方法 广义的:研究课题设计 立题依据/目的、研究进展、技术路线、试验方案措施、进度安排(年度计划)、设备材料、经费预算 侠义的:统计设计 试验材料选择 处理的分配:因素、水平 重复数确

2、定 分组方法,试验设计,试验设计三阶段 拟定试验设计:合理、周密 按设计实施试验 对试验结果统计分析 设计正确就奠定了基础: 较少的人力物力时间,获得丰富可靠的资料 实验设计的目的 避免系统误差,减少实验误差,提高精确度 不影响结果精确性前提下,减少试验次数。,试验设计,试验指标:衡量试验效果的量 数量指标(得率/产量、含量/吸光度) 发酵过程中菌丝体产量/得率 多糖产量/得率 质量:能感觉(颜色、形态、分级指数) 葡聚糖的性状 无定形粉末,晶体 有机溶剂:分析纯、化学纯、色谱纯 食品级、饲料级、肥料级,试验设计,试验因素:影响试验指标的条件 物料的粒度 溶剂种类(极性、非极性) 比例(固体液

3、体比例) 提取时间 温度 次数 搅拌速度,试验设计,水平:因素根据质或量所处的状态或等级 一个因素取M水平,则该因素为M水平因素 因素A温度:30、40、50,则A为3水平因素 因素B浓度:20%、50%,则B为2水平因素 处理:各因素不同水平间的搭配,即同一条件下所做的试验个数。 如上述,6个处理 单因素试验中处理和水平是一致的,试验设计,效应:试验因素对试验指标所起的作用, 简单效应:某因素在同一水平基础上,比较另一因素不同水平间对试验指标的影响 单因素试验 主效应:各因素的简单效应的平均 互作效应:某因素各水平下对另一因素简单效应的差的平均值,试验设计,试验设计的基本要求 代表性:样本数

4、、条件 正确性:准确性、精确性 重演性/重复性:条件、措施 试验类型 一般调查:全面调查(总体)、抽样调查 控制试验:一定数量、有代表性、一定试验条件 单因素试验:阐明因素的简单效应,探索适宜水平 多因素试验:可分析简单效应、主效应、互作效应,2-3个因素 正交设计、均匀设计,试验设计,试验计划拟定 课题研究目标试验预期效果确定试验指标 结合试验条件选择试验设计方法 试验记录项目:表格形式,主要指标辅助指标 结果分析方法:明确采用的统计方法,提出应收集的必要数据 明确试验条件:材料、药品、设备、经费 时间地点人员,试验设计,试验方案拟定试验设计的关键 试验方案是整个试验处理的总称 单因素试验:

5、考察因素的水平 多因素试验:各因素的水平组合 确定试验因素:单因素还是多因素 确定因素水平:间隔恰当;等间隔原则 设置对照组(Control):其他条件一致 空白对照、标准对照、相互对照、自身对照 处理间遵循唯一差异原则:其他条件一致 设置预试验,试验设计,试验设计基本原则1 重复:2个以上实验单位,相同条件,实验重复2次以上 作用: 消除偶然误差,消除实验外条件因素影响 意义:通过重复,方差分析时,定量地将误差计算出来,定量的评价误差的大小; 重复可使个因素和水平均有机会组合搭配到。,试验设计,试验设计基本原则2 随机化:实验配置和顺序,无主观意愿,完全随机安排,包括个方面: 因素水平随即化

6、 实验顺序随机化 随机化方法:抽签、抓阄、随机数表 目的:避免主观偏差,消除系统误差 统计分析的基础,只有随即数据才符合统计分布规律,试验设计,试验设计基本原则3 局部控制:实验条件局部一致 按照一定标准将实验对象和实验环境等实验条件,如日期、地区、装置、原材料等分成部分或区、组,以实现局部控制; 例:肥效实验,分季节、分地区(土壤)、分作物进行分批实验,几种统计比较,得出结论。,试验设计,试验设计,试验设计方法调查设计:原料检测 抽样原则:样本来自总体;有代表性 抽样方法:随机、顺序、群组、分层 抽样误差: 抽样得到的样本可计算统计量:平均数、标准差,统计量和参数的差值由抽样产生 抽样误差用

7、 “标准误”衡量 样本含量:小样本6,大样本30,试验设计,试验设计方法 完全随机设计,动物试验 完全随机的分配处理,每一动物具有相等的机会接受任意处理 分组方法:抽签、抓阄、随机数表 试验结果的统计分析方法 单因素试验:2水平,分析2处理平均数的差异显著性非配对试验t检验;多水平的采用单因素方差分析 两因素试验:每处理1试验单位无重复方差分析,2个以上实验单位有重复方差分析 优缺点:处理数与重复数不受限制,统计分析容易;精密度较低,降低了检验灵敏度。,试验设计,试验设计方法 交叉设计个体差异难以消除时 大动物,牛,难以找到12个一样的;生产设备,难以同时开3套 试验对象分期接受不同处理 交叉

8、设计成立条件:无互作、无残效、样本一定 统计分析方法:统计假设检验,t检验,检验,试验设计,试验设计基本程序 实验目的:深入了解,认真分析 因素水平的确定:首先了解哪些因素可能对试验结果产生影响 指标确定:必须考虑指标对所研究问题提供什么信息,如何测定该指标 实验计划的确定:分辨试验处理间最小差异程度和允许冒多大的风险,以据顶重复次数。如何收集数据,如何随即排列; 试验设计实施:采集数据的过程 数据分析:统计分析,平均差异、统计显著性 结论与应用,试验设计,试验设计种类 正交试验设计 安排多因素试验、寻求最优水平组合的一种高效率试验设计方法 利用正交表安排与分析多因素试验 特点:部分试验代替全

9、面试验 原理:从优选区挑选有代表性的部分试验点。用正交表进行挑选 L9(34):27个试验点选9个,试验设计种类 均匀试验设计 只考虑试验点在试验范围内均匀分布的试验设计方法,适于多因素多水平 5因素31水平,只试验31次,相当于2800万次 与正交设计相比,大幅度减少试验次数 1978年,方开泰、王元 原理:方差分析:均匀分散、整齐可比,均匀设计提高均匀分散,使试验点更具代表性; 回归设计和黑箱原则 均匀设计表,U7*(74)4因素7水平,试验设计种类 拉丁方设计 希腊拉丁方设计 回归正交设计 一次回归正交设计、二次回归正交设计 回归旋转设计 二次旋转组合设计、通用旋转组合设计,试验设计,正

10、交试验设计 因素水平越多所得结论越可靠。34=81,25=32 正交设计,多因素水平,压缩试验规模 适于多因素水平、误差大、周期长的试验 适于筛选出主要因素及最优水平的试验 正交表,规格化表格,N行k列组合的矩阵 LN(mk),L正交,N试验次数,k因素数,m水平数 L4(23),3因素2水平4次试验 L9(34),4因素3水平9次试验,试验设计,试验设计,正交表,试验设计,正交表的性质: 正交性 任一列中不同数字出现次数相等,任意因素不同水平的试验次数相等 任两列间同横行的有序数对出现次数相等,两因素间的水平搭配相等 代表性(均衡分散性) 包括所有因素的所有水平;任意两因素的试验组合为全面试

11、验; 试验点均匀分布 综合可比性:水平次数相等,因素试验条件相等,试验设计,正交设计特点 均衡分散性,处理均匀分布,代表性强 整齐可比性,各水平间的比较条件相同 试验次数少,试验设计,正交表的类别 等水平正交表 水平数相同的正交表 L4(23)、L8(27)2水平正交表 L9(34)、L27(313)3水平正交表 混合水平正交表 水平数不完全相同 L8(4x24)表中,有一列的水平数为4,有4列的水平数为2。该表可安排1个4水平因素和4个2水平因素。,试验设计,正交试验设计步骤 试验目的与要求 本次试验要解决什么问题 确定试验指标 试验结果如何衡量,定出试验指标 定量指标:强度、硬度、产量、得

12、率、成本 定性指标:颜色、口感、光泽 定性指标定量化:相关标准打分;模糊数学处理量化,试验设计,正交试验设计步骤 确定考察的因素水平 根据预实验、以往经验、前人研究结果设立,影响大的、未试验过的、尚未掌握规律的优先考虑 2-4水平 水平间距合理,尽可能理想水平 列出因素水平表,试验设计,试验设计,正交试验设计步骤 选择合适的正交表 选择原则:能够安排下试验的因素和交互作用,尽可能用小表 选择依据: 列:正交表列数c因素所占列数+交互作用所占列数+空列 自由度:正交表的总自由度(a-1)因素自由度+交互作用自由度+误差自由度 4个3水平因素,可选L9(34)(无交互选), L27(313)(有交

13、互选),试验设计,试验设计,正交试验设计步骤 做表头设计 把试验因素和亚考察的交互作用安排到正交表各列的过程 不考察交互作用,可随机安排 考察交互作用,按所选交互列表安排 列出试验方案 把正交表中各因素的列(不包含交互作用列)的每个水平数字换成该因素的实际水平值,便形成了试验方案。,试验设计,试验设计,试验结果统计分析 直观分析、级差分析、多因素方差分析 目的 分清因素主次顺序 判断因素对试验指标影响的显著程度 找出试验最优组合,即什么因素什么水平组合是指标最好 分析因素与指标的关系,因素变化指标如何变化 了解交互作用情况 估计试验误差大小,试验设计,试验设计,插入程序表,试验设计和数据统计分

14、析 (第二部分),技术培训资料 2011年6月17日,数据统计,统计术语 计量资料与技术资料 前者用定量方法测定获得的连续性资料,有度量衡单位,如含量; 后者,按属性的不同程度分组计数的等级资料,如疗效,数据统计,统计术语 同质与变异:同一观察指标据同质性;同指标的不同观测值有差异 如反应温度,同单位衡量,每次观测值不同 总体和样本:观察对象全部和抽取的部分个体 原料,总量500袋石灰氮;抽取3%袋检查含氮量,15袋为样本,数据统计,统计术语 随机抽样与随机样本:不参杂主观愿望,样本被抽取的机会均等 粉状料,堆积,1/4量,再1/4 变量和常数:表现事物差异特征的数据为变量,如体重;代表事物特

15、征的数据为常数,通常由变量计算得来,如样本平均数、标准差、变异系数,数据统计,统计术语 参数和统计量:从总体中计算所得的特征数值为参数,如总体平均数、总体标准差;从样本中计算所得的特征数值为统计量,是总体参数的估计值。 一般用统计量估计参数值 一个来源于总体,一个来源于样本 准确性与精确性:准确性是测量值对真值的符合程度,如加样回收率;精确性是样本各变异数间的变异程度大小,是多次侧量值的接近程度,如变异系数。,数据统计,统计的主要内容-按统计分析方法分 描述性统计:原始资料基本分析 3个主要统计量:平均值、标准差、标准误 了解资料的集中趋势和变异程度 显著性检验(假设检验) 平均数间差异的比较

16、:两组数据平均数有无显著性差异,用均数差异显著性检验 属性资料的检验:不能用测量方法衡量-属性形状,如毛色、药物试验的治愈或无效,用X2检验 方差分析:变异量分析,主要进行多个平均数间的比较。,数据统计,统计的主要内容-按统计分析方法分 相关与回归分析 相关:平行关系的变异量之间的密切程度,相关系数表示 回归:两个以上变量存在从属关系,一个变量(x)变化时引起另一个变量(y) 相应变化的估计 从属关系用回归分析方法进行研究,从属关系式称回归方程 用回归方程对指标进行预测和预报,数据统计,标准曲线 原理:发现相关,原创 物质反应,颜色;颜色深浅,浓度 设定系列浓度,测出系列光密度 计算回归方程

17、从样本,到总体 用统计量,估计参数值 用相关系数估计误差 再从标准曲线计算浓度,数据统计,描述统计-集中趋势度量-平均数 成组数据的代表,是观察值的中心位置 算术平均数 加权平均数 几何平均数G:观测值相乘之积开n 次方的方根 用于增长率、药物效价、疾病潜伏期等。邻数成正比,更能代表平均水平。,数据统计,平均数 中位数Md,观测值从小到大排列,中间值 偏态分布时更有代表性 众数M0 出现次数最多的值;出现次数最多一组的组中值 调和平均数H,观测值倒数的算术平均数的倒数 速度资料,反映平均增长率或增长的平均规模,试验设计和数据统计分析 (第三部分) 实例分析,技术培训资料 2011年6月17日,

18、实例分析,例1为提高某化工产品的转化率,选择了三个有关因素进行条件试验,反应温度(A),反应时间(B),用碱量(C),并确定了它们的试验范围: A:80-90 B:90-150分钟 C:5-7,实例分析,试验目的 搞清楚因子A、B、C对转化率有什么影响, 哪些是主要的,哪些是次要的, 确定最适生产条件,即温度、时间及用碱量各为多少才能使转化率高。 制定试验方案。 这里,对因子A,在试验范围内选了三个水平;因子B和C也都取三个水平: A:A180,A285,A3=90 B:B190分,B2120分,B3=150分 C:C15,C26%,C37%,实例分析,三因子三水平的条件试验,通常有两种试验进

19、行方法: ()取三因子所有水平之间的组合,即AlBlC1,A1BlC2,A1B2C1, ,A3B3C3, 共有33=27次试验。 全面试验,实例分析,()简单对比法,即变化一个因素而固定其他因素,如首先固定B、C于Bl、Cl,使A变化: A1 B1C1 A2 A3 (好结果) 如结果A3最好,则固定A于A3,C还是C1,使B变化: B1 A3C1 B2 (好结果) B3 得出结果以B2为最好,则固定B于B2,A于A3,使C变化: C1 A3B2C2 (好结果) C3 试验结果以C2最好。 于是认为最好的工艺条件是A3B2C2。,实例分析,简单比较优点:试验次数少 缺点: 试验点不具代表性,未兼

20、顾所有组合 无法分清主次因素 不重复则无法估计实验误差 无法利用数理统计方法进行分析 正交试验的优点 代表性,主次因,不重复,利用统计提出最优条件,实例分析,正交表,实例分析,实例分析,三个3水平的因子,做全面试验需要3327次试验 现用L9(34)来设计试验方案,只要做9次 工作量减少了23 在一定意义上代表了27次试验,直观分析,实例分析,正交试验的方差分析 假设检验 在数理统计中假设检验的思想方法是:提出一个假设,把它与数据进行对照,判断是否舍弃它。其判断步骤如下: (1)设假设H0正确,可导出一个理论结论,设此结论为R0; (2)再根据试验得出一个试验结论,与理论结论相对应,设为R1;

21、,实例分析,(3)比较R0与Rl,若R0与R1没有大的差异,则没有理由怀疑H0,从而判定为:“不舍弃H0”(采用H0); 若R0与R1有较大差异,则可以怀疑H0,此时判定为:“舍弃H0“。 但是,R1R0比l大多少才能舍弃H0呢?为确定这个量的界限,需要利用数理统计中关于F分布的理论。,实例分析,方差分析表,实例分析,再看一个用L9(34)安排四个3水平因子的例子 例2某矿物气体还原试验中,要考虑还原时间(A)、还原温度(B)、还原气体比例(D)、气体流速(C)这四个因子对全铁合量X越高越好)、金属化率Y(越高越好)、二氧化钛含量Z(越低越好)这三项指标的影响。希望通过试验找出主要影响因素,确定最适工艺条件。,实例分析,首先根据专业知以确定各因子的水平: 时间:A13(小时),A24(小时),A35(小时) 温度:B11000(),B21100(),B31200() 流速:C1600(毫升分),C2400(毫升分),C3800(毫升分) CO:H2:D11:2,D22:1,D31:1,实例分析,这是四因子3水平的多指标(X、Y、Z)问题 如果做全面试验需3481次试验 用L9(34)来做只要9次。,实例分析,统计软件,下期内容介绍 EXCEL 正交设计助手 SPSS,谢谢大家!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1