试验设计和数据统计分析第一部分.ppt

上传人:本田雅阁 文档编号:3193111 上传时间:2019-07-28 格式:PPT 页数:68 大小:234.01KB
返回 下载 相关 举报
试验设计和数据统计分析第一部分.ppt_第1页
第1页 / 共68页
试验设计和数据统计分析第一部分.ppt_第2页
第2页 / 共68页
试验设计和数据统计分析第一部分.ppt_第3页
第3页 / 共68页
试验设计和数据统计分析第一部分.ppt_第4页
第4页 / 共68页
试验设计和数据统计分析第一部分.ppt_第5页
第5页 / 共68页
点击查看更多>>
资源描述

《试验设计和数据统计分析第一部分.ppt》由会员分享,可在线阅读,更多相关《试验设计和数据统计分析第一部分.ppt(68页珍藏版)》请在三一文库上搜索。

1、试验设计和数据统计分析 (第一部分) 技术培训资料 徐泽平 2011年6月17日 试验设计 引言 科学研究 调查研究 发现新物种,新机制,发现新原理 达尔文,鸟喙,环境导致变化,生物进化,物竞天择;同一 器官不同生物的比较研究,物种起源 比较的是差异 技术系统进化 科学实验 新元素、新物质,居里夫人 新工艺、新装备,航空动力燃料、催化剂 新功能,新用途,阿司匹林 试验设计 实验-试验,课题-小项目,大问题-具体内容方法 广义的:研究课题设计 立题依据/目的、研究进展、技术路线、试验方案措施 、进度安排(年度计划)、设备材料、经费预算 侠义的:统计设计 试验材料选择 处理的分配:因素、水平 重复

2、数确定 分组方法 试验设计 试验设计三阶段 拟定试验设计:合理、周密 按设计实施试验 对试验结果统计分析 设计正确就奠定了基础: 较少的人力物力时间,获得丰富可靠的资料 实验设计的目的 避免系统误差,减少实验误差,提高精确度 不影响结果精确性前提下,减少试验次数。 试验设计 试验指标:衡量试验效果的量 数量指标(得率/产量、含量/吸光度) 发酵过程中菌丝体产量/得率 多糖产量/得率 质量:能感觉(颜色、形态、分级指数) 葡聚糖的性状 无定形粉末,晶体 有机溶剂:分析纯、化学纯、色谱纯 食品级、饲料级、肥料级 试验设计 试验因素:影响试验指标的条件 物料的粒度 溶剂种类(极性、非极性) 比例(固

3、体液体比例) 提取时间 温度 次数 搅拌速度 试验设计 水平:因素根据质或量所处的状态或等级 一个因素取M水平,则该因素为M水平因素 因素A温度:30、40、50,则A为3水平因素 因素B浓度:20%、50%,则B为2水平因素 处理:各因素不同水平间的搭配,即同一 条件下所做的试验个数。 如上述,6个处理 单因素试验中处理和水平是一致的 试验设计 效应:试验因素对试验指标所起的作用, 简单效应:某因素在同一水平基础上,比较另 一因素不同水平间对试验指标的影响 单因素试验 主效应:各因素的简单效应的平均 互作效应:某因素各水平下对另一因素简单效 应的差的平均值 试验设计 试验设计的基本要求 代表

4、性:样本数、条件 正确性:准确性、精确性 重演性/重复性:条件、措施 试验类型 一般调查:全面调查(总体)、抽样调查 控制试验:一定数量、有代表性、一定试验条件 单因素试验:阐明因素的简单效应,探索适宜水平 多因素试验:可分析简单效应、主效应、互作效应, 2-3个因素 正交设计、均匀设计 试验设计 试验计划拟定 课题研究目标试验预期效果确定试验指标 结合试验条件选择试验设计方法 试验记录项目:表格形式,主要指标辅助指 标 结果分析方法:明确采用的统计方法,提出 应收集的必要数据 明确试验条件:材料、药品、设备、经费 时间地点人员 试验设计 试验方案拟定试验设计的关键 试验方案是整个试验处理的总

5、称 单因素试验:考察因素的水平 多因素试验:各因素的水平组合 确定试验因素:单因素还是多因素 确定因素水平:间隔恰当;等间隔原则 设置对照组(Control):其他条件一致 空白对照、标准对照、相互对照、自身对照 处理间遵循唯一差异原则:其他条件一致 设置预试验 试验设计 试验设计基本原则1 重复:2个以上实验单位,相同条件,实验重 复2次以上 作用: 消除偶然误差,消除实验外条件因素影 响 意义:通过重复,方差分析时,定量地将误差 计算出来,定量的评价误差的大小; 重复可使个因素和水平均有机会组合搭配到。 试验设计 试验设计基本原则2 随机化:实验配置和顺序,无主观意愿,完全 随机安排,包括

6、个方面: 因素水平随即化 实验顺序随机化 随机化方法:抽签、抓阄、随机数表 目的:避免主观偏差,消除系统误差 统计分析的基础,只有随即数据才符合统计分 布规律 试验设计 试验设计基本原则3 局部控制:实验条件局部一致 按照一定标准将实验对象和实验环境等实验条 件,如日期、地区、装置、原材料等分成部分 或区、组,以实现局部控制; 例:肥效实验,分季节、分地区(土壤)、分 作物进行分批实验,几种统计比较,得出结论 。 试验设计 试验设计 试验设计方法调查设计:原料检测 抽样原则:样本来自总体;有代表性 抽样方法:随机、顺序、群组、分层 抽样误差: 抽样得到的样本可计算统计量:平均数、标准 差,统计

7、量和参数的差值由抽样产生 抽样误差用 “标准误”衡量 样本含量:小样本6,大样本30 试验设计 试验设计方法 完全随机设计,动物试验 完全随机的分配处理,每一动物具有相等的机会接受 任意处理 分组方法:抽签、抓阄、随机数表 试验结果的统计分析方法 单因素试验:2水平,分析2处理平均数的差异显著性 非配对试验t检验;多水平的采用单因素方差分析 两因素试验:每处理1试验单位无重复方差分析,2 个以上实验单位有重复方差分析 优缺点:处理数与重复数不受限制,统计分析容易; 精密度较低,降低了检验灵敏度。 试验设计 试验设计方法 交叉设计个体差异难以消除时 大动物,牛,难以找到12个一样的;生产设备,难

8、以 同时开3套 试验对象分期接受不同处理 交叉设计成立条件:无互作、无残效、样本一定 统计分析方法:统计假设检验,t检验,检验 试验设计 试验设计基本程序 实验目的:深入了解,认真分析 因素水平的确定:首先了解哪些因素可能对试验 结果产生影响 指标确定:必须考虑指标对所研究问题提供什么 信息,如何测定该指标 实验计划的确定:分辨试验处理间最小差异程度 和允许冒多大的风险,以据顶重复次数。如何收 集数据,如何随即排列; 试验设计实施:采集数据的过程 数据分析:统计分析,平均差异、统计显著性 结论与应用 试验设计 试验设计种类 正交试验设计 安排多因素试验、寻求最优水平组合的一种高 效率试验设计方

9、法 利用正交表安排与分析多因素试验 特点:部分试验代替全面试验 原理:从优选区挑选有代表性的部分试验点。 用正交表进行挑选 L9(34):27个试验点选9个 试验设计种类 均匀试验设计 只考虑试验点在试验范围内均匀分布的试验设 计方法,适于多因素多水平 5因素31水平,只试验31次,相当于2800万次 与正交设计相比,大幅度减少试验次数 1978年,方开泰、王元 原理:方差分析:均匀分散、整齐可比,均匀 设计提高均匀分散,使试验点更具代表性; 回归设计和黑箱原则 均匀设计表,U7*(74)4因素7水平 试验设计种类 拉丁方设计 希腊拉丁方设计 回归正交设计 一次回归正交设计、二次回归正交设计

10、回归旋转设计 二次旋转组合设计、通用旋转组合设计 试验设计 正交试验设计 因素水平越多所得结论越可靠。34=81, 25=32 正交设计,多因素水平,压缩试验规模 适于多因素水平、误差大、周期长的试验 适于筛选出主要因素及最优水平的试验 正交表,规格化表格,N行k列组合的矩阵 LN(mk),L正交,N试验次数,k因素数,m水平数 L4(23),3因素2水平4次试验 L9(34),4因素3水平9次试验 试验设计 试验设计 正交表 试验设计 正交表的性质: 正交性 任一列中不同数字出现次数相等,任意因素不同水平 的试验次数相等 任两列间同横行的有序数对出现次数相等,两因素间 的水平搭配相等 代表性

11、(均衡分散性) 包括所有因素的所有水平;任意两因素的试验组合为 全面试验; 试验点均匀分布 综合可比性:水平次数相等,因素试验条件相等 试验设计 正交设计特点 均衡分散性,处理均匀分布,代表性强 整齐可比性,各水平间的比较条件相同 试验次数少 试验设计 正交表的类别 等水平正交表 水平数相同的正交表 L4(23)、L8(27)2水平正交表 L9(34)、L27(313)3水平正交表 混合水平正交表 水平数不完全相同 L8(4x24)表中,有一列的水平数为4,有4 列的水平数为2。该表可安排1个4水平因素 和4个2水平因素。 试验设计 正交试验设计步骤 试验目的与要求 本次试验要解决什么问题 确

12、定试验指标 试验结果如何衡量,定出试验指标 定量指标:强度、硬度、产量、得率、成 本 定性指标:颜色、口感、光泽 定性指标定量化:相关标准打分;模糊数 学处理量化 试验设计 正交试验设计步骤 确定考察的因素水平 根据预实验、以往经验 、前人研究结果设立, 影响大的、未试验过的 、尚未掌握规律的优先 考虑 2-4水平 水平间距合理,尽可能 理想水平 列出因素水平表 ABCD 1 2 试验设计 试验设计 正交试验设计步骤 选择合适的正交表 选择原则:能够安排下试验的因素和交互作用,尽 可能用小表 选择依据: 列:正交表列数c因素所占列数+交互作用所占列 数+空列 自由度:正交表的总自由度(a-1)

13、因素自由度+ 交互作用自由度+误差自由度 4个3水平因素,可选L9(34)(无交互选), L27(313)(有交互选) 试验设计 试验设计 正交试验设计步骤 做表头设计 把试验因素和亚考察的交互作用安排到正 交表各列的过程 不考察交互作用,可随机安排 考察交互作用,按所选交互列表安排 列出试验方案 把正交表中各因素的列(不包含交互作用列) 的每个水平数字换成该因素的实际水平值,便 形成了试验方案。 试验设计 试验设计 试验结果统计分析 直观分析、级差分析、多因素方差分析 目的 分清因素主次顺序 判断因素对试验指标影响的显著程度 找出试验最优组合,即什么因素什么水平组合是指标 最好 分析因素与指

14、标的关系,因素变化指标如何变化 了解交互作用情况 估计试验误差大小 试验设计 试验设计 插入程序表 试验设计和数据统计分析 (第二部分) 技术培训资料 2011年6月17日 数据统计 统计术语 计量资料与技术资料 前者用定量方法测定获得的连续性资料, 有度量衡单位,如含量; 后者,按属性的不同程度分组计数的等级 资料,如疗效 数据统计 统计术语 同质与变异:同一观察指标据同质性;同 指标的不同观测值有差异 如反应温度,同单位衡量,每次观测值不同 总体和样本:观察对象全部和抽取的部分 个体 原料,总量500袋石灰氮;抽取3%袋检查 含氮量,15袋为样本 数据统计 统计术语 随机抽样与随机样本:不

15、参杂主观愿望, 样本被抽取的机会均等 粉状料,堆积,1/4量,再1/4 变量和常数:表现事物差异特征的数据为 变量,如体重;代表事物特征的数据为常 数,通常由变量计算得来,如样本平均数 、标准差、变异系数 数据统计 统计术语 参数和统计量:从总体中计算所得的特征数值为 参数,如总体平均数、总体标准差;从样本中计 算所得的特征数值为统计量,是总体参数的估计 值。 一般用统计量估计参数值 一个来源于总体,一个来源于样本 准确性与精确性:准确性是测量值对真值的符合 程度,如加样回收率;精确性是样本各变异数间 的变异程度大小,是多次侧量值的接近程度,如 变异系数。 数据统计 统计的主要内容-按统计分析

16、方法分 描述性统计:原始资料基本分析 3个主要统计量:平均值、标准差、标准误 了解资料的集中趋势和变异程度 显著性检验(假设检验) 平均数间差异的比较:两组数据平均数有无显著性差 异,用均数差异显著性检验 属性资料的检验:不能用测量方法衡量-属性形状,如 毛色、药物试验的治愈或无效,用X2检验 方差分析:变异量分析,主要进行多个平均数间的比 较。 数据统计 统计的主要内容-按统计分析方法分 相关与回归分析 相关:平行关系的变异量之间的密切程度,相 关系数表示 回归:两个以上变量存在从属关系,一个变量 (x)变化时引起另一个变量(y) 相应变化的估 计 从属关系用回归分析方法进行研究,从属关系

17、式称回归方程 用回归方程对指标进行预测和预报 数据统计 标准曲线 原理:发现相关,原创 物质反应,颜色;颜色深浅,浓度 设定系列浓度,测出系列光密度 计算回归方程 从样本,到总体 用统计量,估计参数值 用相关系数估计误差 再从标准曲线计算浓度 数据统计 描述统计-集中趋势度量-平均数 成组数据的代表,是观察值的中心位置 算术平均数 加权平均数 几何平均数G:观测值相乘之积开n 次方的方根 用于增长率、药物效价、疾病潜伏期等。邻数成正比,更能代表平 均水平。 数据统计 平均数 中位数Md,观测值从小到大排列,中间值 偏态分布时更有代表性 众数M0 出现次数最多的值;出现次数最多一组的组中值 调和

18、平均数H,观测值倒数的算术平均数的倒数 速度资料,反映平均增长率或增长的平均规模 试验设计和数据统计分析 (第三部分) 实例分析 技术培训资料 2011年6月17日 实例分析 例1为提高某化工产品的转化率,选择了 三个有关因素进行条件试验,反应温度(A) ,反应时间(B),用碱量(C),并确定了它 们的试验范围: A:80-90 B:90-150分钟 C:5-7 实例分析 试验目的 搞清楚因子A、B、C对转化率有什么影响, 哪些是主要的,哪些是次要的, 确定最适生产条件,即温度、时间及用碱量各为 多少才能使转化率高。 制定试验方案。 这里,对因子A,在试验范围内选了三个水平; 因子B和C也都取

19、三个水平: A:A180,A285,A3=90 B:B190分,B2120分,B3=150分 C:C15,C26%,C37% 实例分析 三因子三水平的条件试验,通常有两种试验 进行方法: ()取三因子所有水平之间的组合,即 AlBlC1,A1BlC2,A1B2C1, , A3B3C3, 共有33=27次试验。 全面试验 实例分析 ()简单对比法,即变化一个因素而固定其他因素,如首先 固定B、C于Bl、Cl,使A变化: A1 B1C1 A2 A3 (好结果) 如结果A3最好,则固定A于A3,C还是C1,使B变化: B1 A3C1 B2 (好结果) B3 得出结果以B2为最好,则固定B于B2,A于

20、A3,使C变化: C1 A3B2C2 (好结果) C3 试验结果以C2最好。 于是认为最好的工艺条件是A3B2C2。 实例分析 简单比较优点:试验次数少 缺点: 试验点不具代表性,未兼顾所有组合 无法分清主次因素 不重复则无法估计实验误差 无法利用数理统计方法进行分析 正交试验的优点 代表性,主次因,不重复,利用统计提出最优 条件 实例分析 正交表 实例分析 实例分析 三个3水平的因子,做全面试验需要33 27次试验 现用L9(34)来设计试验方案,只要做9次 工作量减少了23 在一定意义上代表了27次试验 直 观 分 析 实例分析 正交试验的方差分析 假设检验 在数理统计中假设检验的思想方法

21、是:提出一个 假设,把它与数据进行对照,判断是否舍弃它。 其判断步骤如下: (1)设假设H0正确,可导出一个理论结论,设此 结论为R0; (2)再根据试验得出一个试验结论,与理论结论 相对应,设为R1; 实例分析 (3)比较R0与Rl,若R0与R1没有大的差异,则没 有理由怀疑H0,从而判定为:“不舍弃H0”(采用 H0); 若R0与R1有较大差异,则可以怀疑H0,此时判 定为:“舍弃H0“。 但是,R1R0比l大多少才能舍弃H0呢?为确定 这个量的界限,需要利用数理统计中关于F分布 的理论。 实例分析 方差分析表 实例分析 再看一个用L9(34)安排四个3水平因子的例子 例2某矿物气体还原试

22、验中,要考虑还原时间 (A)、还原温度(B)、还原气体比例(D)、气体流速 (C)这四个因子对全铁合量X越高越好)、金属 化率Y(越高越好)、二氧化钛含量Z(越低越好)这 三项指标的影响。希望通过试验找出主要影响因 素,确定最适工艺条件。 实例分析 首先根据专业知以确定各因子的水平: 时间:A13(小时),A24(小时),A3 5(小时) 温度:B11000(),B21100(),B3 1200() 流速:C1600(毫升分),C2400(毫 升分),C3800(毫升分) CO:H2:D11:2,D22:1,D31:1 实例分析 这是四因子3水平的多指标(X、Y、Z)问题 如果做全面试验需3481次试验 用L9(34)来做只要9次。 实例分析 统计软件 下期内容介绍 EXCEL 正交设计助手 SPSS 谢谢大家!

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1