试验设计与数据处理(第三版)李云雁 第1章 误差分析.pptx

上传人:rrsccc 文档编号:9176023 上传时间:2021-02-05 格式:PPTX 页数:74 大小:651.42KB
返回 下载 相关 举报
试验设计与数据处理(第三版)李云雁 第1章 误差分析.pptx_第1页
第1页 / 共74页
试验设计与数据处理(第三版)李云雁 第1章 误差分析.pptx_第2页
第2页 / 共74页
试验设计与数据处理(第三版)李云雁 第1章 误差分析.pptx_第3页
第3页 / 共74页
试验设计与数据处理(第三版)李云雁 第1章 误差分析.pptx_第4页
第4页 / 共74页
试验设计与数据处理(第三版)李云雁 第1章 误差分析.pptx_第5页
第5页 / 共74页
点击查看更多>>
资源描述

《试验设计与数据处理(第三版)李云雁 第1章 误差分析.pptx》由会员分享,可在线阅读,更多相关《试验设计与数据处理(第三版)李云雁 第1章 误差分析.pptx(74页珍藏版)》请在三一文库上搜索。

1、试验设计与数据处理(第三版),Experiment Design and Data Processing,引 言,0.1 试验设计与数据处理的发展概况,20世纪20年代,英国生物统计学家及数学家费歇(RAFisher)提出了方差分析 20世纪50年代,日本统计学家田口玄一将试验设计中应用最广的正交设计表格化 数学家华罗庚教授也在国内积极倡导和普及的“优选法” 我国数学家王元和方开泰于1978年首先提出了均匀设计,0.2 试验设计与数据处理的意义,0.2.1 试验设计的目的: 合理地安排试验,力求用较少的试验次数获得较好结果 例:某试验研究了3个影响因素: A:A1,A2,A3 B:B1,B2,

2、B3 C:C1,C2,C3 全面试验:27次 正交试验:9次,0.2.2 数据处理的目的,通过误差分析,评判试验数据的可靠性; 确定影响试验结果的因素主次,抓住主要矛盾,提高试验效率; 确定试验因素与试验结果之间存在的近似函数关系,并能对试验结果进行预测和优化; 试验因素对试验结果的影响规律,为控制试验提供思路; 确定最优试验方案或配方。,第1章 试验数据的误差分析,误差分析(error analysis) :对原始数据的可靠性进行客观的评定 误差(error) :试验中获得的试验值与它的客观真实值在数值上的不一致 客观真实值真值 试验结果都具有误差,误差自始至终存在于一切科学实验过程中,1.

3、1 真值与平均值,1.1.1 真值(true value) 真值:在某一时刻和某一状态下,某量的客观值或实际值 真值一般是未知的 相对的意义上来说,真值又是已知的 平面三角形三内角之和恒为180 国家标准样品的标称值 国际上公认的计量值 高精度仪器所测之值 多次试验值的平均值,1.1.2 平均值(mean),(1)算术平均值(arithmetic mean),等精度试验值,适合:,试验值服从正态分布,(2)加权平均值(weighted mean),适合不同试验值的精度或可靠性不一致时,wi权重,加权和,(3)对数平均值(logarithmic mean),说明: 若数据的分布具有对数特性,则宜

4、使用对数平均值 对数平均值算术平均值 如果1/2x1/x22 时,可用算术平均值代替,设两个数:x10,x2 0 ,则,(4)几何平均值(geometric mean),当一组试验值取对数后所得数据的分布曲线更加对称时,宜采用几何平均值。 几何平均值算术平均值,设有n个正试验值:x1,x2,xn,则,(5)调和平均值(harmonic mean),常用在涉及到与一些量的倒数有关的场合 调和平均值几何平均值算术平均值,设有n个正试验值:x1,x2,xn,则:,Excel在计算平均值中的应用,1.2 误差的基本概念,1.2.1 绝对误差(absolute error) (1)定义 绝对误差试验值真

5、值 或,(2)说明,真值未知,绝对误差也未知,可以估计出绝对误差的范围:,绝对误差限或绝对误差上界,或,绝对误差估算方法: 最小刻度的一半为绝对误差; 最小刻度为最大绝对误差; 根据仪表精度等级计算: 绝对误差=量程精度等级%,1.2.2 相对误差(relative error),(1)定义:,或,(2)说明:,真值未知,常将x与试验值或平均值之比作为相对误差:,或,可以估计出相对误差的大小范围:,相对误差限或相对误差上界,相对误差常常表示为百分数(%)或千分数(),1.2.3 算术平均误差 (average discrepancy),定义式:,可以反映一组试验数据的误差大小,1.2.4 标准

6、误差 (standard error),定义式:,表示当前样本对总体数据的估计;,表示样本均数与总体均数的相对误差; 样本个数n越大,标准误越小,表明所抽取的样本能够较好地代表总体样本,(1)定义:以不可预知的规律变化着的误差,绝对误差时正时负,时大时小 (2)产生的原因: 偶然因素 (3)特点:具有统计规律 小误差比大误差出现机会多 正、负误差出现的次数近似相等 当试验次数足够多时,误差的平均值趋向于零 可以通过增加试验次数减小随机误差 随机误差不可完全避免的,1.3.1 随机误差 (random error ),1.3 试验数据误差的来源及分类,1.3.2 系统误差(systematic

7、error),(1)定义: 一定试验条件下,由某个或某些因素按照某一确定的规律起作用而形成的误差 (2)产生的原因:多方面 (3)特点: 系统误差大小及其符号在同一试验中是恒定的 它不能通过多次试验被发现,也不能通过取多次试验值的平均值而减小 只要对系统误差产生的原因有了充分的认识,才能对它进行校正,或设法消除。,1.3.3 过失误差 (mistake ),(1)定义: 一种显然与事实不符的误差 (2)产生的原因: 实验人员粗心大意造成 (3)特点: 可以完全避免 没有一定的规律,1.4.1 精密度(precision),(1)含义: 反映了随机误差大小的程度 在一定的试验条件下,多次试验值的

8、彼此符合程度 例:甲:11.45,11.46,11.45,11.44 乙:11.39,11.45,11.48,11.50 (2)说明: 可以通过增加试验次数而达到提高数据精密度的目的 试验数据的精密度是建立在数据用途基础之上的 试验过程足够精密,则只需少量几次试验就能满足要求,1.4 试验数据的精准度,(3)精密度判断,极差(range),标准差(standard error,SD),R,精密度,标准差,精密度,方差(variance),标准差的平方: 样本方差( s2 ) 总体方差(2 ) 方差,精密度,相对标准偏差(relative standard deviation,RSD),也称变异

9、系数(coefficient of variation,简称CV) 定义式:,适用于两个或多个数据资料分散程度、变异程度或精密程度的比较,例1-5,1.4.2 正确度(correctness),(1)含义:反映系统误差的大小 (2)正确度与精密度的关系:,精密度不好,但当试验次数相当多时,有时也会得到好的正确度,精密度高并不意味着正确度也高,(a),(b),(c),1.4.3 准确度(accuracy),(1)含义: 反映了系统误差和随机误差的综合 表示了试验结果与真值的一致程度 (2)三者关系 无系统误差的试验,精密度 :ABC 正确度: ABC 准确度: ABC,有系统误差的试验,精密度

10、:A B C 准确度: A B C ,A B,C,Excel在计算误差中的应用,1.5.1 随机误差的检验,1.5 试验数据误差的统计假设检验,(1)目的:,对试验数据的随机误差或精密度进行检验。,(2)检验步骤:,计算统计量,查临界值,一般取0.01或0.05,表示有显著差异的概率,双侧(尾)检验(two-sided/tailed test) :,检验,若,则判断两方差无显著差异,否则有显著差异,单侧(尾)检验(one-sided/tailed test) : 左侧(尾)检验,则判断该方差与原总体方差无显著减小,否则有显著减小,右侧(尾)检验,则判断该方差与原总体方差无显著增大,否则有显著增

11、大,若,若,1.5.1.2 F检验(F-test),(1)目的: 对两组具有正态分布的试验数据之间的精密度进行比较 (2)检验步骤 计算统计量,设有两组试验数据:,都服从正态分布,样本方差分别为,和,和,,则,第一自由度为,第二自由度为,服从F分布,,查临界值 给定的显著水平,查F分布表,临界值,双侧(尾)检验(two-sided/tailed test) :,检验,若,则判断两方差无显著差异,否则有显著差异,单侧(尾)检验(one-sided/tailed test) : 左侧(尾)检验 (F1,即s12 s22):,则判断该判断方差1比方差2无显著减小,否则有显著减小,右侧(尾)检验 (F

12、1 ,即s12 s22 ),则判断该方差1比方差2无显著增大,否则有显著增大,若,若,(3)Excel在F检验中的应用,1.5.2 系统误差的检验,1.5.2.1 t检验法 (1)平均值与给定值比较 目的:检验服从正态分布数据的算术平均值是否与给定值有显著差异 检验步骤: 计算统计量:,给定值(可以是真值、期望值或标准值),双侧检验 :,若,则可判断该平均值与给定值无显著差异,否则就有显著差异,单侧检验,左侧检验,若, 且,则判断该平均值与给定值无显著减小,否则有显著减小,右侧检验,若, 且,则判断该平均值与给定值无显著增大,否则有显著增大,Excel在单样本t检验中的应用,(2)两个平均值的

13、比较 目的:判断两组服从正态分布数据的算术平均值有无显著差异 计算统计量: 两组数据的方差无显著差异时,s合并标准差:,两组数据的精密度或方差有显著差异时,服从t分布,其自由度为:, t检验,双侧检验 :,若,则可判断两平均值无显著差异,否则就有显著差异,单侧检验,左侧检验:,若,且,则判断该平均值1较平均值2无显著减小,否则有显著减小,右侧检验:,若,且,则判断该平均值1较平均值2无显著增大,否则有显著增大,Excel在双样本t检验中的应用,(3)成对数据的比较 目的:试验数据是成对出现,判断两种方法、两种仪器或两分析人员的测定结果之间是否存在系统误差 计算统计量:,成对测定值之差的算术平均

14、值:,零或其他指定值, n对试验值之差值的样本标准差:,双侧检验 :,若,则可判断两平均值无显著差异,否则就有显著差异,单侧检验,左侧检验:,若,且,则判断该平均值1较平均值2无显著减小,否则有显著减小,右侧检验:,若,且,则判断该平均值1较平均值2无显著增大,否则有显著增大,Excel在成对双样本t检验中的应用,1.5.2.2 秩和检验法(rank sum test),(1)目的:两组数据或两种试验方法之间是否存在系统误差、两种方法是否等效等 ,不要求数据具有正态分布 (2)内容: 设有两组试验数据,相互独立 ,n1,n2分别是两组数据的个数 ,总假定 n1n2; 将这个试验数据混在一起,按

15、从小到大的次序排列 每个试验值在序列中的次序叫作该值的秩(rank) 将属于第1组数据的秩相加,其和记为R1 R1第1组数据的秩和(rank sum) 如果两组数据之间无显著差异,则R1就不应该太大或太小,查秩和临界值表: 根据显著性水平和n1,n2,可查得R1的上下限T2和T1 检验: 如果R1T2 或R1 T1,则认为两组数据有显著差异,若一组数据无系统误差,则另一组数据有系统误差 如果T1R1T2,则两组数据无显著差异,若一组数据无系统误差,则另一组数据也无系统误差,(3)例:,设甲、乙两组测定值为: 甲:8.6,10.0,9.9,8.8,9.1,9.1 乙:8.7,8.4,9.2,8.

16、9,7.4,8.0,7.3,8.1,6.8已知甲组数据无系统误差,试用秩和检验法检验乙组测定值是否有系统误差。(0.05),解:(1)排序:,(2)求秩和R1 R1=7911.511.5141568 (3)查秩和临界值表 对于0.05, n1=6,n2=9 得 T1=33,T263, R1T2 故:两组数据有显著差异,乙组测定值有系统误差,(4)Excel在秩和检验中的应用,1.5.3 异常值的检验,可疑数据、离群值、异常值 一般处理原则为: 在试验过程中,若发现异常数据,应停止试验,分析原因,及时纠正错误 试验结束后,在分析试验结果时,如发现异常数据,则应先找出产生差异的原因,再对其进行取舍

17、 在分析试验结果时,如不清楚产生异常值的确切原因,则应对数据进行统计处理;若数据较少,则可重做一组数据 对于舍去的数据,在试验报告中应注明舍去的原因或所选用的统计方法,1.5.3.1 拉依达( )检验法,内容: 可疑数据xp ,若,则应将该试验值剔除。,说明:,计算平均值及标准偏差s 时,应包括可疑值在内,3s相当于显著水平0.01,2s相当于显著水平0.05,可疑数据应逐一检验,不能同时检验多个数据 首先检验偏差最大的数 剔除一个数后,如果还要检验下一个数 ,应重新计算平均值及标准偏差 方法简单,无须查表 该检验法适用于试验次数较多或要求不高时 3s为界时,要求n10 2s为界时,要求n5,

18、有一组分析测试数据:0.128,0.129,0.131,0.133,0.135,0.138,0.141,0.142,0.145,0.148,0.167,问其中偏差较大的0.167这一数据是否应被舍去? (0.01),解:(1)计算,例:,(2)计算偏差,(3)比较,3s30.011160.03350.027,故按拉依达准则,当0.01时,0.167这一可疑值不应舍去,(2)格拉布斯(Grubbs)检验法,内容: 可疑数据xp ,若,则应将该值剔除。,Grubbs检验临界值,格拉布斯(Grubbs)检验临界值G( ,n)表,说明:,计算平均值及标准偏差s 时,应包括可疑值在内 可疑数据应逐一检验

19、,不能同时检验多个数据 首先检验偏差最大的数 剔除一个数后,如果还要检验下一个数 ,应重新计算平均值及标准偏差 能适用于试验数据较少时 格拉布斯准则也可以用于检验两个数据偏小,或两个数据偏大的情况 例:例1-14,用容量法测定某样品中的锰,8次平行测定数据为:10.29,10.33,10.38,10.40,10.43,10.46,10.52,10.82(%),试问是否有数据应被剔除?(=0.05) 解: (1)检验10.82,由于10.82的偏差最大,故首先检验该数。,查得临界值,故10.82这个测定值应该被剔除。,(2)检验10.52 剔除10.82之后,重新计算平均值及标准偏差s ,此时1

20、0.52偏差最大,故检验之。,查得临界值,故10.52不应该被剔除。由于剩余数据的偏差都比10.52小,所以都应保留。,(3)狄克逊(Dixon)检验法,单侧情形 将n个试验数据按从小到大的顺序排列: x1x2xn-1xn 如果有异常值存在,必然出现在两端,即x1 或xn 计算出统计量D或D 查单侧临界值,检验,双侧情形 计算D和 D 查双侧临界值,检验,说明,适用于试验数据较少时的检验,计算量较小 单侧检验时,可疑数据应逐一检验,不能同时检验多个数据 剔除一个数后,如果还要检验下一个数 ,应重新排序 例:例1-15,1-16,例:设有15个误差测定数据按从小到大的顺序排列为: 1.40,0.

21、44,0.30,0.24,0.22,0.13,0.05,0.06,0.10,0.18,0.20,0.39,0.48,0.63,1.01。试分析其中有无数据应该被剔除?(=0.05) 解:本例可应用狄克逊双侧情形检验 对于1.01和1.40,计算,临界值,,且,故判断最小值-1.40应该被剔除,剔除-1.04之后,对剩余的14个值(0.44,0.30,0.24,0.22,0.13,0.05,0.06,0.10,0.18,0.20,0.39,0.48,0.63,1.01) (n=14)进行双侧检验:,临界值,由于,所以不能继续检出异常值,只检出1.40为异常值。,,,1.6.1 有效数字(sign

22、ificance figure),能够代表一定物理量的数字 有效数字的位数可反映试验或试验仪表的精度 数据中小数点的位置不影响有效数字的位数 例如:50,0.050m,5.0104m 第一个非0数前的数字都不是有效数字,而第一个非0数后的数字都是有效数字 例如: 29和29.00 第一位数字等于或大于8,则可以多计一位 例如:9.99,1.6 有效数字和试验结果的表示,1.6.2 有效数字的运算,(1)加、减运算: 与其中小数点后位数最少的相同 (2)乘、除运算 以各乘、除数中有效数字位数最少的为准 (3)乘方、开方运算: 与其底数的相同: 例如:2.42=5.8 (4)对数运算: 与其真数的

23、相同 例如ln6.841.92;lg0.000044,(5)在4个以上数的平均值计算中,平均值的有效数字可增加一位 (6)所有取自手册上的数据,其有效数字位数按实际需要取,但原始数据如有限制,则应服从原始数据。 (7)一些常数的有效数字的位数可以认为是无限制的 例如,圆周率、重力加速度g、1/3等 (8)一般在工程计算中,取23位有效数字,1.6.3 有效数字的修约规则,4:舍去 5,且其后跟有非零数字 ,进1位 例如:3.14159 3.142 5,其右无数字或皆为0时,“尾留双”: 若所保留的末位数字为奇数则进1 若所保留的末位数字为偶数则舍弃 例如:3.1415 3.142 1.3665

24、 1.366,1.7 误差的传递,误差的传递:根据直接测量值的误差来计算间接测量值的误差 1.7.1 误差传递基本公式 间接测量值y与直接测量值xi之间函数关系 :,全微分,函数或间接测量值的绝对误差为:,相对误差为:,误差传递系数,直接测量值的绝对误差;,间接测量值的绝对误差或称函数的绝对误差。,函数标准差传递公式:,1.7.2 常用函数的误差传递公式,表1-5,1.7.3 误差传递公式的应用,(1)根据各分误差的大小,来判断间接测量或函数误差的主要来源: 例1-17 (2)选择合适的测量仪器或方法: 例1-18,秩和临界值表,统计量D计算公式,单侧狄克逊检验临界值表,双侧狄克逊检验临界值表,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1