概率论与数理统计课件(6-10).ppt

上传人:本田雅阁 文档编号:3101472 上传时间:2019-07-08 格式:PPT 页数:335 大小:11.81MB
返回 下载 相关 举报
概率论与数理统计课件(6-10).ppt_第1页
第1页 / 共335页
概率论与数理统计课件(6-10).ppt_第2页
第2页 / 共335页
概率论与数理统计课件(6-10).ppt_第3页
第3页 / 共335页
概率论与数理统计课件(6-10).ppt_第4页
第4页 / 共335页
概率论与数理统计课件(6-10).ppt_第5页
第5页 / 共335页
点击查看更多>>
资源描述

《概率论与数理统计课件(6-10).ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计课件(6-10).ppt(335页珍藏版)》请在三一文库上搜索。

1、参数估计,数理统计问题:如何选取样本来对总体的种种统计 特征作出判断。,参数估计问题:知道随机变量(总体)的分布类型, 但确切的形式不知道,根据样本来估计总体的参数,这 类问题称为参数估计(paramentric estimation)。,参数估计的类型点估计、区间估计,参数的估计量,设总体的分布函数为F(x,)(未知),X1,X2,Xn 为样本,构造一个统计量 来估计 参数,则称 为参数的估计量。,将样本观测值 代入 , 得到的值 称为参数的估计值。,参数的点估计,点估计的方法:数字特征法、矩法、极大似然法。,样本的数字特征法:以样本的数字特征作为相应总体 数字特征的估计量。,以样本均值 作

2、为总体均值 的点估计量,即,点估计值,点估计值,以样本方差 作为总体方差 的点估计量,即,例1 一批钢件的20个样品的屈服点(t/cm2)为 4.98 5.11 5.20 5.20 5.11 5.00 5.35 5.61 4.88 5.27 5.38 5.48 5.27 5.23 4.96 5.15 4.77 5.35 5.38 5.54 试估计该批钢件的平均屈服点及其方差。,解 由数字特征法,得屈服点及方差的估计值为,定义 设 为随机变量,若 存在,则称 为 的 阶原点矩,记作 ;若 存在,则称 为 的 阶 中心矩,记作,样本的 阶原点矩,记作,样本的 阶中心矩,记作,阶矩的概念,参数的矩法

3、估计,矩法估计:用样本的矩作为总体矩的估计量,即,若总体X的分布函数中含有m个参数1, 2, , m, 总体的k阶矩Vk或Uk存在,则,或,参数的矩法估计,或,矩法估计:用样本的矩作为总体矩的估计量,即,例2 设某总体X的数学期望为EX=,方差DX=2,X1, X2,Xn为样本,试求和2的矩估计量。,解 总体的k阶原点矩为,样本的k阶原点矩为,由矩法估计,应有,所以,结论:不管总体X服从何种分布,总体期望和方差 的矩估计量分别为样本均值、样本方差,即,估计值为,例3 设X1,X2,Xn为总体X的样本,试求下列总体 分布参数的矩估计量。,解 (1)由于,(2)由于,所以参数和2的矩估计量为,所以

4、,得参数p的矩估计量为,例3 设X1,X2,Xn为总体X的样本,试求下列总体 分布参数的矩估计量。,解 (3)由于,所以参数的矩估计量为,可见:同一个参数的矩估计量可以不同。所以统计量 存在“优、劣”之分。,或,一阶矩,二阶矩,例4 设总体X服从1, 2上的均匀分布, 12,求 1, 2的矩估计量, X1,X2,Xn为X的一个样本。,解 由于,所以由矩法估计,得,解得,区间长度的矩估计量为,解 由于,所以由矩法估计,得,解得,所以,参数 的矩估计量为,例5 对容量为n的子样,求下列密度函数中参数 的 矩估计量。,参数的极大似然估计法,思想:设总体X的密度函数为f(x,),为未知参数,则 样本(

5、X1,X2,Xn)的联合密度函数为,令,参数的估计量 ,使得样本(X1,X2,Xn)落在观测 值 的邻域内的概率L()达到最大,即,则称 为参数的极大似然估计值。,参数的极大似然估计法,求解方法:,(2)取自然对数,其解 即为参数的极大似然估计值。,(3)令,(1)构造似然函数,若总体的密度函数中有多个参数1,2,n,则将 第(3)步改为,解方程组即可。,例6 假设(X1,X2,Xn)是取自正态总体N(,2) 的样本,求和2的极大似然估计量。,解 构造似然函数,取对数,续解,求偏导数,并令其为0,解得,所以,2的极大似然估计量为,与矩估计量 相同,估计量的评选标准,无偏性、有效性、相合性*、充

6、分性与完备性*,无偏估计量:设 是 的估计量,如果 则称 是 的无偏估计量(unbiased estimation),例题 设总体的数学期望EX和方差DX都存在, 证明:样本均值 、样本方差 分别是EX、DX的无偏估计。,例题 设总体的数学期望EX和方差DX都存在, 证明:样本均值 、样本方差 分别是EX、DX的无偏估计。,证明,证明,有 效 性,设 是 的无偏估计量,当样本容量n固定时,使 达到最小的 称为 的有效估计,比较:若 ,则 比 有效。,例如 及 (其中 )都是EX的无偏 估计,但 比 有效。,例如 及 (其中 )都是EX的无偏 估计,但 比 有效。,因为,算术平均几何平均,小 结

7、,参数估计的点估计方法,数字特征法:以样本均值、方差作为总体期望、方差 的估计量。,矩法估计:以样本k阶矩作为总体k阶矩的估计量。,或,作业 P130 1,2,4 预习 第三节 区间估计,区间估计,区间估计的思想,点估计总是有误差的,但没有衡量偏差程度的量, 区间估计则是按一定的可靠性程度对待估参数给出一个 区间范围。,引例 设某厂生产的灯泡使用寿命XN(,1002),现 随机抽取5只,测量其寿命如下:1455,1502,1370, 1610,1430,则该厂灯泡的平均使用寿命的点估计值为,可以认为该种灯泡的使用寿命在1473.4个单位时间左右, 但范围有多大呢?又有多大的可能性在这“左右”呢

8、?,如果要求有95%的把握判断在1473.4左右,则由U统计 量可知,由,查表得,置信水平、置信区间,设总体的分布中含有一个参数,对给定的,如果 由样本(X1,X2,Xn)确定两个统计量 1( X1,X2,Xn ), 2( X1,X2,Xn ), 使得P1 2=1- ,则称随机区间( 1 , 2 )为 参数的置信度(或置信水平)为1- 的置信区间。,1置信下限 2置信上限,几点说明,1、参数的置信水平为1-的置信区间( 1, 2) 表示该区间有100(1-)%的可能性包含总体参 数的真值。,2、不同的置信水平,参数的置信区间不同。,3、置信区间越小,估计越精确,但置信水平会降低; 相反,置信水

9、平越大,估计越可靠,但精确度会降 低,置信区间会较长。一般:对于固定的样本容量, 不能同时做到精确度高(置信区间小),可靠程度也 高(1- 大)。如果不降低可靠性,而要缩小估计范 围,则必须增大样本容量,增加抽样成本。,正态总体方差已知,对均值的区间估计,如果总体XN(,2),其中2已知, 未知, 则取U-统计量 ,对做区间估计。,对给定的置信水平1-,由 确定临界值(X的双侧分位数)得的置信区间为,将观测值 代入,则可得具体的区间。,例1 某车间生产滚珠,从长期实践中知道,滚珠直径X 可以认为服从正态分布,从某天的产品中随机抽取6个, 测得直径为(单位:cm) 14.6,15.1,14.9,

10、14.8,15.2,15.1 (1)试求该天产品的平均直径EX的点估计; (2)若已知方差为0.06,试求该天平均直径EX的置信 区间:=0.05;=0.01。,解 (1)由矩法估计得EX的点估计值为,续解 (2)由题设知XN(,0.06),构造U-统计量,得EX的置信区间为,当=0.05时,,而,所以,EX的置信区间为(14.754,15.146),当=0.01时,,所以,EX的置信区间为(14.692,15.208),置信水平提高,置信区间扩大,估计精确度降低。,例2 假定某地一旅游者的消费额X服从正态分布 N(,2),且标准差=12元,今要对该地旅游者的平 均消费额EX加以估计,为了能以

11、95%的置信度相信这种 估计误差小于2元,问至少要调查多少人?,解 由题意知:消费额XN(,122),设要调查n人。,由,即,得,查表得,而,解得,至少要调查139人,正态总体方差未知,对均值的区间估计,如果总体XN(,2),其中,均未知,由,构造T-统计量,当置信水平为1-时,由,查t-分布表确定,从而得的置信水平为1-的置信区间为,例3 某厂生产的一种塑料口杯的重量X被认为服从正态 分布,今随机抽取9个,测得其重量为(单位:克): 21.1,21.3,21.4,21.5,21.3,21.7,21.4,21.3, 21.6。试用95%的置信度估计全部口杯的平均重量。,解 由题设可知:口杯的重

12、量XN(,2),由抽取的9个样本,可得,由,得,查表得,全部口杯的平均重量的置信区间为(21.26,21.54),P127例5与P126例3的比较:,解 由题设可知:平均消费额XN(,2),平均消费额的置信区间为(75.0464,84.9536),由,得,查表得,估计误差为,精确度降低,原因:样本容量减少,在实际应用中,方差未知的均值的区间估计 较有应用价值。,练习 假设某片居民每月对某种商品的需求量X服从正态 分布,经调查100家住户,得出每户每月平均需求量为 10公斤,方差为9,如果某商店供应10000户,试就居民 对该种商品的平均需求量进行区间估计(=0.01),并 依此考虑最少要准备多

13、少这种商品才能以99%的概率满 足需求?,解 由题设可知:平均需求量XN(,2),平均消费额的置信区间为(9.229,10.771),由,查表得,续解,要以99%的概率满足10000户居民对该种商品的需求,则最少要准备的量为,(公斤),最多准备,(公斤),正态总体均值已知,对方差的区间估计,如果总体XN(,2),其中已知,2未知,由,构造2-统计量,查2- 分布表,确定双侧分位数,从而得2的置信水平为1-的置信区间为,例题 已知某种果树产量服从(218,2),随机 抽取6棵计算其产量为(单位:公斤) 221,191,202,205,256,236 试以95%的置信水平估计产量的方差。,解,计算

14、,查表,果树方差的置信区间为,正态总体均值未知,对方差的区间估计,如果总体XN(,2),其中2未知,由,构造2-统计量,当置信水平为1-时,由,查2- 分布表,确定双侧分位数,从而得2的置信水平为1-的置信区间为,例4 设某灯泡的寿命XN(,2), ,2未知,现 从中任取5个灯泡进行寿命试验,得数据10.5,11.0, 11.2,12.5,12.8(单位:千小时),求置信水平为 90%的2的区间估计。,解 样本方差及均值分别为,2的置信区间为(0.4195,5.5977),由,得,查表得,小 结,总体服从正态分布的均值或方差的区间估计,(1)方差已知,对均值的区间估计,假设置信水平为1-,构造

15、U-统计量,反查标准正态分布表, 确定U的双侧分位数,得EX的区间估计为,小 结,总体服从正态分布的均值或方差的区间估计,(2)方差未知,对均值的区间估计,假设置信水平为1-,构造T-统计量,查t-分布临界值表, 确定T的双侧分位数,得EX的区间估计为,小 结,总体服从正态分布的均值或方差的区间估计,(3)均值已知,对方差的区间估计,假设置信水平为1-,构造2-统计量,查2-分布临界值表, 确定2的双侧分位数,得2的区间估计为,小 结,总体服从正态分布的均值或方差的区间估计,(4)均值未知,对方差的区间估计,假设置信水平为1-,构造2-统计量,查2-分布临界值表, 确定2的双侧分位数,得2的区

16、间估计为,(1)方差已知,对均值的区间估计,构造U统计量,(2)方差未知,对均值的区间估计,构造T统计量,总体服从正态分布的对均值的区间估计,区间估计,(4)均值未知,对方差的区间估计,构造2统计量,(3)均值已知,对方差的区间估计,构造2统计量,总体服从正态分布的对方差的区间估计,区间估计,作业 P131 5,7,8,9,14,15* 预习 第10章 15节,假设检验,引 言,统计假设通过实际观察或理论分析对总体分布形式 或对总体分布形式中的某些参数作出某种 假设。,假设检验根据问题的要求提出假设,构造适当的统 计量,按照样本提供的信息,以及一定的 规则,对假设的正确性进行判断。,基本原则小

17、概率事件在一次试验中是不可能发生的。,基本概念,引例:已知某班应用数学的期末考试成绩服从 正态分布。根据平时的学习情况及试卷的难易程度,估 计平均成绩为75分,考试后随机抽样5位同学的试卷, 得平均成绩为72分,试问所估计的75分是否正确?,“全班平均成绩是75分”,这就是一个假设,根据样本均值为72分,和已有的定理结论,对EX=75 是否正确作出判断,这就是检验,对总体均值的检验。,判断结果:接受原假设,或拒绝原假设。,表达:原假设:H0:EX=75;备择假设: H1:EX75,基本思想,参数的假设检验:已知总体的分布类型,对分布函数或 密度函数中的某些参数提出假设,并检验。,基本原则小概率

18、事件在一次试验中是不可能发生的。,思想:如果原假设成立,那么某个分布已知的统计 量在某个区域内取值的概率应该较小,如果样本的观 测数值落在这个小概率区域内,则原假设不正确,所以, 拒绝原假设;否则,接受原假设。,拒绝域,检验水平,引例问题,原假设 H0:EX=75;H1:EX75,假定原假设正确,则XN(75,2),于是T统计量,可得,如果样本的观测值,则拒绝H0,检验水平,临界值,拒绝域,基本步骤,1、提出原假设,确定备择假设;,2、构造分布已知的合适的统计量;,3、由给定的检验水平,求出在H0成立的条件下的 临界值(上侧分位数,或双侧分位数);,4、计算统计量的样本观测值,如果落在拒绝域内

19、, 则拒绝原假设,否则,接受原假设。,两 种 错 误,第一类错误(弃真错误)原假设H0为真,而检验 结果为拒绝H0;记其概率为,即 P拒绝H0|H0为真= ,第二类错误(受伪错误)原假设H0不符合实际, 而检验结果为接受H0;记其概率为,即 P接受H0|H0为假= ,希望:犯两类错误的概率越小越好,但样本容量一定 的前提下,不可能同时降低和。,原则:保护原假设,即限制的前提下,使尽可能的小。,注意:“接受H0”,并不意味着H0一定为真;“拒绝H0” 也不意味着H0一定不真。,单个正态总体方差已知的均值检验,问题:总体 XN(,2),2已知,假设 H0:=0;H1:0,构造U统计量,由,U检验,

20、双边检验,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定拒绝域,H0为真的前提下,例1 由经验知某零件的重量XN(,2),=15, =0.05;技术革新后,抽出6个零件,测得重量为 (单位:克)14.7 15.1 14.8 15.0 15.2 14.6,已 知方差不变,试统计推断,平均重量是否仍为15克? (=0.05),解 由题意可知:零件重量XN(,2),且技术 革新前后的方差不变2=0.052,要求对均值进行 检验,采用U检验法。,假设 H0:=15; H1: 15,构造U统计量,得U的0.05双侧分位数为,例1 由经验知某零件的重量XN(,2),=15, =0.05;技术革新后

21、,抽出6个零件,测得重量为 (单位:克)14.7 15.1 14.8 15.0 15.2 14.6,已 知方差不变,试统计推断,平均重量是否仍为15克? (=0.05),解,因为4.91.96 ,即观测值落在拒绝域内,所以拒绝原假设。,而样本均值为,故U统计量的观测值为,计算机实现步骤,1、输入样本数据,存入C1列,2、选择菜单StatBasic Statistics1-Sample Z,3、在Variables栏中,键入C1,在Sigma栏中键入 0.05,在Test Mean栏中键入15,打开Options 选项,在Confidence level栏中键入95,在 Alternative中

22、选择not equal,点击每个对话框 中的OK即可。,显示结果中的“P”称为尾概率,表示,显示结果,(1)因为,所以拒绝原假设,(2)因为,所以拒绝原假设,(3)因为,所以拒绝原假设,结果分析,H0:=0;H1:0,H0:=0;H1:0,或,单 边 检 验,拒绝域为,拒绝域为,例2 由经验知某零件的重量XN(,2),=15, =0.05;技术革新后,抽出6个零件,测得重量为 (单位:克)14.7 15.1 14.8 15.0 15.2 14.6,已 知方差不变,试统计推断,技术革新后,零件的平 均重量是否降低?(=0.05),解 由题意可知:零件重量XN(,2),且技术 革新前后的方差不变2

23、=0.052,要求对均值进行 检验,采用U检验法。,假设 H0:=15; H1: 15,构造U统计量,得U的0.05上侧分位数为,单侧检验,因为 ,即观测值落在拒绝域内,所以拒绝原假设,即可认为平均重量是降低了。,而样本均值为,故U统计量的观测值为,例2 由经验知某零件的重量XN(,2),=15, =0.05;技术革新后,抽出6个零件,测得重量为 (单位:克)14.7 15.1 14.8 15.0 15.2 14.6,已 知方差不变,试统计推断,技术革新后,零件的平 均重量是否降低?(=0.05),解,计算机实现步骤,1、输入样本数据,存入C1列,2、选择菜单StatBasic Statist

24、ics1-Sample Z,3、在Variables栏中,键入C1,在Sigma栏中键入 0.05,在Test Mean栏中键入15,打开Options 选项,在Confidence level栏中键入95,在 Alternative中选择less than,点击每个对话框 中的OK即可。,显示结果,(1)因为,所以拒绝原假设,(2)因为,所以拒绝原假设,(3)因为,所以拒绝原假设,结果分析,单个正态总体方差未知的均值检验,问题:总体 XN(,2),2未知,假设 H0:=0;H1:0,构造T统计量,由,T检验,双边检验,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定拒绝域,例3 化工厂

25、用自动包装机包装化肥,每包重量服从正态 分布,额定重量为100公斤。某日开工后,为了确定包 装机这天的工作是否正常,随机抽取9袋化肥,称得平 均重量为99.978,均方差为1.212,能否认为这天的包 装机工作正常?(=0.1),解 由题意可知:化肥重量XN(,2),0=100 方差未知,要求对均值进行检验,采用T检验法。,假设 H0:=100; H1: 100,构造T统计量,得T的0.1双侧分位数为,解,因为0.05451.86 ,即观测值落在接受域内,所以接受原假设,即可认为这天的包装机工作正常。,而样本均值、均方差为,故T统计量的观测值为,例3 化工厂用自动包装机包装化肥,每包重量服从正

26、态 分布,额定重量为100公斤。某日开工后,为了确定包 装机这天的工作是否正常,随机抽取9袋化肥,称得平 均重量为99.978,均方差为1.212,能否认为这天的包 装机工作正常?(=0.1),例3的计算机实现步骤,1、计算T统计量的观测值,2、计算t-分布的上侧0.05分位数,3、显示k1,k2,分析结果,如果,MTB InvCDF 0.95 k2; SUBC T 8.,MTB let k1=(99.978-100)*sqrt(9)/1.212,MTBPrint k1 k2,,则接受原假设;,否则,拒绝原假设。,P142例5的计算机实现步骤,1、输入样本数据,存入C2列,2、选择菜单Stat

27、Basic Statistics1-Sample T,3、在Variables栏中,键入C2,在Test Mean栏中 键入750,打开Options选项,在Confidence level 栏中键入95,在Alternative中选择not equal,点击 每个对话框中的OK即可。,显示结果,(1)因为,所以接受原假设,(2)因为,所以接受原假设,(3)因为,所以接受原假设,结果分析,H0:=0;H1:0,H0:=0;H1:0,或,单边检验,拒绝域为,拒绝域为,假设检验,单个正态总体方差已知的均值检验,问题:总体 XN(,2),2已知,假设 H0:=0;H1:0,构造U统计量,由,U检验,

28、双边检验,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定拒绝域,H0为真的前提下,H0:=0;H1:0,H0:=0;H1:0,或,单 边 检 验,拒绝域为,拒绝域为,单个正态总体方差未知的均值检验,问题:总体 XN(,2),2未知,假设 H0:=0;H1:0,构造T统计量,由,T检验,双边检验,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定拒绝域,H0:=0;H1:0,H0:=0;H1:0,或,单边检验,拒绝域为,拒绝域为,单个正态总体均值已知的方差检验,问题:总体 XN(,2),已知,构造2统计量,由,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定临界值,或,2检验,

29、假设,拒绝域,一个正态总体均值未知的方差检验,问题:设总体 XN(,2),未知,构造2统计量,由,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定临界值,或,2检验,假设,双边检验,例4 某炼铁厂的铁水含碳量X在正常情况下服从正态 分布,现对工艺进行了某些改进,从中抽取5炉铁水 测得含碳量如下:4.421,4.052,4.357,4.287, 4.683,据此是否可判断新工艺炼出的铁水含碳量的 方差仍为0.1082(=0.05)?,解 这是一个均值未知,正态总体的方差检验, 用2检验法,由=0.05,得临界值,假设,例4 某炼铁厂的铁水含碳量X在正常情况下服从正态 分布,现对工艺进行了某

30、些改进,从中抽取5炉铁水 测得含碳量如下:4.421,4.052,4.357,4.287, 4.683,据此是否可判断新工艺炼出的铁水含碳量的 方差仍为0.1082(=0.05)?,解,2统计量的观测值为17.8543,因为,所以拒绝原假设,即可判断新工艺炼出的铁水含碳量的方差不是0.1082,例4的计算机实现步骤,1、输入样本数据,存入C1列,3、计算2统计量的观测值,存入k2,2、计算样本的均方差,存入k1,MTBstdev c1 k1,MTB let k2=4*k1*2/0.108*2,4、确定临界值,MTB invcdf 0.025 c4; SUBC chisquare 4. MTB

31、invcdf 0.975 c5; SUBC chisquare 4.,0.975,0.025,?,临界值,17.8543,观测值,拒绝原假设,作业 P160-P161 3、4、5、7、13 预习试验二,两个正态总体 的 假 设 检 验,单个正态总体方差已知的均值检验,问题:总体 XN(,2),2已知,假设 H0:=0;H1:0,构造U统计量,由,U检验,双边检验,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定拒绝域,H0为真的前提下,H0:=0;H1:0,H0:=0;H1:0,或,单 边 检 验,拒绝域为,拒绝域为,单个正态总体方差未知的均值检验,问题:总体 XN(,2),2未知,假设

32、 H0:=0;H1:0,构造T统计量,由,T检验,双边检验,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定拒绝域,H0:=0;H1:0,H0:=0;H1:0,或,单边检验,拒绝域为,拒绝域为,单个正态总体均值已知的方差检验,问题:总体 XN(,2),已知,构造2统计量,由,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定临界值,或,2检验,假设,拒绝域,一个正态总体均值未知的方差检验,问题:设总体 XN(,2),未知,构造2统计量,由,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定临界值,或,2检验,假设,双边检验,有时,我们需要比较两总体的参数 是否存在显著差异。比如,

33、两个农作物 品种的产量,两种电子元件的使用寿命, 两种加工工艺对产品质量的影响,两地 区的气候差异等等。,引 言,两个正态总体的均值检验,已知 ,检验H0:,1、方差已知,检验均值相等,问题:,则,所以,,从而,当H0成立时,,对给定的检验水平 得H0的拒绝域:,U检验法,两个正态总体的均值检验,已知 ,检验H0:,1、方差已知,检验均值相等,问题:,解 假设:,因为:,所以接受H0假设,即认为 A、B两法的平均产量无统计意义。,例1 据以往资料,已知某品种小麦每4平方米产量(千克)的 方差为 。今在一块地上用A,B 两法试验,A 法设12个样本点,得平均产量 ;B 法设8个样本 点,得平均产

34、量 ,试比较A、B两法的平均产量 是否有统计意义。,两个正态总体的均值检验,2、方差未知,但两个总体的方差相等,检验均值相等,问题:,未知 ,但知 ,检验H0:,由P107 定理5.3,知,对给定的检验水平 得H0的拒绝域:,若 H0 成立,则,T检验法,两个正态总体的均值检验,2、方差未知,但两个总体的方差相等,检验均值相等,解 假设:,所以拒绝H0假设,即认为 A、B两种灯泡的平均寿命 有统计意义。,未知 ,检验假设H0:,若假设H0成立,则,对给定的检验水平 得H0的拒绝域:,及,两个正态总体的方差检验,问题:,由P109 定理5.4 ,知,F检验,例3 (P161 Ex20)测得两批电

35、子器材的样本的电阻为: (单位:) 第一批:0.140 0.138 0.143 0.142 0.144 0.137 第二批:0.135 0.140 0.142 0.136 0.138 0.140 设这两批器材的电阻均服从正态分布,试检验 H0:,解 这是一个两正态总体的方差检验问题,用F检验法,由样本观测数据得,假设,所以,而,所以,接受原假设,即可认为两批电子器材的方差相等,例4 P161 14 对甲、乙两种玉米进行评比试验,得如下产量资料: 甲:951 966 1008 1082 983 乙:730 864 742 774 990 问这两种玉米的产量差异有没有统计意义?,解 先对方差作检验

36、:,因为,所以可认为甲、乙两种玉米的方差没有显著差异 即可认为,例4 对甲、乙两种玉米进行评比试验,得如下产量资料 甲:951 966 1008 1082 983 乙:730 864 742 774 990 问这两种玉米的产量差异有没有统计意义?,解:再对均值作检验:,因为已假设方差相等,故用 T 检验。,所以拒绝原假设 H20,即认为两种玉米的产量差异 有统计意义。,单因素试验 的方差分析,在工农业生产和科研活动中,我们经常遇到这样的问题:影响产品产量、质量的因素很多,例如影响农作物的单位面积产量有品种、施肥种类、施肥量等许多因素。我们要了解这些因素中哪些因素对产量有显著影响,就要先做试验,

37、然后对测试结果进行分析,作出判断。方差分析就是分析测试结果的一种方法。,引 言,基 本 概 念,试验指标试验结果。,可控因素在影响试验结果的众多因素中,可人为 控制的因素。,水平可控因素所处的各种各种不同的状态。每个 水平又称为试验的一个处理。,单因素试验如果在一项试验中只有一个因素改变, 其它的可控因素不变,则该类试验称为 单因素试验。,引例,例1 (灯丝的配料方案优选)某灯泡厂用四种配料方案制成的灯丝生产了四批灯泡,在每批灯泡中作随机抽样,测量其使用寿命(单位:小时),数据如下:,灯泡的使用寿命试验指标,灯丝的配料方案试验因素(唯一的一个),四种配料方案(甲乙丙丁)四个水平,因此,本例是一

38、个四水平的单因素试验。,引 例,用X1,X2,X3,X4分别表示四种灯泡的使用寿命,即为 四个总体。假设X1,X2,X3,X4相互独立,且服从方差 相同的正态分布,即XiN(i,2)(i=1,2,3,4),本例问题归结为检验假设 H0:1= 2= 3= 4 是否成立,我们的目的是通过试验数据来判断因素 A 的不同水平对试验指标是否有影响。,设 A 表示欲考察的因素,它的 个不同水平,对应的指标视作 个总体 每个水平下,我们作若干次重复试验: (可等重复也可不等重复),同一水平的 个结果,就是这个总体 的一个样本:,单因素试验的方差分析,单因素试验资料表,纵向个体间的差异称为随机误差(组内差异)

39、,由试验造成;横向个体间的差异称为系统误差(组间差异),由因素的不同水平造成。,由于同一水平下重复试验的个体差异是随机误差,所以设:,其中 为试验误差,相互独立且服从正态分布,线性统计模型,单因素试验的方差分析的数学模型,具有方差齐性。,相互独立,从而各子样也相互独立。,首先,我们作如下假设:,即,令 (其中 )称为一般平均值。,称为因素A的第 个水平 的效应。,则线性统计模型变成,于是检验假设:,等价于检验假设:,显然有:,整个试验的均值,考察统计量,经恒等变形,可分解为:,其中,反映的是各水平平均值偏离总平均值的偏离程度。,如果H0 成立,则SSA 较小。,若H0成立,则,总离差平方和,见

40、书P168,其中,这里,反映的是重复试验种随机误差的大小。,表示水平Ai的随机误差; 表示整个试验的随机误差,若假设 成立,则,由P106定理5.1可推得:,将 的自由度分别记作,则,(记 ,称作均方和),(各子样同分布),则,(记 ,称作均方和),对给定的检验水平 ,由,得H0 的拒绝域为:,F 单侧检验,结论:方差分析实质上是假设检验,从分析离差平方和入手,找到F统计量,对同方差的多个正态总体的均值是否相等进行假设检验。单因素试验中两个水平的均值检验可用第七章的T检验法。,思考:为什么此处只做单侧检验?,(1)若 ,则称因素的差异极显著(极有统计意义),或称因素A的影响高度显著,这时作标记

41、 ;,约 定,(2)若 ,则称因素的差异显著(差异 有统计意义),或称因素A的影响显著,作标记 ;,(3)若 ,则称因素A有一定影响,作标记( );,(4)若 ,则称因素A无显著影响(差异无统计意义)。,注意:在方差分析表中,习惯于作如下规定:,简便计算公式:,其中,同一水平下观测值 之和,所以观测 值之和,例2 P195 2 以 A、B、C 三种饲料喂猪,得一个月后每猪 所增体重(单位:500g)于下表,试作方差分析。,解:,解:,不同的饲料对猪的体重的影响极有统计意义。,列方差分析表,例2的上机实现步骤,1、输入原始数据列,并存到A,B,C列;,2、选择StatANOVAone-way(u

42、nstacked),不同的饲料对猪的体重的影响极有统计意义。,定理 在单因素方差分析模型中,有,如果H0不成立,则,所以,,即H0不成立时,,有大于1的趋势。,所以H0为真时的小概率事件应取在F值较大的一侧。,双因素试验方差分析,双因素试验的方差分析,在实际应用中,一个试验结果(试验指标)往往受多个因素的影响。不仅这些因素会影响试验结果,而且这些因素的不同水平的搭配也会影响试验结果。,例如:某些合金,当单独加入元素A或元素B时, 性能变化不大,但当同时加入元素A和B时,合金性 能的变化就特别显著。,统计学上把多因素不同水平搭配对试验指标的 影响称为交互作用。交互作用在多因素的方差分析 中,把它

43、当成一个新因素来处理。,我们只学习两个因素的方差分析,更多因素的 问题,用正交试验法比较方便。,无交互作用的双因素试验的方差分析,数学模型,假设某个试验中,有两个可控因素在变化,因素A有a个水平,记作A1,A2,Aa;因素B有b个水平,记作B1,B2,.Bb;则A与B的不同水平组合AiBj(i=1,2,a;j=1,2,b)共有ab个,每个水平组合称为一个处理,每个处理只作一次试验,得ab个观测值Xij,得双因素无重复实验表,双因素无重复(无交互作用)试验资料表,无交互作用的双因素试验的方差分析,线性统计模型,基本假设(1) 相互独立; (2) ,(方差齐性)。,其中,所有期望值的总平均,水平A

44、i对试验结果的效应,水平Bj对试验结果的效应,试验误差,特性:,水平Ai对试验结果的效应,水平Bj对试验结果的效应,试验误差,要分析因素A,B的差异对试验结果是否有显著 影响,即为检验如下假设是否成立:,总离差平方和的分解定理,仿单因素方差分析的方法,考察总离差平方和,可分解为:,称为因素A的离差平方和, 反映因素 A 对试验指标的影响。,称为因素B的离差平方和, 反映因素 B 对试验指标的影响。,称为误差平方和,反映试验误差对试验指标的影响。,可推得:,将 的自由度分别记作,,则,若假设 成立,则:,对给定的检验水平 ,,拒绝H01,即A 因素的影响有统计意义。,拒绝H02,即B 因素的影响

45、有统计意义。,双因素(无交互作用)试验的方差分析表,注意,各因素离差平方和的自由度为水平数减一,总平方和的自由度为试验总次数减一。,双因素(无交互作用)试验的方差分析表,简便计算式:,其中:,例1 设甲、乙、丙、丁四个工人操作机器、各一天, 其产品产量如下表,问工人和机器对产品产量是否有显著 影响?,解 基本计算如原表,结论:工人对产品的产量有显著影响, 机器对产品的产量有极显著影响。,例1的上机操作,对应例1 的数据输入方式,原始数据,行因素水平,列因素水平,(A),(B),工人对产品产量有显著影响,而机器对产品产量的影响极显著。,有交互作用的双因素试验的方差分析,线性统计模型,基本假设(1

46、) 相互独立; (2) ,(方差齐性)。,有检验交互作用的效应,则两因素A,B的不同水 平的搭配必须作重复试验。,处理方法:把交互作用当成一个新因素来处理, 即把每种搭配AiBj看作一个总体Xij。,观测值,总平均,因素A 的效应,因素B 的效应,交互作用 的效应,试验误差,有交互作用的双因素试验的方差分析,线性统计模型,其中,所有期望值的总平均,水平Ai对试验结果的效应,水平Bj对试验结果的效应,试验误差,交互效应,特性:,要判断因素A,B及交互作用AB对试验结果是否 有显著影响,即为检验如下假设是否成立:,总离差平方和的分解定理,仿单因素方差分析的方法,考察总离差平方和,可分解为:,SSA称为因素A的离差平方和,反映因素 A 对试验指标的影响。 SSB称为因素B的离差平方和,反映因素 B 对试验指标的影响。SSAB称为交互作用的离差平方和,反映交互作用AB对

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1