1、第十二章第十二章 假设检验假设检验 假设检验的基本原理假设检验的基本原理 显著水平检验法与正态总体检验显著水平检验法与正态总体检验第十二章第十二章 假设检验假设检验 假设检验是对总体的分布函数的形式或分布中某假设检验是对总体的分布函数的形式或分布中某些参数做出某种假设些参数做出某种假设,然后通过抽取样本然后通过抽取样本,构造适当的构造适当的统计量统计量,对假设的正确性进行判断的过程对假设的正确性进行判断的过程.前面我们讨论了在总体分布族已知的情况下前面我们讨论了在总体分布族已知的情况下,如何如何根据样本去得到参数的优良估计根据样本去得到参数的优良估计.但有时但有时,我们并不需我们并不需要估计某
2、个参数的具体值而只需验证它是否满足某个要估计某个参数的具体值而只需验证它是否满足某个条件条件,这就是这就是统计假设检验问题统计假设检验问题.第十二章第十二章 假设检验假设检验假设检验假设检验参数假设检验参数假设检验非参数假设检验非参数假设检验总体分布已知,总体分布已知,检验关于未知参数检验关于未知参数的某个假设的某个假设总体分布未知时的总体分布未知时的假设检验问题假设检验问题第一节第一节 检验的基本原理检验的基本原理 一、检验问题的提法一、检验问题的提法 假设检验是既同估计密切联系,但又有重要区别假设检验是既同估计密切联系,但又有重要区别的一种推断方法。的一种推断方法。例如:某种电子元件寿命例
3、如:某种电子元件寿命X X服从参数为服从参数为的指数分布,的指数分布,随机抽取其中的随机抽取其中的n件。测得其寿命数据,件。测得其寿命数据,问题问题,这批元件的平均寿命是多少?,这批元件的平均寿命是多少?问题问题,按规定该型号元件当寿命不小于,按规定该型号元件当寿命不小于5000(h)为为合格,问该批元件是否合格?合格,问该批元件是否合格?问题问题是对总体未知参数是对总体未知参数=E(X)=1/作出估计。回作出估计。回答答“是多少?是多少?”,是定量的。问题,是定量的。问题则是对假设则是对假设“这这批元件合格批元件合格”做出接受还是拒绝的回答,因而是定做出接受还是拒绝的回答,因而是定性的。性的
4、对上述例子,还可做更细致考察,设想如基于一次观察对上述例子,还可做更细致考察,设想如基于一次观察数据算出数据算出的估计值的估计值 ,我们能否就此接受,我们能否就此接受“这这批批元件合格元件合格”的这一假设呢?的这一假设呢?尽管尽管 但这个估但这个估计仅仅计仅仅是一次试验的结果,能否保证下一次测试结果也能得到是一次试验的结果,能否保证下一次测试结果也能得到的的估计值大于估计值大于5000呢?呢?也就是说从观察数据得到的结果也就是说从观察数据得到的结果 与参考值与参考值5000的差异仅仅是偶然的呢?还是总体均值的差异仅仅是偶然的呢?还是总体均值确实确实有大于有大于5000的的“趋势趋势”?这些问
5、题是以前没有研究过的。一般而言,估计问题是这些问题是以前没有研究过的。一般而言,估计问题是回答总体分布的未知参数是多少?或范围有多大?而假设检回答总体分布的未知参数是多少?或范围有多大?而假设检验问题则是回答观察到的数据差异只是机会差异,还是反映验问题则是回答观察到的数据差异只是机会差异,还是反映了总体的真实差异?因此两者对问题的提法有本质不同。了总体的真实差异?因此两者对问题的提法有本质不同。第一节第一节 检验的基本原理检验的基本原理 下面通过一个例子介绍下面通过一个例子介绍原假设和备择假设原假设和备择假设二二.原假设和备择假设原假设和备择假设第一节第一节 检验的基本原理检验的基本原理例例1
6、 1(酒精含量酒精含量)一种无需医生处方即可达到的治一种无需医生处方即可达到的治疗咳嗽和鼻塞的药。按固定其酒精含量为疗咳嗽和鼻塞的药。按固定其酒精含量为5 5.今从今从一出厂的一批药中随机抽取一出厂的一批药中随机抽取1010瓶瓶,测试其酒精含量测试其酒精含量得到的得到的1010个含量的百分数个含量的百分数:5.01,4.87,5.11,5.21,5.03,4.96,4.78,4.98,4.88,5.06如果酒精含量服从正态分布如果酒精含量服从正态分布N(,0.00016),问该批药问该批药品的酒精含量是否合乎规定品的酒精含量是否合乎规定?任务任务:通过样本推断通过样本推断X X的均值的均值是否
7、等于是否等于5.假设假设:上面的任务就是要通过样本去检验上面的任务就是要通过样本去检验“X X的均值的均值=5”这样一个假设是否成立这样一个假设是否成立.(.(在数理统计中把在数理统计中把“X X的的均值均值=5=5”这样一个待检验的假设记作这样一个待检验的假设记作“H H0 0:=5”:=5”称称为为 “原假设原假设”或或“零假设零假设”.表明数据的表明数据的“差异差异”是偶然的是偶然的,总体没有总体没有“变异变异”发生发生.原假设的对立面是原假设的对立面是“X X的均值的均值1010”记作记作“H H1 1:10”10”称为称为“对立假设对立假设”或或“备择假设备择假设”.表表明数据的明数
8、据的“差异差异”不是偶然的不是偶然的,是总体是总体“变异变异”的的表现表现.把它们合写在一起就是把它们合写在一起就是:H H0 0:=10 :=10 H H1 1:1010 原假设原假设H H0 0表明含量符合规定,这个表明含量符合规定,这个55也称之为也称之为期望数,尽管期望数,尽管1010个数据都个数据都55与有出入,这只是抽样与有出入,这只是抽样的随机性所致的随机性所致;备择假设备择假设H H1 1表明总体均值表明总体均值已经偏离已经偏离了期望数了期望数55,数据与期望数,数据与期望数55的差异是其表现的差异是其表现.假设检验假设检验的的任务任务 必须在原假设与必须在原假设与备择备择假设
9、假设之间作一选择之间作一选择检验统计量检验统计量是构造一个适当的能度量观察数与原假是构造一个适当的能度量观察数与原假设下的期望数之间的差异程度的统计量设下的期望数之间的差异程度的统计量,此统计量为此统计量为检验统计量检验统计量.特点特点:在原假设在原假设H0下分布式完全一致或者说可以计算下分布式完全一致或者说可以计算.因而通过标准化因而通过标准化 可得到检验统计量可得到检验统计量三三.检验统计量检验统计量 本例的观察数通过样本平均本例的观察数通过样本平均 表示表示,它是它是的一的一个无偏估计个无偏估计,而而H0在下的期望数为在下的期望数为=5,5,在在H H0 0下下 从试验数据判断是否导致一
10、个矛盾的结果从试验数据判断是否导致一个矛盾的结果,一个重一个重要的依据是小概率事件的实际推断原理要的依据是小概率事件的实际推断原理.看例看例1,1,由由观察数据观察数据,可算得的可算得的 观察值为观察值为4.989,4.989,代入统计量代入统计量Z Z的表达式的表达式,得得Z Z的观察值为的观察值为 四四.否定论证及实际推断原理否定论证及实际推断原理 否定论证是假设检验的重要推理方法否定论证是假设检验的重要推理方法,其要旨是其要旨是:先假定原假设先假定原假设H H0 0成立成立,如果从试验观察数据及此假定如果从试验观察数据及此假定将导致一个矛盾的结果将导致一个矛盾的结果,则必须否定这个原假设
11、则必须否定这个原假设;反之反之,如果不出矛盾的结果如果不出矛盾的结果,就不能否定原假设就不能否定原假设.在在H H0 0下下,Z服从标准正态分布服从标准正态分布,对于特定的一次试验对于特定的一次试验,统计量统计量Z取得观察值取得观察值-2.7509,是十分罕见的,以至于,是十分罕见的,以至于实际不会发生实际不会发生.事实上事实上,当当H H0 0成立时成立时,事件事件发生的机会只有发生的机会只有5(5(如图如图)这是一个小概率事件这是一个小概率事件.今从试验数据得到今从试验数据得到Z=-2.7509,Z=-2.7509,由于由于 表明这一小概率事件在该次试验中发生表明这一小概率事件在该次试验中
12、发生,这与实际这与实际推断原理矛盾推断原理矛盾.因此否定原假设因此否定原假设.至此本例已获得解答至此本例已获得解答,即基于即基于数据该批药品的酒精含量不符合规定数据该批药品的酒精含量不符合规定.注意注意:在否定论中最终能否得出矛盾的结果,取决于数据在否定论中最终能否得出矛盾的结果,取决于数据.02.51.96-1.96-2.7509第二节第二节 显著水平检验法与正态总体检验显著水平检验法与正态总体检验一一.假设检验的两类错误假设检验的两类错误 一类错误是一类错误是,当当H H0 0为真时为真时,因为尽管事件因为尽管事件A|HA|H0 0 是小概率事件是小概率事件,但仍有可能发生但仍有可能发生,
13、即样本观察值即样本观察值(x x1 1,x x2 2,.,.,x xn n)R R时时,按检验法则将拒绝原假设按检验法则将拒绝原假设H H0 0,这种错误称为这种错误称为第一类错误第一类错误.根据检验法则根据检验法则,若若A A发生则拒绝发生则拒绝H H0 0,否则接受否则接受H H0 0.这不免要犯二类错误这不免要犯二类错误.第二节第二节 显著水平检验法与正态总体检验显著水平检验法与正态总体检验一一.假设检验的两类错误假设检验的两类错误 另一类错误是另一类错误是,当原假设当原假设H H0 0不真不真,即即H H1 1为真时为真时,A,A也也有可能不发生有可能不发生,即样本观察值即样本观察值(
14、x x1 1,x x2 2,.,.,x xn n)R)R*,按按检验法则将接受原假设检验法则将接受原假设H H0 0,这种错误称为这种错误称为第二类错误第二类错误.第二节第二节 显著水平检验法与正态总体检验显著水平检验法与正态总体检验正确正确正确正确H H0 0 为真为真H H0 0 为假为假真实情况真实情况所作判断所作判断接受接受 H H0 0拒绝拒绝 H H0 0第一类错误第一类错误(弃真弃真)第二类错误第二类错误(取伪取伪)注意注意:不可能消除这两种错误不可能消除这两种错误,而只能控制发生而只能控制发生这两类错误之一的概率这两类错误之一的概率.一一.假设检验的两类错误假设检验的两类错误第
15、二节第二节 显著水平检验法与正态总体检验显著水平检验法与正态总体检验 我们当然希望独两类错误的概率都很小我们当然希望独两类错误的概率都很小,但在样本容但在样本容量量n n固定时是无法做到的固定时是无法做到的.基于这种情况基于这种情况,且因为人们常常且因为人们常常把拒绝把拒绝H H0 0比错误地接受比错误地接受H H0 0看得更重些看得更重些.因此人们希望在控因此人们希望在控制犯第一类错误的概率制犯第一类错误的概率的条件下的条件下,尽量使犯第二类错误尽量使犯第二类错误的概率小的概率小,但这也是不容易的但这也是不容易的,有时甚至是不可能的有时甚至是不可能的.于是于是人们不得不降低要求人们不得不降低
16、要求,只对犯第一类错误的概率只对犯第一类错误的概率加以限加以限制制,而不考虑犯第二错误的概率而不考虑犯第二错误的概率,在这种原则下在这种原则下,寻找临界寻找临界域域C C时只涉及原假设时只涉及原假设H H0 0,而不涉及备择假设而不涉及备择假设H H1 1,这种统计假这种统计假设问题称为设问题称为显著性检验显著性检验问题问题.对给定的犯第一类错误的概率对给定的犯第一类错误的概率称为称为显著性水平显著性水平.第二节第二节 显著水平检验法与正态总体检验显著水平检验法与正态总体检验二二.显著水平检验法显著水平检验法 显著水平检验法显著水平检验法:在数据收集之前就已经设定好一在数据收集之前就已经设定好
17、一个检验规则个检验规则,即文献上称之为拒绝域即文献上称之为拒绝域R R,使得当样本观察使得当样本观察值落入值落入R R就拒绝就拒绝H H0 0.对拒绝域对拒绝域R R的要求是的要求是:在在H H0 0 下下 样本落入样本落入RR为一小概率为一小概率事件事件,即对预先给定的即对预先给定的0011有有 P(P(样本落入样本落入R|HR|H0 0)此时称此时称R R所代表的检验为显著水平所代表的检验为显著水平的检验的检验第二节第二节 显著水平检验法与正态总体检验显著水平检验法与正态总体检验(1)(1)根据问题的要求建立原假设根据问题的要求建立原假设H H0 0和备择假设和备择假设H H1 1;假设检
18、验的方法步骤假设检验的方法步骤(2)(2)选取检验统计量选取检验统计量T(XT(X1 1,X,X2 2,.,.,X Xn n),),要求要求T T不含任何不含任何参数参数,以便计算以便计算H H0 0为真时的条件概率为真时的条件概率;(3)(3)给定显著性水平给定显著性水平,求出使求出使PTR|HPTR|H0 0的临界的临界域域C;C;(4)(4)若样本观察值若样本观察值T(T(x x1 1,x x2 2,.,.,x xn n)R)R,则拒绝原假设则拒绝原假设H H0 0,否则接受否则接受H H0 0.第二节第二节 显著水平检验法与正态总体检验显著水平检验法与正态总体检验1).1).方差已知时
19、总体均值的假设检验方差已知时总体均值的假设检验1 1 两个正态总体的假设检验两个正态总体的假设检验第二节第二节 显著水平检验法与正态总体检验显著水平检验法与正态总体检验第二节第二节 显著水平检验法与正态总体检验显著水平检验法与正态总体检验找临界值u/2示意图0a/2ua/2a/2-ua/2第二节第二节 显著水平检验法与正态总体检验显著水平检验法与正态总体检验作为未知参数作为未知参数的点估计的点估计,因此因此 偏小应该拒绝偏小应该拒绝H H0 0.若若H0成立成立,例例3 3 某降价盒装饼干,其包装上的广告上称每盒质量为某降价盒装饼干,其包装上的广告上称每盒质量为269g269g.但有顾客投诉,
20、钙饼干质量不足但有顾客投诉,钙饼干质量不足269g269g。为此质检部门从准备出。为此质检部门从准备出厂的一批盒装饼干中,随机抽取厂的一批盒装饼干中,随机抽取3030盒,由测得的盒,由测得的3030个质量数据个质量数据算出样本平均为算出样本平均为268.268.假设盒装饼干质量服从正态分布假设盒装饼干质量服从正态分布N(N(,2 22 2),),以显著水平以显著水平=0.05=0.05检验该产品广告是否真实检验该产品广告是否真实.解解:依题意依题意,可设原假设可设原假设H H0 0:=269 :=269 备择假设备择假设 H H1 1:269269则有则有则在下则在下Z ZN(0,1),N(0
21、1),即即Z Z的分布已知,因而的分布已知,因而Z Z可以做检验统计量,可以做检验统计量,偏小等价于偏小等价于Z Z偏小,从而得到拒绝域的形式如下偏小,从而得到拒绝域的形式如下其中其中k k待定,称之为待定,称之为临界值临界值.=0.05,为求显著水平为求显著水平0.05的检验的检验,只需选取只需选取k使得使得查表可得查表可得因而得到水平因而得到水平0.050.05检验的拒绝域检验的拒绝域代入数据得代入数据得Z=-2.74,Z=-2.74,显然小于临界值显然小于临界值-1.645,-1.645,因而依据检验因而依据检验规则应该拒绝规则应该拒绝H0,即该盒装广告又不是广告行为即该盒装广告又不是
22、广告行为.第二节第二节 显著水平检验法与正态总体检验显著水平检验法与正态总体检验).).方差未知时总体均值的双侧假设检验方差未知时总体均值的双侧假设检验第二节第二节 显著水平检验法与正态总体检验显著水平检验法与正态总体检验第二节第二节 显著水平检验法与正态总体检验显著水平检验法与正态总体检验找临界值t/2示意图0a/2a/2-ta/2(n-1)ta/2(n-1)第二节第二节 显著水平检验法与正态总体检验显著水平检验法与正态总体检验其中其中未知未知.今用今用S S*代替代替,得到得到t t的统计量的统计量例例4.4.在在例例3中中,若盒装饼干重量服从正态分布若盒装饼干重量服从正态分布N(,2),
23、与与2 2均未知均未知,已知样本平均已知样本平均 ,修正样本标准差为修正样本标准差为S S*=1.8,=1.8,求解求解相同的问题相同的问题.解解:此时不能使用此时不能使用Z Z作为统计量作为统计量,因为标准化变量为因为标准化变量为由正态总体抽样分布基本定理可知由正态总体抽样分布基本定理可知,在在H H0 0下下可得到拒绝域的形式如下可得到拒绝域的形式如下其中其中k k待定,称之为待定,称之为临界值临界值.=0.05,为求显著水平为求显著水平0.05的检验的检验,只需选取只需选取k使得使得因而得到水平因而得到水平0.050.05检验的拒绝域检验的拒绝域代入数据得代入数据得t=-3.044,t=
24、3.044,显然小于临界值显然小于临界值-1.699,-1.699,因而依据检验因而依据检验规则应该拒绝规则应该拒绝H0,即该盒装广告有不实广告行为即该盒装广告有不实广告行为.第二节第二节 显著水平检验法与正态总体检验显著水平检验法与正态总体检验2 2 两个正态总体的假设检验两个正态总体的假设检验第二节第二节 显著水平检验法与正态总体检验显著水平检验法与正态总体检验1).1).方差已知时均值的双侧假设检验方差已知时均值的双侧假设检验因为 当H0成立时,统计量第二节第二节 显著水平检验法与正态总体检验显著水平检验法与正态总体检验从而,对于给定的显著性水平,拒绝域为 第二节第二节 显著水平检验法
25、与正态总体检验显著水平检验法与正态总体检验2).2).方差未知时均值的双侧假设检验方差未知时均值的双侧假设检验第二节第二节 显著水平检验法与正态总体检验显著水平检验法与正态总体检验第二节第二节 显著水平检验法与正态总体检验显著水平检验法与正态总体检验例例5.5.为评估某地区中学教学改革后教学质量情况,分别在为评估某地区中学教学改革后教学质量情况,分别在19951995年,年,19991999年举行两次数学考试,考生是从该地区中学的年举行两次数学考试,考生是从该地区中学的1717岁学生中随机抽取,每次岁学生中随机抽取,每次100100个。两次考试的平均得分分别为个。两次考试的平均得分分别为63.
26、5,67.0.63.5,67.0.假定两次数学考试成绩假定两次数学考试成绩服从正态分布服从正态分布N(N(,2 2),),N(N(,2 2),),分别在下列情况下分别在下列情况下,对显著水平对显著水平=0.05=0.05检验该地检验该地区数学成绩有无提高区数学成绩有无提高.(1).(1).已知已知1 1=2.1,=2.1,2 2=2.2.=2.2.(2).(2).假设假设1 1=2 2=但但未知未知,且两次考试成绩的样本方差为且两次考试成绩的样本方差为S S1 12 2=1.9=1.92 2,S S2 22 2=2.01=2.012 2解解:由题意由题意,可设原假设可设原假设H H0 0:1
27、1=2 2,备择假设备择假设H H1 1:1 1 2.2.分别记分别记19951995年的样本平均为年的样本平均为 ,1999,1999年的为年的为 ,可用可用 作作1 1-2 2的点估计的点估计,因此当因此当 偏大时偏大时,应拒绝应拒绝H H0 0 偏大等价于偏大等价于Z Z偏大偏大,故有拒绝域故有拒绝域(1)(1)因在因在H H0 0下下 ,标准化标准化 得到检验统得到检验统计量计量=0.05,为求显著水平为求显著水平0.05的检验的检验,只需选取只需选取k使得使得代入数据得代入数据得z=11.513,z=11.513,显然大于临界值显然大于临界值1.645,1.645,因而依据检验因而依据检验规则应该拒绝规则应该拒绝H0,即认为数学成绩有提高即认为数学成绩有提高.(2)(2)因在因在H H0 0下下 可用可用=0.05,为求显著水平为求显著水平0.05的检验的检验,只需选取只需选取k使得使得代入数据得代入数据得t=12.591,t=12.591,仍然大于临界值仍然大于临界值1.645,1.645,因而依据检验因而依据检验规则应该拒绝规则应该拒绝H0,即认为数学成绩有提高即认为数学成绩有提高.