第十部分双样本假设检验及区间估计.ppt

上传人:本田雅阁 文档编号:2275611 上传时间:2019-03-15 格式:PPT 页数:50 大小:1.52MB
返回 下载 相关 举报
第十部分双样本假设检验及区间估计.ppt_第1页
第1页 / 共50页
第十部分双样本假设检验及区间估计.ppt_第2页
第2页 / 共50页
第十部分双样本假设检验及区间估计.ppt_第3页
第3页 / 共50页
亲,该文档总共50页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第十部分双样本假设检验及区间估计.ppt》由会员分享,可在线阅读,更多相关《第十部分双样本假设检验及区间估计.ppt(50页珍藏版)》请在三一文库上搜索。

1、2019/3/15,1,第十章 双样本假设检验及区间估计,我们在掌握了单样本检验与估计的有关方法与原理 之后,把视野投向双样本检验与估计是很自然的。双样 本统计,除了有大样本、小样本之分外,根据抽样之不 同,还可分为独立样本与配对样本。,独立样本, 指双样本是在两个总体中相互独立地抽取的 。,配对样本,指只有一个总体,双样本是由于样本中的个体两两匹配成对而产生的。配对样本相互之间不独立。,2019/3/15,2,第一节 两总体大样本假设检验,为了把单样本检验推广到能够比较两个样本的均值的检验,必须 再一次运用中心极限定理。下面是一条由中心极限定理推广而来的重 要定理:如果从 和 两个总体中分别

2、抽取容量为 n1和n2 的独立随机样本,那么两个样本的均值差 的抽样分 布就是 。与单样本的情况相同,在大样本的 情况下(两个样本的容量都超过50),这个定理可以推广应用于任何具 有均值1和2以及方差 和 的两个总体。当n1和n2逐渐变大 时, 的抽样分布像前面那样将接近正态分布。,2019/3/15,3,1大样本均值差检验 (1)零假设: (2)备择假设: 单侧 双侧 或 (3)否定域:单侧 双侧 (4)检验统计量 (5)比较判定,2019/3/15,4,例为了比较已婚妇女对婚后生活的态度是否因婚 龄而有所差别,将已婚妇女按对婚后生活的态度分为“满 意”和“不满意”两组。从满意组中随机抽取6

3、00名妇女, 其平均婚龄为8.5年,标准差为2.3年;从不满意组抽出 500名妇女,其平均婚龄为9.2年,标准差2.8年。试问在 0.05显著性水平上两组是否存在显著性差异?,2019/3/15,5,解 据题意, “不满意”组的抽样结果为: 9.2年, S12.8年, n1500; “满意”组的抽样结果为: 8.5 年,S22.3 年, n2600。 H0:12D00 H1: 12 0 计算检验统计量 确定否定域, 因为0.05,因而有 Z/21.964.47 因此否定零假设,即可以认为在0.05显著性水平上,婚龄对妇女婚 后生活的态度是有影响的。同时我们看到,由于样本计算值Z4.47 远大

4、于单侧 Z0.05 的临界值1. 65,因此本题接受12 0 的备择假设,即可 以认为妇女婚龄长容易对婚后生活产生“不满意”。,2019/3/15,6,2大样本成数差检验 (1)零假设: (2)备择假设: 单侧 双侧 或 (3)否定域:单侧 双侧 (4)检验统计量,其中: 为总体1的 样本成数 为总体2的 样本成数。,2019/3/15,7,当p1和p2未知,须用样本成数 和 进行估算时,分以下两 种情况讨论: 若零假设中两总体成数的关系为 ,这时两总体可看作成数 P 相同的总体,它 们的点估计值为 此时上式中检验 统计量 Z 可简化为 若零假设中两总体成数 ,那么它们的点估计值有 此时上式中

5、 检验统计量Z为,(5)判定,2019/3/15,8,例有一个大学生的随机样本,按照性格“外向”和 “内向”,把他们分成两类。结果发现,新生中有73属 于“外向”类,四年级学生中有58属于“外向”类。样本 中新生有171名,四年级学生有117名。试问,在0.01水平 上,两类学生有无显著性差异?,2019/3/15,9,解 据题意 新生组的抽样结果为: 0.73, 0.27,n1171 四年级学生组的抽样结果为: 0.58, 0.42,n2117 H0:p1p2D00 H1:p1p2D00 计算检验统计量 确定否定域 因为0.01,因而有 Z/2Z0.0052.582.66 因而否定零假设,即

6、可以认为在0.01显著性水平上,两类学生在 性格上是有差异的。,2019/3/15,10,第二节 两总体小样本假设检验,与对单总体小样本假设检验一样,我们对两 总体小样本假设检只讨论总体满足正态分布的情 况。 1. 小样本均值差假设检验 (1) 当 和 已知时,小样本均值差 检验,与上一节所述大样本总体均值差检验完全 相同,这里不再赘述。,2019/3/15,11,(2) 和 未知,但假定它们相等时, 关键是要解决 的算式。,现又因为未知,所以要用它的 无偏估计量 替代它。由于两个样 本的方差基于不同的样本容量,因而 可以用加权的方法求出的无偏估计 量,得 注意,上式的分母上减2,是因为 根据

7、 和 计算S1和S2时,分别损 失了一个自由度,一共损失了两个自由 度,所以全部自由度的数目就成为 (n1+ n22)。 于是有,2019/3/15,12,这样,对小样本正态总体, 和 未知,但12 , 其均值差的检验步骤如下: (1)零假设: (2)备择假设: 单侧 双侧 或 (3)否定域:单侧 双侧 (4)检验统计量 (5)比较判定,2019/3/15,13,例为研究某地民族间家庭规模是否有所不同,各做 如下独立随机抽样: 民族A:12户,平均人口6.8人,标准差1.5人 民族B:12户,平均人口5.3人,标准差0.9人 问:能否认为A民族的家庭平均人口高于B民族的家 庭平均人口( =0.

8、05)?(假定家庭平均人口服从正态 分布,且方差相等)t=2.97 例 某市对儿童体重情况进行调查,抽查8岁的女孩 20人,平均体重22.2千克,标准差2.46千克;抽查8岁的 男孩18人,平均体重21.3千克,标准差1.82千克。若男女 儿童体重的总体方差相等,问在显著性水平5%上,该年 龄男女儿童之体重有无显著差异?,2019/3/15,14,解 据题意, 女孩组的抽样结果为: 22.2(千克), S12.46(千克),n120(人) 男孩组的抽样结果为: 21.3(千克),S21.82(千克), n218(人) H0:12D00 H1:120 计算检验统计量 确定否定域 因0.05,因而

9、有t 0.025 (36)2.0281.24 故不能否定H0,即可认为男女儿童平均体重无显著性差异。,2019/3/15,15,(3) 和 未知,但不能假定它们相等 如果不能假定12 ,那么就不能引进共同的简化 ,也不能计算的无偏估计量 。现在简单的做法是用 估计 ,用 估计 ,于是有,例 用上式重新求解前例题。 解 用上式,检验统计量的计算为 可以看出,求算用(10.8)式和(10.10)式,得出的结果差别不大。,2019/3/15,16,2小样本方差比检验 在实际研究中,除了要比较两总体的均值外,有时还需要比较两总体的方差。例如对农村家庭和城镇家庭进行比较,除了平均收入的比较外,还要用方差

10、比较收入的不平均情况。此外,刚刚在小样本均值差的检验中曾谈到,当方差未知时,往往还假设两总体方差相等。因此,在总体方差未知的情况下,先进行方差比检验,对于均值差检 检验也是具有一定意义的。,设两总体分别满足正态分布 和 。现从这两 个总体中分别独立地各抽取一个随机样本,并具有容量n1,n2和方差 , 。根据第八章(8.22)式,对两总体样本方差的抽样分布分别有,2019/3/15,17,根据本书第八章第四节F分布中的(8.25)式有 由于 , 所以简化后,检验方差比所 用统计量为 当零假设H0: 12时, 上式中的统计量又简化为,2019/3/15,18,这样一来,小样本正态总体方差比检验的步

11、骤有 (1) 零 假 设H0 : 备择假设H1 : 单侧 双侧 H1 : H1 : H1 : (2) 检验统计量 ( ) ( ) ( ),单侧,双侧,2019/3/15,19,(3)否定域(参见下图) 单侧 F(n11,n21),双侧F/2(n11,n21) 方差比检验,比起前面所介绍的检验有一个不同点,那就是无 论是单侧检验还是双侧检验,F 的临界值都只在右侧。其原因是我 们总是把和中的较大者放在分子上,以便使用者掌握。因此有 1 或者 1,2019/3/15,20,例 为了研究男性青年和女性青年两身高总体的方差是否相等,分别作了独立随机抽样。对男性青年样本有n110, 30.8(厘米2);

12、对女性青年样本有 n28, 27.8(厘米2),试问在0.05水平上,男性青年身高的方差和女性青年身高的方差有无显著性差异?,2019/3/15,21,解 据题意, 对男性青年样本有n1 10, 30.8(厘米2) 对女性青年样本有n2 8, 27.8(厘米2) H0 : H1 : 计算检验统计量 确定否定域,因为0.05, F/2(n11,n21)F0.025(9,7)4.821.08 因而不能否定零假设,即在0.05水平上,我们不能说男性青年身 高的方差和女性青年身高的方差有显著性差异。,2019/3/15,22,第三节 配对样本的假设检验,配对样本,是两个样本的单位两两匹配成 对,它实际

13、上只能算作一个样本,也称关联样 本。因此对它的检验,用均值差检验显然是不行 的。因为2 n个样本单位(每个样本n个)不是全部 独立抽取的。而如果把每一配对当作一个单位, 在符合其他必要的假定条件下,统计检验与单样 本检验相差无几。,2019/3/15,23,1单一实验组的假设检验 对于单一实验组这种“前后”对比型配对样 本的假设检验,我们的做法是,不用均值差检验, 而是求出每一对观察数据的差,直接进行一对一的 比较。如果采用“前测”“后测”两个总体无差异的零 假设,也就是等于假定实验刺激无效。于是,问题 就转化为每对观察数据差的均值d 0的单样本假 设检验了。求每一对观察值的差,直接进行一对一

14、 的比较。,2019/3/15,24,设配对样本的样本单位前测与后测的观察数据分别 是X 0i与X 1i,其差记作di d i X 1iX 0i 如果假设两总体前测与后测无显著性差别,即1 0 或者 。那么对取自这两 个总体的配对大样本有,2019/3/15,25,对于大样本,当二总体的方差未知时,可以用样本标准差来近似。,若为小样本则需用 t 分布,即对配对(小)样本而言,其 均值差的抽样分布将服从于自由度为(n1)的 t 分布。所以 对单一实验组实验的假设检验,其检验统计量为,2019/3/15,26,例 随机地选择13个单位,放映一部描述吸烟有害于身体健康的影片,下表中的数字是各单位认为

15、吸烟有害身体健康的职工的百分比,试在0.05显著性水平上检检验实验无效的零假设。,2019/3/15,27,解 零 假 设H0:d0 备择假设H1:10 根据前三式,并参照上表有,计算检验统计量 确定否定域,因为0.05,并为单侧检验,因而 有 t 0.05(12)1.7822.76 所以否定零假设,即说明该实验刺激有效。,2019/3/15,28,练习一:以下是经济体制改革后,某厂8个 车间竞争性测量的比较。问改革后,竞争性有无 增加?( 取=0.05)t=3.176 改革后 86 87 56 93 84 93 75 79 改革前 80 79 58 91 77 82 74 66 练习二:为了

16、了解职工的企业认同感,根据 男性1000人的抽样调查,其中有52人希望调换工 作单位;而女性1000人的调查有23人希望调换工 作,能否说明男性比女性更期望职业流动? ( 取=0.05),2019/3/15,29,2一实验组与一控制组的假设检验 单一实验组实验的逻辑,是把实验对象前测 后测之间的变化全部归因于实验刺激。在社会现 实生活进行的实际实验中,对象前测后测之间的 变化,有时除了受到实验刺激外,还受到其他社 会因素的作用。因而,配对样本的一实验组与一 控制组之假设检验,要设法把实验变量的作用和 额外变量的作用区分开来,然后就像对待单一实 验组实验一样,把问题转化为零假设d0的单 样本检验

17、来处理。,2019/3/15,30,在一实验组与一控制组的实验设计之中,对前测后 测之间的变化,消除额外变量影响的基本做法如下: (1)前测:对实验组与控制组分别度量; (2)实验刺激:只对实验组实行实验刺激; (3)后测:对实验组与控制组分别度量; (4)求算消除了额外变量影响之后的 d i 后测实验组前测实验组前测后测差实验组 后测控制组前测控制组前测后测差控制组 实验效应di 前测后测差实验组前测后测差控制组,2019/3/15,31,例 假定实施一种新教学法有助于提高儿童的学习成绩,现将20名儿童两两匹配成对,分成一实验组与一控制组,然后对实验组实施新教学法两年,下表列示了控制组与实验

18、组前测后测的所有10组数据,试在0.05显著性水平上检验实验无效的零假设。,2019/3/15,32,解 零 假 设H0:d0 , 即“实验无效” 备择假设H1:10 根据前三式,并参照上表有,计算检验统计量 确定否定域,因为0.05,并为单侧检验,因而 有 t 0.05(9)1.8332.13 所以否定零假设,即说明该教学法有效。,2019/3/15,33,3对实验设计与相关检验的评论 有了独立样本和非独立样本的认识,读者自 然会提出什么时候使用配对样本以及什么时候不 使用配对样本的问题。很显然,匹配样本损失了 自由度,使用配对样本相当于减小了一半样本容 量。这样做是不是得不偿失呢?答案是要

19、看我们 能否恰当地配对。 在配对过程中,最好用掷硬币的方式决定 “对”中的哪一个归入实验组,哪一个归入控制 组。从而使“对”内随机化。,2019/3/15,34,第四节 双样本区间估计,双样本区间估计和双样本假设检验的联系是很紧密的。双样本区间估计,即是为均值差或成数差设置置信区间的方法,这需要我们汇合单样本区间估计和双样本假设检验两方面的知识 1. 和 已知,对均数差的区间估计 根据本章第一节中心极限定理的推论,既然两样本的均值差 的抽样分布就是 ,那么对 统计量Z 自然有,2019/3/15,35,对于给定的置信水平(1),以 构造 的置信区间如下,同理考虑 的置信区间,只需将上式中的 改

20、为 即可。,2019/3/15,36,例 设甲乙两乡镇企业职工月收入总体分布的方差分别为 120(元2), 90(元2)。现从甲企业随机抽取20人,平均月收人为840元:从乙企业随机抽取10人,平均月收入为670元,试以95%置信水平估计两企业人均月收入差额之范围。,2019/3/15,37,解 据题意, 甲企业的抽样结果为: 840(元), 120(元2) , n120(人) 乙企业的抽样结果为: 670(元), 90(元2) , n2 10(人) 由(1)095,得Z/21.96,代入前式有,得到在95置信水平上,两企业人均收入之差额在162.4元到177.6元之间。,2019/3/15,

21、38,对于大样本, 和 未知,可以用 和 替 代,然后用前式求出均值差的置信区间即可。 对于小样本, 和 未知,两样本均值差的抽样分布就不再服从Z分布,而是服从 t 分布了。此时对给定的置信水平(1),得 之估计区间为,2. 和 未知,对均数差的区间估计,2019/3/15,39,由上式可见,要解决小样本均值差区间估计问题,关键是要解决 的算式问题,而如果能假设 ,这个问题已经在本章第二节中解决了,即,2019/3/15,40,例 某市对儿童体重情况进行调查,抽查8岁的女孩20人,平均体重22.2千克,标准差2.46千克;抽查8岁的男孩18人,平均体重21.3千克,标准差1.82千克。若男女儿

22、童体重的总体方差相等,试在95置信水平上,估计8岁男女儿童体重差额之范围。,2019/3/15,41,解 据题意, 女孩组的抽样结果为: 22.2(千克), S1 2.46(千克),n120(人) 男孩组的抽样结果为: 21.3(千克), S21.82(千克), n218(人) 代人前式得,由(1)0.95,得t /2(n1+ n2 2)t 0.025 (36)2.028,于是 (22.221.3)2.0280.728,(22.221.3) + 2.0280.728) 得在95置信水平上8岁男女儿童体重之差额在0.58千克到2.38千克之间。,2019/3/15,42,如果不能假设 ,求算 则

23、要用下 式,即 例 研究正常成年男女血液红细胞的平均数之差别, 抽查男子20人,计算得红细胞平均数465万毫米3,样本 标准差为54.8万毫米3;抽查女子24名,计算得红细胞 平均数422万毫米3,样本标准差为492万毫米3,试 以99的置信水平,求正常成年男女红细胞平均数的差异 范围。,2019/3/15,43,解 据题意, 男性组抽查结果为: 465, S154. 8, n120(人) 女性组抽查结果为: 422, S249. 2, n224(人) 代人前式得,由(1)0.99,得t /2(n1+ n2 2)t 0.005 (42)2.698,于是 (465422)2.69816.2,(4

24、65422) + 2.69816.2) 得在99置信水平上,正常成年男女红细胞平均数之差异范围在0.7万毫米3到86.7万毫米3之间。,2019/3/15,44,3大样本成数差的区间估计 与单样本成数的区间估计一样,成数差区间估计 可以被看作均值差的特例来处理(但它适用于各种量度 层次)。即对给定的置信水平(1),得两总体成数 差(p1p2)之估计区间为,2019/3/15,45,当p1和p2未知,须用样本成数 和 进行估算,同时分以下两 种情况讨论: 若能假设 ,上式变为 式中: 若不能假设 ,上式变为,2019/3/15,46,例 有一个大学生的随机样本,按照性格“外向”和“内向”,把他们

25、分成两类。结果发现,新生中有73属于“外向”类,四年级学生中有58属于“外向”类。样本中新生有171名,四年级学生有117名。试在99的置信水平上,求新生、老生性性格“外向”的成数差的置信区间。,2019/3/15,47,解 据题意, 新生组的抽样结果为: 0.73, 0 27, n1171(人) 四年级学生组的抽样结果为: 0.58, 0. 42,n2117(人) 由(1)0.99,得Z/2Z0.0052.58,代入上式得,得在99置信水平上,新生、老生性格“外向”的成数差的置信区间为(0.003,0.297)。,2019/3/15,48,4配对样本均值差的区间估计 配对样本均值差的区间估计与独立样本均值差的区间估计不同,它实质上是d的单样本区间估计。 既然对统计量 t 有 对给定的置信水平(1),d 的区间估计是,2019/3/15,49,例 在8名患者身上用A和B两种催眠药加以试验,增多睡眠小时数的数据如下表所示,试在95的置信水置信水平上,求d的置信区间。,2019/3/15,50,解 据(10.14)式和(10.15)式,计算过程参见上表,得,由(1)0.95,得t/2(n 1)t 0.025 (7)2.365,代入上式有 得在95的置信水平上,两种催眼药平均药效之差d的置信区间为1.15 土0.97(小时),即 0.18(小时) d 2.12(小时)。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1