假设检验 统计学课件.ppt

上传人:本田雅阁 文档编号:2114434 上传时间:2019-02-16 格式:PPT 页数:85 大小:5.16MB
返回 下载 相关 举报
假设检验 统计学课件.ppt_第1页
第1页 / 共85页
假设检验 统计学课件.ppt_第2页
第2页 / 共85页
假设检验 统计学课件.ppt_第3页
第3页 / 共85页
亲,该文档总共85页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《假设检验 统计学课件.ppt》由会员分享,可在线阅读,更多相关《假设检验 统计学课件.ppt(85页珍藏版)》请在三一文库上搜索。

1、第 8 章 假设检验,第 8 章 假设检验,8.1 假设检验的基本问题 8.2 一个总体参数的检验 8.3 两个总体参数的检验 8.4 检验问题的进一步说明,学习目标,了解假设检验的基本思想 掌握假设检验的步骤 对实际问题作假设检验 利用置信区间进行假设检验 利用P - 值进行假设检验,8.1 假设检验的基本问题,8.1.1 假设问题的提出 8.1.2 假设的表达式 8.1.3 两类错误 8.1.4 假设检验的流程 8.1.5 利用P值进行决策 8.1.6 单侧检验,假设问题的提出,什么是假设? (hypothesis), 对总体参数的的数值所作的一种陈述 总体参数包括总体均值、比例、方差等

2、分析之前必需陈述,什么是假设检验? (hypothesis testing),事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立 有参数假设检验和非参数假设检验 采用逻辑上的反证法,依据统计上的小概率原理,提出原假设和备择假设, 什么是原假设?(null hypothesis) 待检验的假设,又称“0假设” 研究者想收集证据予以反对的假设 3. 总是有等号 , 或 4. 表示为 H0 H0: 某一数值 指定为 = 号,即 或 例如, H0: 3190(克), 什么是备择假设?(alternative hypothesis) 与原假设对立的假设,也称“研究假设” 研究者想

3、收集证据予以支持的假设总是有不等号: , 或 表示为 H1 H1: 某一数值,或 某一数值 例如, H1: 3910(克),或 3910(克),提出原假设和备择假设,假设检验中的两类错误 (决策风险),假设检验中的两类错误,1. 第一类错误(弃真错误) 原假设为真时拒绝原假设 会产生一系列后果 第一类错误的概率为 被称为显著性水平 2. 第二类错误(取伪错误) 原假设为假时接受原假设 第二类错误的概率为(Beta),假设检验的流程 提出假设 确定适当的检验统计量 规定显著性水平 计算检验统计量的值 作出统计决策, 什么是检验统计量? 1. 用于假设检验决策的统计量 2. 选择统计量的方法与参数

4、估计相同,需考虑 是大样本还是小样本 总体方差已知还是未知 检验统计量的基本形式为,确定适当的检验统计量,规定显著性水平 (significant level), 什么是显著性水平? 1. 是一个概率值 2. 原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域 3. 表示为 (alpha) 常用的 值有0.01, 0.05, 0.10 4. 由研究者事先确定,作出统计决策,计算检验的统计量 根据给定的显著性水平,查表得出相应的临界值z或z/2, t或t/2 将检验统计量的值与 水平的临界值进行比较 得出拒绝或不拒绝原假设的结论,利用P值进行决策,什么是P 值? (P-value),是一个概

5、率值 如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率 左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积 右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积 被称为观察到的(或实测的)显著性水平 H0 能被拒绝的最小值,双侧检验的P 值,左侧检验的P 值,右侧检验的P 值,利用 P 值进行检验 (决策准则),单侧检验 若p-值 ,不拒绝 H0 若p-值 /2, 不拒绝 H0 若p-值 /2, 拒绝 H0,双侧检验和单侧检验,双侧检验与单侧检验 (假设的形式),双侧检验 (原假设与备择假设的确定),属于决策中的假设检验 不论是拒绝H0还是不拒绝H0,都必需采取相应的行动

6、措施 例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格 我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立 建立的原假设与备择假设应为 H0: = 10 H1: 10,双侧检验 (显著性水平与拒绝域 ),单侧检验 (显著性水平与拒绝域),8.2 一个总体参数的检验,8.2.1 检验统计量的确定 8.2.2 总体均值的检验 8.2.3 总体比例的检验 8.2.4 总体方差的检验,一个总体参数的检验,总体均值检验,总体均值的检验 (检验统计量),总体 是否已知?,总体均值的检验 (2 已知或2未知大样本),1. 假定条件 总体服从正态分布 若不服从正态分布

7、, 可用正态分布来近似(n30) 使用Z-统计量 2 已知: 2 未知:,2 已知均值的检验 (例题分析),【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为= 0.025 。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05),双侧检验,2 已知均值的检验 (例题分析),H0: = 0.081 H1: 0.081 = 0.05 n = 200 临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上拒绝H0,有

8、证据表明新机床加工的零件的椭圆度与以前有显著差异,2 已知均值的检验 (P 值的计算与应用),第1步:进入Excel表格界面,选择“插入”下拉菜单 第2步:选择“函数”点击 第3步:在函数分类中点击“统计”,在函数名的菜 单下选择字符“NORMSDIST”然后确定 第4步:将Z的绝对值2.83录入,得到的函数值为 0.997672537 P值=2(10.997672537)=0.004654 P值远远小于,故拒绝H0,2 已知均值的检验 (小样本例题分析),【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均

9、寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(0.05),单侧检验,2 已知均值的检验 (小样本例题分析),H0: 1020 H1: 1020 = 0.05 n = 16 临界值(s):,检验统计量:,在 = 0.05的水平上拒绝H0,有证据表明这批灯泡的使用寿命有显著提高,决策:,结论:,2 未知大样本均值的检验 (例题分析),【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电

10、子元件质量显著地高于规定标准? (0.05),单侧检验,2 未知大样本均值的检验 (例题分析),H0: 1200 H1: 1200 = 0.05 n = 100 临界值(s):,检验统计量:,在 = 0.05的水平上不拒绝H0,不能认为该厂生产的元件寿命显著地高于1200小时,决策:,结论:,总体均值的检验 (2未知小样本),1. 假定条件 总体为正态分布 2未知,且小样本 2. 使用t 统计量,2 未知小样本均值的检验 (例题分析),【例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平

11、检验机器性能良好的假设。,双侧检验,2 未知小样本均值的检验 (例题分析),H0: = 5 H1: 5 = 0.05 df = 10 - 1 = 9 临界值(s):,检验统计量:,在 = 0.05的水平上拒绝H0,说明该机器的性能不好,决策:,结论:,2 未知小样本均值的检验 (P 值的计算与应用),第1步:进入Excel表格界面,选择“插入”下拉菜单 第2步:选择“函数”点击,并在函数分类中点击“统 计” ,然后,在函数名的菜单中选择字符 “TDIST”,确定 第3步:在弹出的X栏中录入计算出的t值3.16 在自由度(Deg-freedom)栏中录入9 在Tails栏中录入2,表明是双侧检验

12、(单测 检验则在该栏内录入1) P值的结果为0.011550.025,拒绝H0,2 未知小样本均值的检验 (例题分析),【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?( = 0.05),单侧检验!,均值的单尾 t 检验 (计算结果),H0: 40000 H1: 40000 = 0.05 df = 20 - 1 = 19 临界值(s):,检验统计量:

13、,在 = 0.05的水平上不拒绝H0,不能认为制造商的产品同他所说的标准不相符,决策:,结论:,总体比例的检验 (Z 检验),一个总体比例检验,假定条件 有两类结果 总体服从二项分布 可用正态分布来近似 比例检验的 Z 统计量,0为假设的总体比例,一个总体比例的检验 (例题分析),【例】一项统计结果声称,某市老年人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?(= 0.05),双侧检验,一个总体比例的检验 (例题分析),H0: = 14.7% H

14、1: 14.7% = 0.05 n = 400 临界值(s):,检验统计量:,在 = 0.05的水平上不拒绝H0,该市老年人口比重为14.7%,决策:,结论:,总体方差的检验 (2 检验),方差的卡方 (2) 检验,检验一个总体的方差或标准差 假设总体近似服从正态分布 检验统计量,方差的卡方 (2) 检验 (例题分析),【例】某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)的饮料误差上下不超过1cm3。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶,分别进行测定(用样本减1000cm3),得到如下结果。检验该机器的性能是否达到设

15、计要求 (=0.05),绿色 健康饮品,绿色 健康饮品,双侧检验,方差的卡方 (2) 检验 (例题分析),H0: 2 = 1 H1: 2 1 = 0.05 df = 25 - 1 = 24 临界值(s):,统计量:,在 = 0.05的水平上不拒绝H0,不能认为该机器的性能未达到设计要求,决策:,结论:,8.3 两个总体参数的检验,8.3.1 检验统计量的确定 8.3.2 两个总体均值之差的检验 8.3.3 两个总体比例之差的检验 8.3.4 两个总体方差比的检验 8.3.5 检验中的匹配样本,两个正态总体参数的检验,独立样本总体均值之差的检验,两个总体均值之差的检验 (12、 22 已知),1

16、. 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 若不是正态分布, 可以用正态分布来近似(n130和 n230) 检验统计量为,两个总体均值之差的检验 (假设的形式),两个总体均值之差的检验 (例题分析),双侧检验!,【例】有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本量分别为n1=32,n2=40,测得x1= 50公斤,x2= 44公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别? ( = 0.05),两个总体均值之差的检验

17、 (例题分析),H0: 1- 2 = 0 H1: 1- 2 0 = 0.05 n1 = 32,n2 = 40 临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上拒绝H0,有证据表明两种方法生产的产品其抗拉强度有显著差异,两个总体均值之差的检验 (12、 22 未知且不相等,小样本),检验具有不等方差的两个总体的均值 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知且不相等12 = 22 检验统计量,其中:,两个总体均值之差的检验 (12、 22 未知但相等,小样本),检验具有等方差的两个总体的均值 假定条件 两个样本是独立的随机样本 两个总体都是正

18、态分布 两个总体方差未知但相等12 22 检验统计量,两个总体均值之差的检验 (例题分析),单侧检验,【例】 “多吃谷物,将有助于减肥。”为了验证这个假设,随机抽取了35人,询问他们早餐和午餐的通常食谱,根据他们的食谱,将其分为二类,一类为经常的谷类食用者(总体1),一类为非经常谷类食用者(总体2)。然后测度每人午餐的大卡摄取量。经过一段时间的实验,得到如下结果:检验该假设 ( = 0.05),两个总体均值之差的检验 (例题分析用统计量进行检验),H0: 1- 2 0 H1: 1- 2 0 = 0.05 n1 = 15,n2 = 20 临界值(s):,检验统计量:,决策:,结论:,在 = 0.

19、05的水平上拒绝H0,没有证据表明多吃谷物将有助于减肥,两个总体均值之差的检验 (例题分析用Excel进行检验),第1步:选择“工具”下拉菜单,并选择“数据分析”选项 第2步:选择“t检验,双样本异方差假设” 第3步:当出现对话框后 在“变量1的区域”方框内键入数据区域 在“变量2的区域”方框内键入数据区域 在“假设平均差”的方框内键入0 在“(A)”框内键入0.05 在“输出选项”中选择输出区域 选择“确定”,两个匹配(或配对)样本的均值检验,两个总体均值之差的检验 (匹配样本的 t 检验),1. 检验两个总体的均值 配对或匹配 重复测量 (前/后) 3. 假定条件 两个总体都服从正态分布

20、如果不服从正态分布,可用正态分布来近似 (n1 30 , n2 30 ),匹配样本的 t 检验 (假设的形式),注:Di = X1i - X2i ,对第 i 对观察值,匹配样本的 t 检验 (数据形式),匹配样本的 t 检验 (检验统计量),样本差值均值,样本差值标准差,自由度df nD - 1,统计量,D0:假设的差值,【例】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5kg以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:,匹配样本的 t 检验 (例题分析),在 = 0.05的显著性水平下,调查结果是否支持该俱乐部

21、的声称?,单侧检验,配对样本的 t 检验 (例题分析),配对样本的 t 检验 (例题分析),差值均值,差值标准差,H0: m1 m2 8.5 H1: m1 m2 8.5 a = 0.05 df = 10 - 1 = 9 临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上不拒绝H0,不能认为该俱乐部的宣称不可信,配对样本的 t 检验 (例题分析),配对样本的 t 检验 (例题分析用Excel进行检验),第1步:选择“工具” 第2步:选择“数据分析”选项 第3步:在分析工具中选择“t检验:平均值的成对二样本分析” 第4步:当出现对话框后 在“变量1的区域”方框内键入数据区域 在

22、“变量2的区域”方框内键入数据区域 在“假设平均差”方框内键入8.5 显著性水平保持默认值,两个总体比例之差的检验,1. 假定条件 两个总体是独立的 两个总体都服从二项分布 可以用正态分布来近似 检验统计量,两个总体比例之差的Z检验,两个总体比例之差的检验 (假设的形式),两个总体比例之差的Z检验 (例题分析),单侧检验,【例】对两个大型企业青年工人参加技术培训的情况进行调查,调查结果如下:甲厂:调查60人,18人参加技术培训。乙厂调查40人,14人参加技术培训。能否根据以上调查结果认为乙厂工人参加技术培训的人数比例高于甲厂?( = 0.05),两个总体比例之差的Z检验 (例题分析),H0:

23、1- 2 0 H1: 1- 2 0 = 0.05 n1 = 60,n2 = 40 临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上不拒绝H0,没有证据表明乙厂工人参加技术培训的人数比例高于甲厂,两个总体方差比的检验,两个总体方差比的检验 (F 检验),假定条件 两个总体都服从正态分布,且方差相等 两个独立的随机样本 假定形式 H0:s12 = s22 或 H0:s12 s22 (或 ) H1:s12 s22 H1:s12 ) 检验统计量 F = S12 /S22F(n1 1 , n2 1),两个总体方差的 F 检验 (临界值),两个总体方差的 F 检验 (例题分析),H0: 12 = 22 H1: 12 22 = 0.05 n1 = 15,n2 = 20 临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上不拒绝H0,不能认为这两个总体的方差有显著差异,本章小节,1. 假设检验的概念和类型 2. 假设检验的过程 基于一个样本的假设检验问题 4. 基于两个样本的假设检验问题 5. 利用p - 值进行检验,结 束,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1