《假设检验》PPT课件.ppt

上传人:本田雅阁 文档编号:2766559 上传时间:2019-05-12 格式:PPT 页数:75 大小:1.97MB
返回 下载 相关 举报
《假设检验》PPT课件.ppt_第1页
第1页 / 共75页
《假设检验》PPT课件.ppt_第2页
第2页 / 共75页
《假设检验》PPT课件.ppt_第3页
第3页 / 共75页
《假设检验》PPT课件.ppt_第4页
第4页 / 共75页
《假设检验》PPT课件.ppt_第5页
第5页 / 共75页
点击查看更多>>
资源描述

《《假设检验》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《假设检验》PPT课件.ppt(75页珍藏版)》请在三一文库上搜索。

1、假设检验,假设检验,参数估计,统计推断,在总体理论分布和小概率原理的基础上,通过提出假设、确定显著水平、计算统计数、做出推断等步骤来完成在一定概率意义上的推断。会出现两类错误。,参数估计又分为区间估计和点估计,与假设检验比较,二者主要是表示结果的形式不同,其本质是一样的。,常见的假设检验有: 一样个本平均数的检验 两个样本平均数的检验 频率检验 方差检验,U检验或Z检验 t检验 卡方检验 F检验,1 假设检验概述,Hypothesis test,假设检验,参数假设检验,非参数假设检验,总体分布已知, 检验关于未知参数 的某个假设,总体分布未知时的 假设检验问题,一、解决的基本问题 利用两组样本

2、信息,根据一定概率对总体参数或分布的某一假设作出拒绝或保留的决断.。,一个质量检验例子:,本章讨论参数假设检验 .,生产流水线上罐装可乐不断地封装,然后装箱外运. 怎么知道这批罐装可乐的容量是否合格呢?,把每一罐都打开倒入量杯, 看看容量是否合于标准.,罐装可乐的容量按标准应在 350毫升和360毫升之间.,每隔一定时间,抽查若干罐 .,如每隔1小时,抽查5罐,得5个容量的值X1,X5,根据这些值来判断生产是否正常.,通常的办法是进行抽样检查.,方法: 事先对生产状况提出一个假设,然后利用样本统计量的值检验提出的假设是否正确。,(二)备择假设(alternative hypothesis),与

3、原假设相对立(相反)的假设。 一般为研究者想收集数据予以证实自己观点的假设。 用H1表示。 表示形式:H1:总体参数某值 () (),例:H1:,二、两类假设 (一)原假设(null hypothesis ),又称零假设,指检验前对总体参数值所做的假设。一般为研究者想收集证据予以反对的假设。 用H0表示。 表示形式:H0:总体参数=某值 () () 例:,(三)两类假设建立原则 1、H0与H1必须成对出现 2、通常先确定备择假设,再确定原假设 3、假设中的等号“=”总是放在原假设中 例:予以检验的问题是“生产过程是否正常?”,研究者想收集证据检验“生产过程不正常”。 (*正常时就无必要检查!)

4、,H1:,H0:,三、假设检验的原理, 如何判断原假设H0 是否成立呢?,在实践中普遍采用小概率原则:,小概率事件在一次试验中基本上不会发生 .如果在H0条件下发生了小概率事件,则认为H0不正确,四、双侧检验和单侧检验,(一)双侧检验与单侧检验 (三类假设的形式,以均值为例),(二)双侧检验,定义:只强调差异而不强调方向性的检验称为双侧检验。 例:某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于不合格。 建立的原假设与备择假设应为 H0: 1 = 10 H1: 1 10,2、双侧检验的显著性水平与拒绝域 如果统计量的值界于左、右临界值间,则H0成立; 如果大于右临界值或小于左

5、临界值,H0不成立。,(三)单侧检验,1、定义:强调方向性的检验叫单侧检验。目的在于检验研究对象是高于(右尾检验)或低于某一水平(左尾检验)。 2、左尾检验(左侧检验) 例如:改进生产工艺后,会使产品的生产时间降低到2小时以下 建立的原假设与备择假设应为 H0: 1 2 H1: 1 2,单下尾检验(左侧检验)显著性水平与拒绝域 : 如果统计量的值大于左临界值,则H0成立;如果小于左临界值,H0不成立。,3、右侧检验 检验研究对象是否高于某一水平。,例:采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上 建立的原假设与备择假设应为 H0: 1 1500 H1: 1 1500,右侧检

6、验显著性水平与拒绝: 如果统计量值小于右临界值,则H0成立;如果大于右临界值,H0不成立。,五、假设检验中的两类错误 (决策风险),如果H0实际上为真,但统计量的实测值落入了否定域,从而作出否定H0的结论,那就犯了“以真为假”的错误 .,如果H0不成立,但统计量的实测值未落入否定域,从而没有作出否定H0的结论,即接受了错误的H0,那就犯了“以假为真”的错误 .,请看下表,H0: 无罪,假设检验中的两类错误 (决策结果),假设检验就好像一场审判过程,统计检验过程,H0 真,H0 不真,60,62.5,65,67.5,70,72.5,75,67.5,70,72.5,75,77.5,80,82.5,

7、两类错误的关系,两类错误是互相关联的, 当样本容量固定时,一类错误概率的减少导致另一类错误概率的增加.,要同时降低两类错误的概率 ,或者要在 不变的条件下降低 ,需要增加样本容量.,六、假设检验的过程与步骤,1、假设检验的过程 (提出假设抽取样本作出决策),2、假设检验的步骤,提出原假设和备择假设 确定适当的计算检验统计量的公式 规定显著性水平 由样本信息,计算检验统计量的值 作出统计决策,提出原假设和备择假设,1、 提出原假设与备择假设。H0 、H1是对立的,“先将研究者收集证据要证明的观点定为H1,再提出H0 ”。 2 、三种假设形式 H0:参数=某值 H1: 参数某值 双侧检验 H0:

8、参数 某值 H1 :参数 某值 右尾检验 H0 :参数 某值 H1 :参数 某值 左尾检验,1、 根据不同类型的问题选择统计量 2、选择统计量的方法与参数估计相同,需考虑 是大样本还是小样本 总体方差已知还是未知,确定适当的检验统计量并计算值,规定显著性水平,常用的 值有0.01, 0.05, 0.10 =0.05 “有显著性差异” =0.01 “有极其显著性差异” =0.10 “有明显的差异趋势”,一般差异达到显著水平,则在资料的右上方标以“*”,差异达到极显著水平,则在资料右上方标以“* *”。,作出统计决策,(1)临界值比较法 用计算出的统计量的值与双侧临界值,或单侧(左临界值、 右临界

9、值)比较。 (2)利用P值法 P值是指统计量值在分布曲线上所截取的剩余面积值,可由计算机自动给出。 无论是双侧还是单侧检验问题: 当P时,H0不成立; P时,H0成立,多重检验及校正,在同一研究中,有时我们会用到二次或多次显著性检验,从上表可以看出,如果我们将显著性水平确定为=0.05水平,做一次显著性检验后我们只能保证有95%的研究结果与真值是一致的;如果做两次显著性检验后,研究结果与真值的符合程度就会降至95%*95%=90.25,当我们进行5次显著性检验后,就会降至77.4%,即在5次显著性检验后,由水平所得到的显著性检验结果的可靠性只有3/4的可靠性。,校正方法1: Bonferron

10、i 校正法-如果研究中进行了n次显著性检验,则将每次显著性检验的水平降至0.05的n分之一倍。 *或实验结果的P值的n倍,与0.05比较 校正方法2: Newman-Keuls检验法(SNK,检验) 校正方法3: 最小显著差法(LSD法) 校正方法4:Q-value 检验 在同一个研究中,所有显著性检验的p值的分布也是随机的,符合一定的分布规律,因此可以通过这个特点对所得到的所有p值进行校正,使之与总体相一致。,2 样本平均数的假设检验,检验问题: 用从总体中抽取的一个样本的均值,检验该总体均值是否等于某个值。,一、单样本均值显著性检验(One-sample t test),例: 食品安全要求

11、防腐剂添加量必须低于0.1g/kg,如何检验市场中投放的康氏方便面是否达标? 方案:随机抽检20盒 得到样本“防腐剂添加量均值” 与0.1g/kg比较 得出结论 *SPSS分析*,方法1:总体方差已知时的检验,1、假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30) 2、原假设: H0: =0 备择假设: H1: 0 使用z-统计量:,方法2:总体方差未知时的均值检验 * (2 未知,小样本),1. 假定条件 总体为正态分布 2. 使用t 统计量,方法3:近似正态分布的检验,1 t检验时,样本大于30 2 总体非正态分布,样本大于30,方法总结,1、需要依据不同的数据特

12、点选择不同的分析方法 2、特点分析1:检验数据分布是否为正态分布? 3、特点分析2:抽样数据样本是大样本还是小样本?,单样本检验的SPSS分析操作,1、检验数据分布是否为正态分布(非参数统计分析) 2、无论是大样本还是小样本 SPSS菜单: Analyzecompare meanone-sample t test 输入0值(test value)与显著性水平(confidence interval)值 3、读取结果: 用sig.值与0.05比较进行决策。,*单样本检验结果读取实例,检验问题: 用两个样本平均数之间的差异值 X1-X2检验所代表的两个总体之间u1-u2是否有差异?,二、平均数差值

13、的显著性检验,例: 如何检验某种新型降压药的治疗效果? 方案:病例-对照研究 随机将高血压病人分为两组 或用同一组病人服药前、后 得到两个样本均值差异值 检验其是否等于“0” 得出结论 *SPSS分析*,数据获取与分析方案,方案1: 随机分组 服药组服药后平均血压值 统计分析方法:独立样本检验( Independent-samples t test ) 方案2: 配对分组 服药组服药前平均血压值 统计分析方法:配对样本检验(Paired-samples t test ),未服药组平均血压值,服药组服药后平均血压值,(一)独立样本检验 ( Independent-samples t test )

14、,用于处理生物学研究中比较不同处理效应的差异显著性。 数据资料中,两个样本的各个变量从各自总体中抽取,两个样本之间变量没有任何关联,即两个抽样样本彼此独立,不论两个样本容量是否相同。,假定条件 两个样本是独立的随机样本 两个总体都是正态分布 若不是正态分布, 可以用正态分布来近似(n130和 n230) 原假设 H0: 1- 2 =0 备择假设:H1: 1- 2 0 检验统计量,或,方法1:两个总体方差都已知(或方差未知大样本),有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产

15、的产品中各抽取一个随机样本,样本容量分别为n1=32,n2=40,测得x2= 50公斤,x1= 44公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别? ( = 0.05),例题,计算结果,H0: 1- 2 = 0 H1: 1- 2 0 = 0.05 n1 = 32,n2 = 40 临界值(s):,检验统计量:,决策:,结论:,拒绝H0,有证据表明两种方法生产的产品其抗拉强度有显著差异,两个总体方差未知,但相等。 (1) 假定条件 两个样本是独立随机样本 两个总体都是正态分布 两个总体方差未知但相等12 = 22 (样本方差差异不显著) (2) 假设:原假设 ? 备择假设 ? (3) 检验

16、统计量,其中:,方法2:两个总体方差未知,小样本,df= n1+n2-2,例:,用高蛋白和低蛋白两种饲料饲养一月龄大白鼠,在三个月时,测定两组大鼠的增重量(g) 高蛋白组:134、146、106、119、124、161、107、83、113、129、97、123; 低蛋白组:70、118、101、85、107、132、94; 试问两种饲料饲养是否有差别?假设方差相等,假设 H0: 1 = 2 H1: 1 2 检验计算: 结论:在t分布中, 当df=17时,t0.05= 2.112.,一个车间研究用两种不同的工艺组装某种产品所用的时间是否相同。让一个组的10名工人用第一种工艺组装该产品,平均所需

17、时间为26.1分钟,样本标准差为12分钟;另一组8名工人用第二种工艺组装,平均所需时间为17.6分钟,样本标准差为10.5分钟。已知用两种工艺组装产品所用时间服从正态分布,且s12s22 。试问能否认为用第二种方法组装比用第一中方法组装更好?( = 0.05),例题,(计算结果),H0: 1- 2 0 H1: 1- 2 0 = 0.05 n1 = 10,n2 = 8 临界值(s):,检验统计量:,决策:,结论:,接受H0,没有证据表明用第二种方法组装更好,两个总体方差未知,但不相等(齐性),(1) 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知但不相等12 22(样

18、本方差差异显著) (2) 假设:原假设 ? 备择假设 ? (3) 检验统计量,自由度为df,独立样本差异性检验SPSS操作,SPSS菜单命令: Analyze compare mean Independent- samples t test 输入检验变量、分组编号 读取结果: 用sig.值与0.05比较进行决策。,*独立样本差异性检验结果分析,(二)配对样本检验 ( Paired-samples t test ),要求两个样本间配偶成对,每一对除随机地给予不同处理外,其他试验条件尽量一致。,检验两个相关总体的均值 配对或匹配 重复测量 (前/后) 假定条件 两个总体都服从正态分布 如果不服从正

19、态分布,可用正态分布来近似 (n1 30 , n2 30 ),配对样本的 t 检验 (数据形式),例:,在研究饮食中缺乏维生素E与肝中维生素A的关系时,将试验动物按性别、体重等配成8对,并将每对中的两差试验动物用随机分配法在正常饲料组和维生素E缺乏组,然后将试验动物杀死,测定其肝中的维生素A的含量,其结果如下表,试检验两组饲料对试验动物肝中维生素A含量的作用是否有显著差异。,配对样本的 t 检验 (检验统计量),样本均值,样本标准差,自由度df nD - 1,统计量,【例】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5公斤以上。为了验证该宣称是否可信,调查

20、人员随机抽取了10名参加者,得到他们的体重记录如下表:,配对样本的 t 检验 (例子),在 = 0.05的显著性水平下,调查结果是否支持该俱乐部的声称?,属于检验某项声明的假设!,配对样本的 t 检验 (计算表),配对样本的 t 检验 (计算结果),样本均值,样本标准差,H0: m1 m2 8.5 H1: m1 m2 8.5 a = 0.05 df = 10 - 1 = 9 临界值(s):,检验统计量:,决策:,结论:,接受H0,有证据表明该俱乐部的宣称是可信的,配对样本的 t 检验 (计算结果),配对样本差异性检验SPSS操作,SPSS菜单: Analyze compare mean Pai

21、red-samples t test 输入配对的检验变量 读取结果: 用sig.值与0.05比较进行决策。,*配对样本差异性检验结果分析,3 样本率的假设检验,一、单样本率的检验,研究问题 用1个总体中抽样样本计算出的率,检验该总体率是否等于某个值。 必须有一个总体报告率值或标准率值。,方法:,假定条件 样本为大样本 总体近似服从正态分布 假设:H0: p= p0; H1: p p 0 使用z-统计量:,例:,有一批蔬菜种子的平均发芽率为0.85,现随机抽取500粒,用种衣剂进行浸种处理,结果有445粒发芽,试检验种衣剂对种子发芽有无效果。,H0: p = p0=0.85; H1: p p0

22、检验计算: 4) 推断:在Z分布中, Z0.05= 1.96,二、双样本率的差异检验,研究问题 用两个总体中抽样样本计算出的率的差值,检验两个总体率是否相等。,例:研究地势对小麦锈病发病的影响,调查低洼地麦田378株,其中锈病342株,调查高坡地麦田396株,其中锈病株313株,试比较两块麦田锈病发病率是否有显著性差异。,JAMA, 2008;299(20):2401-2405. doi: 10.1001/jama.299.20.2401,方法1:,假定条件 样本为大样本,总体近似服从正态分布,且为独立样本 使用z-统计量:,*P1、p2分别为两个样本的率,p为二者的联合比率,方法2:,使用z-统计量:,率的差异性检验SPSS分析 _采用卡方检验,3双样本方差齐性检验),(一)研究问题 用两个总体中抽样样本计算出的方差,检验两个总体方差是否相等。 例:对技改前、后产品方差改变情况的检验。,1、假定条件 样本为大样本,总体服从正态分布,且为独立样本 2、H0: 两总体方差相等(齐性) H1:两总体方差不相等(不齐性) 使用F-统计量:,3双样本方差齐性检验),双样本方差齐性检验SPSS操作,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1