非参数假设检验的几种检验方法及其简单应用.doc

上传人:scccc 文档编号:11248781 上传时间:2021-07-17 格式:DOC 页数:13 大小:801.78KB
返回 下载 相关 举报
非参数假设检验的几种检验方法及其简单应用.doc_第1页
第1页 / 共13页
非参数假设检验的几种检验方法及其简单应用.doc_第2页
第2页 / 共13页
非参数假设检验的几种检验方法及其简单应用.doc_第3页
第3页 / 共13页
非参数假设检验的几种检验方法及其简单应用.doc_第4页
第4页 / 共13页
非参数假设检验的几种检验方法及其简单应用.doc_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《非参数假设检验的几种检验方法及其简单应用.doc》由会员分享,可在线阅读,更多相关《非参数假设检验的几种检验方法及其简单应用.doc(13页珍藏版)》请在三一文库上搜索。

1、编号 2010211919 毕业论文 (2014届本科)题 目:非参数假设检验的几种检验方法及其简单应用 学 院: 数学与统计学院 专 业: 数学与应用数学 作者姓名: 指导教师: 职称: 副教授 完成日期: 2014 年 5 月 20 日 二一四 年五 月非参数假设检验的几种检验方法及其简单应用 指导教师: (河西学院数学与应用数学专业2014届1班19号, 甘肃张掖 734000)摘 要 本文主要介绍了非参数假设检验的概念和非参数假设检验的几种检验方法,卡方检验、柯尔莫哥洛夫检验、秩和检验以及符号检验,并通过结合生产和生活中的实例给出了一些具体的应用.关键词 样本;非参数假设检验;卡方检验

2、;柯尔莫哥洛夫检验;秩和检验;符号检验中图分类号 O212.7Several test methods of Nonparametric hypothesis test and its simple applications(No. 19, Class 1 of 2014, Specialty of Mathematics and Applied Mathematics, Hexi University, Zhangye, Gansu, 734000)Abstract:This paper mainly introduces the concept of nonparametric hypot

3、hesis testing and several kinds of test methods,such as chi-square test, kolmogorov test, sum of ranks inspection test and symbols test, by using examples of production process and living, some specific applications are given.Keywords: Sample; Nonparametric hypothesis testing; Chi-square test; Kolmo

4、gorov test; sum of ranks inspection; Sign test 1 引言 非参数检验是统计学的一个重要分支,它不依赖于总体的分布,仅需要一些一般(例如连续分布,对称分布等)的假设,进行统计推断时,只利用样本观察值中一些非常直观的信息.非参数检验常用于以下四种情况:(1)待分析资料不满足参数检验所要求的假定,因而无法应用参数检验.(2)资料仅由一些等级构成,因而无法应用参数检验.(3)所提的问题中并不包含总体参数,这时也适宜采用非参数方法.(4)要迅速得出结果时采用的简单方法.非参数检验与参数检验相对应,含有丰富的统计思想,并在社会学、医学、心理学、教育学等领域都有

5、广泛应用.2 卡方检验定义11 非参数检验是指不需要对总体分布做任何事先的假定,也不以检验总体的参数为目的的假设检验. 定理12(皮尔逊定理) 当随机样本容量充分大()时,将样本分成互斥的类,每类实际出现的频数为,而根据对总体的假设,每类应出现的理论频数(或称期望频数)为,则统计量 近似服从自由度为的分布.皮尔逊定理表明,检验就是检验观察值与理论值之间的紧密程度.根据皮尔逊定理,检验步骤如下:(1)提出假设原假设:总体服从某一理论分布;备择假设:总体不服从某一理论分布;(2)随机抽取容量为的样本,将样本分成类;(3)根据分类结果确定每类的实际频数;(4)假定原假设为真,算出每类的理论频数,若,

6、则将相邻几类的频数合并;(5)建立检验统计量它近似服从自由度为的分布,为指定分布中被估计的参数的个数; (6)计算检验统计量的值,根据给定的显著性水平做出决策.若,则拒绝;反之接受.例1 在对IT行业的工作满意度调查中,7%的信息系统管理者认为“非常满意”,58%认为“基本满意”,24%认为“不太满意”,4%认为“根本不满意”,7%认为“不确定”.而计算机程序员工作满意度样本数据由表1给出.表1 计算机程序员工作满意度评价实际频数表工作评价频数工作评价频数非常满意48根本不满意16基本满意323不确定63不太满意79合计529试判断计算机程序员工作满意度和信息系统管理者工作满意度是否相同?取.

7、解 如果计算机程序员工作满意度和信息系统管理者工作满意度相同,那么计算机程序员工作满意度的概率分布就应与信息系统管理者工作满意度的分布相同.因此可提出如下假设:原假设:总体服从分布;备择假设:总体不服从分布;在原假设成立的条件下可计算出计算机程序员工作满意度评价的理论频数,见表2.计算检验统计量 ,因为,而,所以拒绝原假设,即可以得出结论,计算机程序员的工作满意度和信息系统管理者的不相同.表2 计算机程序员的工作满意度评价理论频数计算表工作评价理论频数工作评价理论频数非常满意基本不满意基本满意不确定不太满意合计定理23 设为总体的理论分布,理论频率为,则当成立时,不论F是什么分布,统计量当时的

8、极限分布为,其中是分组的组数.注1:(1)定义各项中,是反映了频率与概率的偏差,如果偏大应拒绝;若偏小可接受,系数是为了使有一个理想的极限分布;(2)统计量的定义与样本空间的划分有关,只有当样本空间的划分取得合适时,构造的离散分布才能较好地近似,这其实也是检验法的一个缺陷所在;(3)实际中遇到最多的是分布族的检验,也就是检验总体是否属于某种分布族.例2 将一颗骰子掷了120次,结果如下:点数:1,2,3,4,5,6;频数:21,28,19,24,16,12;试在显著性水平下检验骰子是否均匀?解 检验骰子是否均匀,就是要检验假设计算得:.对,故接受假设,即认为这颗骰子是均匀.注2:在用定理2计算

9、统计量时,必须满足: (1)一定要够大,最好达到;(2)每不能太小,最好达到,否则应适当合并以满足要求.3 符号检验符号检验是利用正、负号的数目对某种假设作出判断的方法.它直观、简单,不需要知道被检验量的分布规律,用途十分广泛.在实际应用中,它分为单样本和两个样本的符号检验.在这里,只介绍两个相关样本的符号检验.两个相关样本的符号检验是通过对比样本的成对数据来确定正负号,根据正负号的数目的对比来判断两个样本有无显著差异.定理34 设是正号出现的概率,是负号出现的概率;若两样本无显著差异,则正负号出现的概率应该相等.原假设;备择假设.两个样本数据分别和,比较成对数据,首先去掉观察值相同的样本对;

10、若,差值为正记为“+”,若,差值为负记为“-”,正号和负号的数量分别为和,正负号之和是样本容量,即.在小样本情况下统计量为 , (1)在大样本情况下,若原假设为真,则二项分布可近似服从于正态分布,检验统计量为 (2)在小样本情况下,若值,则拒绝原假设;在大样本情况下,若,则拒绝原假设.符号检验仅利用了符号的信息,并没有考虑数据大小,因而精确度不高.例3 某公司目前招聘一名广告市场分析的研究员,共有20名应聘者前来应聘,客户部经理和市场部经理给这20名应聘者的面试分数由表3给出,试分析客户部经理和市场部经理的评价标准是否一致.解 该问题可以用符号检验的方法进行处理,根据题意提出假设:原假设,即客

11、户部经理和市场部经理的评价标准一致;备择假设,即客户部经理和市场部经理的评价标准不一致.根据已知表的数据,计算样本对差值的符号,结果由表4给出. 根据表4中的样本数据得,.由于,所以属于小样本情况,根据公式(1)得,.显著性水平,故接受原假设,即认为两个经理的评价标准一致.表3 应聘者得分统计表应聘者客户部经理市场部经理应聘者客户部经理市场部经理123456789109087739967956485918390888695898064908980111213141516171819208084916781916573928682797060909070649585表4 样本对观察值的差值的符号

12、应聘者客户部经理市场部经理符号应聘者客户部经理市场部经理符号1234567891090877399679564859183908886958980649089800-+-+0-+111213141516171819208084916781916573928682797060909070649585-+-+-+-+例4 某公司采用广告销售,随即选取30个城市,得到广告促销前后的销售额的样本数据,如表5所示(单位:万元).试用符号检验分析促销活动的效果.解 根据题意提出假设为:原假设,即认为广告前后销售额无显著差异;备择假设,即认为广告前后销售额有显著差异.根据表5中的数据得,.,统计量的观察值.

13、显著水平,查表得到,而,所以拒绝原假设,即认为广告前后销售额有显著差异,广告有助于促销.表5 广告促销前后销售额的比较表城市广告前广告后符号城市广告前广告后符号12345678910111213141542583847505749633644535683944406038495157476539425358504143+-0-0+-+0-+161718192021222324252627282930475348546275505183345158276653495048576677505285374861336753-+0-0-+-+4 柯尔莫哥洛夫检验与检验中的情况一样,假设有,在总体中取个

14、样本并将其样本值按大小排成的顺序,记为不大于的样本值出现的概率,则称为样本分布函数.定理47(格列汶科定理) 设总体分布函数为,样本分布函数为,则.即当时,以概率1关于均匀收敛于.它表明,当很大时,可以用近似代替,即 这是能用样本推断总体的理论根据.柯尔莫哥洛夫检验方法如下:(1)提出假设原假设:;备择假设:.利用对进行检验.(2)取统计量并称为与的差异度. 是一个随机变量,它有自己的分布.柯尔莫哥洛夫证明了:若是连续型随机变量,对任意常数,记,则的值已被列成数表,可供查用,由此得出,当充分大时,即;(3)对给定的,写出小概率事件的概率表达式;(4)查数表,能求得,方法如下:因为所以,是对应于

15、的.根据样本值和,求出;(5)判断:若,则拒绝,若,则接受.例5 为确定总体的分布,取容量的样本测得样本值如下0.54, 0.21,0.31,0.40,0.46,0.17, 0.14,0.12, 0.51,0.50试判断总体在区间上是否服从均匀分布?解 若在上服从均匀分布,则有理论分布现在样本值按由小到大的顺序列于表6中.由样本的经验分布函数为,的数值以及它们的差值都在表6中.表6序号123456789100.120.140.170.210.310.400.460.500.510.540.050.100.150.200.250.300.350.400.450.500.120.140.170.2

16、10.310.400.460.500.510.540.070.040.020.010.060.100.110.100.060.04现对进行检验.(1)原假设:;(2)在成立的条件下,取统计量;(3)对给定的,;(4)查表,从表6中看出;(5)判断:,所以接受,即在上服从均匀分布.5 秩和检验定义28 设两个总体的分布函数分别为和,分别在两个总体中抽取容量为和的样本,将两个样本的观测数据按大小顺序排列,并统一编号,规定每个数据在排列中所对应的序号称为该数的秩,对于相同的数值则用它们序数的平均值作为秩.把容量为的样本的秩加起来得秩和,把容量为的样本的秩加起来得秩和.秩和检验方法如下:(1)提出假设

17、原假设:;备择假设:.(2)取统计量为容量为的样本所对应的秩和即当时,当时;(3)对给定的,查秩和检验表,可得出对应于的下限和上限;(4)判断:当时,接受,即认为两总体差异不显著;反之则拒绝,即认为两总体差异显著.例6 用两种不同材料的灯丝制造灯泡,现分别随机抽取若干个灯泡进行寿命试验,得数据如下(单位:h)材料11610165016801700175017201800材料215801600164016301700问两种材料的灯泡寿命有无明显差异().解 将数据按大小次序排列成表7.这里1700h甲乙两种材料均有,它们的秩取平均数.材料2的容量最小,于是统计量应取材料2的秩和,即.在秩和检验表

18、的,的栏内,查的秩和下限,秩和上限.现在,故拒绝原假设,认为两种材料对灯泡寿命的影响有显著差异.表7编号123456789101112材料11610165016801700172017501800材料215801600163016401700秩12345678.58.5101112注3:秩和检验表中对应于和中的较小者,对应于和中的较大者.在表中只列到的情况,当其中有一个大于10时,我们可以利用的极限分布来检验.可以证明,当较大时,近似地服从正态分布:(其中是与中的较小者,对应于与中的较大者).这时可用检验法,统计量服从,从而对水平,查正态分布表即可. 致谢 感谢魏老师的悉心指导. 参 考 文

19、献1范金城,梅长林.数据分析M.北京:科学出版社.20022孙建军.应用数理统计M.南京:东南大学出版社.20073史道济,张玉环.应用数理统计M.天津:天津大学出版社.20084张德培,罗蕴玲.应用概率统计M.北京:高等教育出版社.20005李永乐,胡庆军.应用数理统计M.北京:国防科技大学出版社.19956宋占杰,胡飞.应用概率统计M.天津:天津大学出版社.20127陈魁.应用概率统计M.北京:清华大学出版社.20048缪铨生.概率与统计M.上海:华东师范大学出版社.20079叶钢,李重文,余丹,马世龙.基于非参数假设检验的程序缺陷定位方法J.北京航空航天大学.2012,10(8):56-6310葛元冲,林正大.一种非参数假设检验法的讨论J.广西师院(自然科学版).1991,16(2):21-2711 王金玉,李霞,潘德惠.非参数假设检验的在证劵投资分析中的应用J.数学的实践与认识.2005,24(12):57-6112

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1