七章节非参数统计.ppt

上传人:本田雅阁 文档编号:2577928 上传时间:2019-04-11 格式:PPT 页数:27 大小:484.51KB
返回 下载 相关 举报
七章节非参数统计.ppt_第1页
第1页 / 共27页
七章节非参数统计.ppt_第2页
第2页 / 共27页
七章节非参数统计.ppt_第3页
第3页 / 共27页
亲,该文档总共27页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《七章节非参数统计.ppt》由会员分享,可在线阅读,更多相关《七章节非参数统计.ppt(27页珍藏版)》请在三一文库上搜索。

1、第七章 非参数统计,非参数统计(亦称非参数检验),是根据样本资料对总体的某种性质或关系进行假设检验的统计推断方法。,主要特点,不要求总体分布已知或对总体分布作任何限制性假定; 不以估计总体参数为目的; 能适用于定性变量中的定类数据或定序数据 ,也能适用于定距数据和定比数据这种定量变量 方法直观,易于理解,运算比较简单。 缺点是检验的功效不如参数检验方法。,主要内容,2检验,成对比较检验,曼惠特尼U检验,游程检验,等级相关检验,2检验,一、什么是2检验,2检验是利用随机样本对总体分布与某种特定分布拟合程度的检验,也就是检验观察值与理论值之间的紧密程度。,设有k(K2)个观察值,f0为它们的实际频

2、数,fe为理论频数。构造一个统计量,其中,k-1为自由度。,皮尔生定理表明,当样本容量充分大时,样本分成K类,则2统计量服从2分布。自由度为k-1,1、拟合优度检验,二、应用,利用样本信息对总体分布作出推断,检验总体是否服从某种理论分布(如二项分布、均匀分布或正态分布等)。,检验步骤,抽样并对样本资料编成频数分布,形成k个互斥的类型组。 (f0),对总体分布建立假设 H0:总体服从某种理论分布 H1:总体不服从该理论分布,以“原假设H0为真”导出一组期望频数(fe),计算检验统计量,比较2值与临界值 作出检验判断,自由度(df)k-1-m。 其中k为组数。(各组理论频数不得小于5,如不足5,可

3、合并相邻的组,如需合并,则k为合并后的组数) m为计算理论频数时所估计参数的个数。(未指定总体的参数,需要观察值计算相应的统计量,作为未参数的估计值) 。,2、独立性检验,二、应用,用于判断两个变量是否存在交互影响。如果两个变量不存在交互影响,就称为独立,所以这类检验也称为独立性检验。,检验步骤,对总体的两个变量建立假设 H0:两变量独立 H1:两变量关联,将样本资料编成rc列联表,并列出实际频数Oij,计算理论频数,计算检验统计量,比较2值与临界值 作出检验判断,要点说明,列联表形式(rc),O11 O21 O31 . . . Or1,O12 O22 O32 . . . Or2,O13 O2

4、3 O33 . . . Or3, . . . ,O1c O2c O3c . . . Orc,O1 O2 O3 . . . Or,1 2 3 . . . r,行 (r),列(c),1 2 3 c,x,y,合计,n.1 n.2 n.3 n.c n,合计,X的边缘频数,y的边缘频数,理论频数Eij的计算,先求理论频率(作为概率的近似)。概率论中关于概率独立的基本规则:如果两事件独立,则它们的联合概率等于它们各自概率的乘积,P(AB)=P(A)P(B)。因此,某一行某一列的联合概率:,自由度(df)的确定,df=(r-1)(c-1),rc=22的列联表资料,2值简算公式,x,y,1,2,1,2,a,b

5、,c,d,a+c,b+d,a+b,c+d,合计,合计,n,成对比较检验,是对两个相关样本的比较分析。有符号检验和威尔科克森带符号的等级检验两种方法。,符号检验,也称正负号检验,其基本思想是分析正负号出现的频率而忽略具体量的差异,以确定他们是否有显著差异的一种检验方法。,检验步骤,1.确定配对样本,分别计算差异正与负的数目,无差异则记为0,将它从样本中剔除,并相应地减少样本容量n,把正负号数目之和视为样本总个数(n) 。,2.建立假设:H0: p=0.5 ; H1:p0.5,3.观察样本容量,如果n25,则作为二项分布处理 如果n25,则作为正态近似处理。,4.设定显著性水平,并查表确定临界值,

6、进行比较和作出判断。,例 1:随机抽取12个单位,放映一部描述吸烟有害健康的影片, 并调查得到观看电影前后各单位职工认为吸烟有害的人 数的百分比。检验该电影宣传是否有效果(=0.05)。,解:H0:P=0.5 H1:P 0.5,P(0)=0.0002, P(1)=0.0030, P(2)=0.0161, P(3)=0.0537,P(0)+P(1)+P(2)=0.01930.05,P(3)+0.01930.05370.0193=0.0730.05,0,1,2,3,4,5,6,可见,拒绝域应为0,1,2。,7,8,9,10,11,12,拒绝域,现检验统计量(-)=3 (即3个负号),0.0730.

7、05所以,原假设H0:P=0.5在5%显著性水平上不能被拒绝。也即不能认为职工在观看影片前后的认识有显著提高。,例2:随机抽取60名消费者对甲、乙两种品牌的饮料评 分,甲 、乙得分之差为“+”号者35个,“-”号15 个,“0”号10个。以显著性水平=0.05检验两种饮料是否同等受欢迎。,解:H0:P=0.5, H1:P0.5,n25,按正态分布近似处理,该成数抽样分布的均值和标准差分别为,2.821.96,所以,拒绝原假设。认为两种饮料并不受到同等欢迎。且乙种优于甲种。,威尔科克森带符号的等级检验,这种检验方法不仅考虑了两组数据差异的正、负号,而且还利用了其差异大小的信息。因此,是一种更为有

8、效的检验方法。,1、应用条件和检验内容与符号检验相同。,2、方法思想:若关联样本的两组数据没有显著差异,则不仅其差异的正、负符号应大致相等,而且将其差的数值按大小顺序排列编自然序号(即秩)后,它们的正号(+)的秩和(记为T+)与负号(-)的秩和(记为T-)也应该大致相等。其中之较小者也应趋近于总秩和的平均数( )。若正秩和(T+)与负秩和(T-)相差太大,其中较小者偏离总秩和的平均( )较远,以致超过给定显著性水平所确定的临界点,就可以认为这两组数据存在显著差异,即总体的分布不相同。,检验步骤,将样本数据配对并计算各对正负差值,将差数取绝对值按从小到大顺序排列并编上等级,即确定顺序号1、2、3

9、等。对于相等的值,则取其位序的平均数为等级,建立假设:H0:T+= T- ; H1 : T+ T-(双侧) H1 :T+T-或T+T-(单侧),计算检验统计量: 当n25时 当n25时,取T+、T-中之小者,设定,并查表确定临界值T(或Z/2),比较检验值与临界值 作出判断,对于n25,TT, 拒绝H0; TT, 接受H0,接受区域,拒绝区域,拒绝区域,T=5,T=40,=22.5,曼惠特尼U检验,曼惠特尼U检验适用于从两个总体中分别独立抽取两个样本的检验,方法思想与威尔科克森秩和检验相同。,检验步骤:,从总体A、B中分别独立抽取样本nA和nB,将(nA+nB)个观察值从小到大编序,分别计算两

10、个样本,的秩和TA和TB,建立假设H0:两总体A和B相对次数分布相同 H1:两总体相对次数分布不同,计算检验统计量 nA、nB10时,取UA、UB中小者 UA= nAnB+ nA(nA +1)/2-TA UB= nAnB+ nB(nB +1)/2-TB nA、nB10时,设定显著性水平,查U表或Z表得到临界值,比较统计量与临界值,作出判断, 对于nA、nB20 UU,拒绝H0, UU,接受H0,游程检验,一、什么是游程检验,游程检验(亦称连贯检验)是根据样本标志表现排列所形成的游程的多少进行判断的检验方法。,设某样本n=12人的标志表现为男、女,有以下三种排列。,(i) 男,男,女,女,女,男

11、,女,女,男,男,男,男 (ii) 男,男,男,男,男,男,男,女,女,女,女,女 (iii) 男,女,男,女,男,女,男,女,男,女,男,男,连续出现男或女的区段称为游程。每个游程包含的个数为游程长度。以r表示序列中游程的个数:,(i) r=5, (ii) r=2, (iii) r=11,(i)是随机性序列;(ii)(iii)是非随机性序列,所以,可以用游程的个数来检验样本的随机性,或总体的分布特征。,二、游程检验方法,1检验总体分布是否相同。,将从两个总体中独立抽取的两个样本的观察值混合有序后,观察游程个数,进行比较。,2检验样本的随机性,将取自某一总体的样本的观察值按从小到大顺序排列,找

12、出中位数(或平均数),分为大于中位数的小于中位数的两个部分。用上下交错形成的游程个数来检验样本是否是随机的。,3检验规则(小样本,n1与n2都小于20),应用表La和Lb,(=0.05,r为临界值),(1)单侧检验:,观察到的游程个数 ro临界值(La表),或ro临界值(Lb表),反之,接受Ho。,(2)双侧检验:,观察到的游程个数ro,r(La)ror(Lb) 接受Ho 下限 上限,反之,拒绝Ho,否定Ho,4大样本(n1或n2大于20),游程个数r近似正态分布,检验统计量,其中:,等级相关检验,将两组变量按顺序等级排列,在等级的基础上计算等级相关系数,从而反映两组变量之间联系的密切程度。,

13、等级相关系数的计算公式,其中di为两变量每一对样本的等级之差,n为样本容量。,等级相关系数与相关系数一样,取值-1到+1之间,区别是它是建立在等级的基础上计算的,较适用于反映序列变量的相关。,一、等级相关检验的基本原理,二、等级相关系数的应用,利用斯皮尔曼等级相关系数,可以对两序列变量是否相关进行检验。,(一)检验的假设,(1)H0:rs=0 , Xi和Yi 相互独立;,H1:Xi和Yi不独立。(此为双侧检验),(2)H0: rs=0 ,Xi和Yi相互独立; H1: Xi和Yi是正相关。(即Xi的大值与Yi的大值相配对),(3)H0: rs=0 ,Xi和Yi相互独立; H1:Xi和Yi是负相关。(即Xi的大值与Yi的小值相配对),(二)检验统计量:,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1