四章节多元正态总体统计推断.ppt

上传人:本田雅阁 文档编号:3209074 上传时间:2019-07-31 格式:PPT 页数:52 大小:1.32MB
返回 下载 相关 举报
四章节多元正态总体统计推断.ppt_第1页
第1页 / 共52页
四章节多元正态总体统计推断.ppt_第2页
第2页 / 共52页
四章节多元正态总体统计推断.ppt_第3页
第3页 / 共52页
四章节多元正态总体统计推断.ppt_第4页
第4页 / 共52页
四章节多元正态总体统计推断.ppt_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《四章节多元正态总体统计推断.ppt》由会员分享,可在线阅读,更多相关《四章节多元正态总体统计推断.ppt(52页珍藏版)》请在三一文库上搜索。

1、第四章 多元正态总体的统计推断,4.1 一元情形的回顾 4.2 单个总体均值的推断 4.3 单个总体均值分量间结构关系的检验 4.4 两个总体均值的比较推断 4.5 两个总体均值分量间结构关系的检验 4.6 多个总体均值的比较检验(多元方差分析) 4.7 总体相关系数的推断,4.2 单个总体均值的推断,一、均值向量的检验 二、置信区域 三、联合置信区间,一、均值向量的检验,设x1,x2, ,xn是取自总体xNp (, )的一个样本,这里0,np,欲检验 H0:=0,H1:0 1.已知 检验统计量为 拒绝规则为: 若 ,则拒绝H0,2. 未知 检验统计量为 称之为霍特林(Hotelling)T2

2、 统计量。当 H0 为真时 服从F(p,np) ,对给定的显著性水平,拒绝规则为: 若 ,则拒绝H0 其中 。,例4.2.1 对某地区农村的6名2周岁男婴的身高、胸围、上半臂围进行测量,得样本数据如表4.2.1所示。根据以往资料,该地区城市2周岁男婴的这三个指标的均值0=(90,58,16),现欲在多元正态性假定下检验该地区农村男婴是否与城市男婴有相同的均值。这是假设检验问题: H0:=0,H1:0,表4.2.1 某地区农村男婴的体格测量数据,查表得F0.01(3,3)=29.5,于是 故在显著性水平=0.01下,拒绝原假设H0,即认为农村与城市的2周岁男婴上述三个指标的均值有显著差异(p=0

3、.002)。,二、置信区域,的置信度为1的置信区域为 当p=1时,它是一个区间;当p=2时,它是一个椭圆,这时可将其在坐标平面上画出;当p=3时,它是一个椭球;当p3时,它是一个超椭球;它们均以 为中心。 同置信区间与假设检验的关系一样,置信区域与假设检验之间也有着同样的密切关系。一般来说,0包含在上述置信区域内,当且仅当原假设 H0:=0在显著性水平下被接受。因此,可以通过构造的置信区域的方法来进行假设检验。,三、联合置信区间,即 以1的概率对一切aRp成立,称它为一切线性组合a,aRp的置信度为1的联合置信区间(simultaneous confidence intervals)。 对k个

4、线性组合ai,i=1,2,k,有,当k很小时,联合T2置信区间 的置信度一般会明显地大于1,因而上述区间会显得过宽,即精确度明显偏低。这时,我们可以考虑采用邦弗伦尼 (Bonferroni)联合置信区间: 它的置信度至少为1。 若t/2k(n1)T ,则邦弗伦尼区间比T2区间要窄,这时宜采用前者作为联合置信区间;反之,若t/2k(n1)T,则邦弗伦尼区间比T2 区间宽,宜采用后者作为联合置信区间。 当k=p时,邦弗伦尼区间要比T2 区间窄。故在求的所有p个分量1, 2, p的联合置信区间时,应采用邦弗伦尼区间。,例4.2.2 为评估某职业培训中心的教学效果,随机抽取8名受训者,进行甲和乙两个项

5、目的测试,其数据列于表4.2.2。假定x=(x1,x2)服从二元正态分布。 n=8,p=2,取1=0.90,F0.10(2,6)=3.46,于是,T0.10=2.841。,表4.2.2 两个项目的测试成绩,的0.90置信区域为 即 0.0436(172.5)20.0812(172.5)(279) +0.0475(279)21.009 这是一个椭圆区域。1和2的0.90联合T2置信区间为 即 61.84183.16,68.80289.20 这两个区间分别正是椭圆在1轴和2轴上的投影。,1和2的0.90邦弗伦尼联合置信区间为(t0.025(7)= 2.3646) 即 63.63181.37,70.

6、51287.49 这个联合置信区间在精确度方面要好于T2联合置信区间。由该联合置信区间可得到置信度至少为0.90的矩形置信区域(见图4.2.1中的实线矩形),但其矩形面积要大于椭圆面积。,图4.2.1 置信椭圆和联合置信区间,利用置信区域进行假设检验,在例4.2.2中,如果在 =0.10下对假设 H0:=0,H1:0 进行检验,其中=(1,2),0=(01,02) ,则我们容易利用图4.2.1中的椭圆得出检验的结果。若被检验值0位于图4.2.1中的椭圆外,则拒绝;反之,则接受。 图4.2.1中的虚线矩形在1和2轴上的区间范围分别是1和2的0.90置信区间。当0位于椭圆外虚线矩形内的位置(如图中

7、A点)时,检验结果虽拒绝H0,但如在=0.10下分别检验 H01:1=01,H11:101 和 H02:2=02,H12:202 则检验结果都将接受原假设;当0位于椭圆内虚线矩形外的位置(如图中B点)时,检验结果虽接受H0,但H01:1=01和H02:2=02都将会被拒绝。,4.3 单个总体均值分量间 结构关系的检验,设x1,x2,xn是取自多元正态总体Np(,)的一个样本,0,np,欲检验 H0:C=,H1:C 其中C为一已知的kp矩阵,kp,rank(C)=k,为已知的k维向量。 根据多元正态分布的性质知 CxNk(C,CC) 由于,故CC0。故我们可以用上一节检验假设H0:=0的方法来检

8、验上述假设。检验统计量为 当原假设H0:C=为真时, 对于给定的显著性水平,拒绝规则为: 若 ,则拒绝H0 其中 。 特别地,若欲检验 H0:C=0,H1:C0 则T2可简化为,例4.3.1 设xNp(,),=(1,2,p),0,x1,x2,xn是取自该总体的一个样本,欲检验 H0:1=2=p,H1:ij,至少存在一对ij 令 则上面的假设可表达为 H0:C=0,H1:C0 检验统计量为,对于给定的显著性水平,拒绝规则为: 若 ,则拒绝H0 其中 由于C是行满秩的,且每行均为对比向量(即有一个1和一个1,其余皆为0),故称C为对比矩阵。 该例中对比矩阵C的选择不是惟一的,比如也可以选取对比矩阵

9、为,例4.3.2 在例4.2.1中,假定人类有这样一个一般规律:身高、胸围和上半臂围的平均尺寸比例为6:4:1,我们希望检验表4.2.1中的数据是否符合这一规律,也就是欲检验 H0:1/6=2/4=3,H1:1/6, 2/4, 3至少有两个不等 令 则上面假设可表达为 H0:C=0,H1:C0 经计算 从而,故 又因 所以拒绝原假设H0,即认为这组数据与人类的一般规律不一致(p=0.008)。 上述的C也可以选择为 检验的结果是不变的。,4.4 两个总体均值的比较推断,一、两个独立样本的情形 二、成对试验的T2统计量,一、两个独立样本的情形,设从两个总体Np(1,)和Np(2,)中各自独立地抽

10、取一个样本 和 ,0,欲检验 H0:1=2,H1:12 1,2的无偏估计 的联合无偏估计 其中,为两个样本协方差矩阵。 霍特林T2检验统计量 当原假设H0为真时, 对给定的,拒绝规则为: 若 ,则拒绝H0 其中,在实际应用中,一旦H0:1=2被拒绝了,则可以考虑对所有的i(1ip),在相同的显著性水平下再进一步检验H0i:1i=2i,以判断是否有分量及(若有)具体是哪些分量对拒绝H0:1=2起了较大作用,这样做常常是有益的。 a(12),aRp的1联合置信区间为 当k很小时,可采用邦弗伦尼不等式给出ai(12),i=1,2,k的1联合置信区间,例4.4.1(例4.2.1续) 表4.4.1给出了

11、相应于表4.2.1的9名2周岁女婴的数据。我们欲在多元正态性假定下检验2周岁的男婴与女婴的均值向量有无显著差异。,表4.4.1 某地区农村女婴的体格测量数据,从例4.2.1得 从表4.4.1计算得,所以 因 ,故不能拒绝原假设H0,即认为两个均值向量无显著差异(p=0.27)。,二、成对试验的T2统计量,设(xi,yi),i=1,2,n(np)是成对试验的数据,令 di=xiyi,i=1,2,n 又设d1,d2,dn独立同分布于Np(,),其中0,=12,1和2分别是总体x和总体y的均值向量。希望检验 H0:1=2,H1:12 等价于 H0:=0,H1:0 这样,两个总体的均值比较检验问题就可

12、以化为一个总体的情形。检验统计量为,其中 当原假设H0:=0为真时,统计量 对给定的显著性水平,拒绝规则为: 若 ,则拒绝H0 其中,4.5 两个总体均值分量间 结构关系的检验,设两个独立的样本 和 分别取自总体Np(1,)和总体Np(2,),0,n1+n22p,我们希望检验 H0:C(12)=,H1:C(12) 其中C为一已知的kp矩阵,kp,rank(C)=k,为一已知的k维向量。检验统计量为 其中Sp是的联合无偏估计。当原假设H0为真时,,拒绝规则为: 若 ,则拒绝H0 其中 例4.5.1 某种产品有甲、乙两种品牌,从甲产品批和乙产品批中分别随机地抽取5个样品,测量相同的5个指标,数据列

13、于表4.5.1。在多元正态性假定下,试问甲、乙两种品牌产品的每个指标间的差异是否有显著的不同。该题就是要检验 H0:C(乙甲)=0,H1:C(乙甲)0 其中,表4.5.1 甲、乙两种品牌产品的指标值,检验统计量为 经计算,所以 由于 ,所以在=0.05下拒绝原假设H0(p=0.044)。,4.6 多个总体均值的比较检验 (多元方差分析),设有k个总体1,2,k,它们的分布分别是Np(1,),Np(2,), ,Np(k,),今从这k个总体中各自独立地抽取一个样本,取自总体i的样本为 ,i=1,2,k。现欲检验 H0:1=2=k,H1:ij,至少存在一对ij 记,则 SST=SSE+SSTR 称S

14、ST、SSE和SSTR分别为总平方和及交叉乘积和、误差(或组内)平方和及交叉乘积和和处理(或组间)平方和及交叉乘积和,它们分别具有自由度(n1)、(nk)和(k1)。采用似然比方法可以得到威尔克斯(Wilks)统计量 对给定的显著性水平,拒绝规则为: 若p,k1,nkp,k1,nk,,则拒绝H0 其中临界值p,k1,nk,满足:当原假设H0为真时, P(p,k1,nkp,k1,nk,)= p,m,r,常通过查F分布(或卡方分布)表得到(或近似得到)。,例4.6.1 为了研究销售方式对商品销售额的影响,选择四种商品(甲、乙、丙和丁)按三种不同的销售方式(、和)进行销售。这四种商品的销售额分别为x

15、1,x2,x3,x4,其数据见表4.6.1。,表4.6.1 销售额数据,该题中,我们需要检验 H0:1=2=3,H1:1,2,3中至少有两个不相等 其中1,2,3分别为销售方式、和的总体均值向量。假定这三个总体均为多元正态总体,且它们的协差阵相同。 p=4,k=3,n1=n2=n3=20,n=n1+n2+n3=60,于是 由附录43中的(43.4)式可得 查F分布表得,F0.01(8,108)=2.683.039,从而在=0.01的水平下拒绝原假设H0,因此可认为三种销售方式的销售额有十分显著的差异(p=0.004)。,为了解这三种销售方式的显著差异究竟是由哪些商品引起的,我们对这四种商品分别

16、用一元方差分析方法进行检验分析。利用SSTR和SSE这两个矩阵对角线上的元素有 查表得,F0.05(2,57)=3.16,F0.01(2,57)=5.01,故甲商品有显著差异(p=0.041),丁商品有十分显著的差异(p=0.001),而乙和丙商品无显著差异(p=0.208和p=0.848)。,如果剔除丁商品,然后再对其他三种商品用统计量进行检验,则有 F0.05(6,110)=2.181.328,不显著,因此说明对甲、乙、丙这三种商品,销售方式、和的总体均值向量之间无显著差异(p=0.251)。,4.7 总体相关系数的推断,设x1,x2,xn是取自总体Np(,)的一个样本,样本协方差矩阵S=

17、(sij)。 一、简单相关系数的推断 二、复相关系数的推断 三、偏相关系数的推断,一、简单相关系数的推断,欲检验 H0:ij=0,H1:ij0 当H0:ij=0为真时,检验统计量 服从t (n2)分布,其中 是样本相关系数。 对于给定的显著性水平,拒绝规则为: 若 ,则拒绝H0,如果希望检验 H0:ij=ij0,H1:ijij0 则可以使用一种近似的方法。在n很大的情况下, 近似服从 。利用这一结论可构造检验统计量为 当原假设H0:ij=ij0为真时,它近似地服从N(0,1),对于给定的,拒绝规则为: 若 ,则拒绝H0,二、复相关系数的推断,将x,S剖分如下: 样本复相关系数的平方为 欲检验 H0:12,p=0,H1:12,p0,检验统计量为 当H0:12,p=0为真时,它服从F (p1,np)分布。对于给定的显著性水平,拒绝规则为: 若 ,则拒绝H0,三、偏相关系数的推断,将x,S作如下剖分: 样本偏相关系数为 其中 。,欲检验 H0:ijk+1,p=0,H1:ijk+1,p0 为此构造检验统计量为 当H0:ijk+1,p=0为真时,它服从t(np+k2)分布。对于给定的,拒绝规则为: 若 ,则拒绝H0,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1