假设检验.pdf

上传人:时光煮雨 文档编号:14966496 上传时间:2022-02-27 格式:PDF 页数:14 大小:188.24KB
返回 下载 相关 举报
假设检验.pdf_第1页
第1页 / 共14页
假设检验.pdf_第2页
第2页 / 共14页
假设检验.pdf_第3页
第3页 / 共14页
亲,该文档总共14页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《假设检验.pdf》由会员分享,可在线阅读,更多相关《假设检验.pdf(14页珍藏版)》请在三一文库上搜索。

1、第六章参数估计一、点估计(一)点估计的定义(二)良好估计量的标准1.无偏性样本平均数的无偏估计。是总体平均数(期望)X样本方差。是总体方差的无偏估计21nS而样本方差。是总体方差的有偏估计2nS2.有效性当无偏估计不止一个时,无偏估计变异(方差)小者有效性高。3.一致性当样本容量越来越大时, 估计值应越来越接近它所估计的总体参数,估计会越来越精确。4.充分性样本统计量是否充分反映了样本的充分信息。二、区间估计(一)区间估计的定义(二)置信区间与显著性水平显著性水平:估计总体参数落在某一区间时, 可能犯错误的概率。 用 表示。置信度:对总体参数估计正确的概率。用1-表示。置信区间:在一定置信度的

2、要求下,所估计的总体参数落入的区间。(三)区间估计的原理样本分布是区间估计的理论根据。 根据样本统计量分布的形态和分布的标准误,和根据置信度查出的临界值,可以计算出置信区间。三、总体平均数的区间估计(一)总体平均数区间估计的一般步骤(二)总体平均数估计1:总体正态分布,总体方差已知,不论样本容量n大小,样本平均数的抽样分布为正态分布。其平均数就等于总体平均数,即)(XE为样本容量为总体标准差,准误,为样本平均数分布的标其中nnXX9,.82.8.5,.61.6.-,905520109099105011111022222222XXXXXXXXXXXXXXPXXPZXZXPZXZXPZXZPZXZ

3、PNX时,有当显著性水平时,有当显著性水平从而)(因而.例:已知总体分布为正态,=7.07, 从这个总体中随机抽取n1=10和 n2=36的两个样本,分别计算出,797821XX试求总体参数 的 0.95和 0.99 的置信区间。解:若用第一样本来做估计,则24210077.nX,则总体参数 的0.95 置信区间是78-1.962.24 78+1.962.24,即是 73.6 82.4 0.99 置信区间是78-2.582.24 78+2.582.24,即是 72.2 30时正态分布表。否则不能作出估计。例:有一个 49 名学生的班级,某学科历年考试成绩的 =5,又知今年某此考试成绩是 85

4、分,试推论该班某学科学习的真实成绩分数。解:非正态分布,当n30,可按正态分布处理。【置信度为 0.95 时,置信区间为83.6,86.4】(四)总体平均数估计 3:总体正态分布, 总体方差未知, 不管样本 n 大小,样本平均数的抽样分布为t 分布。此时方差未知,用样本方差的估计量来代替,故平均数分布的标准误11或nSnSnXnX此时有)(11nntnSXT90.1.-0.955.-190010011201012010120501205022XnXnXnXnXXtXtXPtXtXPtXtXP)(.)(.)(.,即)(例:设总体正态分布,方差未知,n=36,的求总体参数,979 SX0.95的置

5、信区间。【】置信区间为【18975212.,5.,.X】本题因 n=3630,故亦可查正态分布表,结果相差不大。(五) 总体平均数估计4: 总体为非正态分布, 总体方差未知,样本容量 n30时,按 t 分布作区间估计。例:某班 49 人期末考试成绩为 85 分,S=6,试推论学生学习的真实成绩分数。【因 n30,用 t 检验,.,.,.)(.758625832012402050置信区间为t】四、标准差的区间估计在总体正态分布的条件下,可以证明,)()()(11122211212222221nnnnSnPXXnSSn式子各方取倒数,再各乘以(211nSn)得计总体方差的公式。这就是根据样本方差估

6、习惯写作11111112122212212121nnnnSnSnPSnSnP)()()()(例: n=31,Sn-1=5,求 的 0.95 置信区间。根据 df=31-1=30, =0.05, 查卡方分布表,得(注意判断)1和 2的大小,查表得到的是大的那一个临界值。】的置信区间为【,得总体标准差的区间上下限分别开平方】即【)(的置信区间为的所以总体方差)(8.9,.5.4.6,5.475-15.22025.26693906491816513113908164722223097501300,.)(.,)(.五、方差的区间估计如上。例:已知某测验分数的样本n=10,2212860问测验分数总体方

7、差,.nS的0.99 的置信区间是多少? 0.11,1.49 六、两总体方差之比的区间估计在总体方差为为两个样本,其方差分别与抽取容量为的两总体中,分别随机与2121nn22区间估计。对两总体方差之比作出与,212211nnSS解:两样本方差之比的估计。是两总体方差之比2221212211nnSS可以证明两样本方差之比服从于分布。的Fndfndf112211,1故有七、积差相关系数的区间估计(一)积差相关系数的抽样分布当总体相关系数 的数值不同时,相关系数的抽样分布形态也不同。1.当 0 时,只有当样本容量充分大(n500),相关系数的抽样分布才趋近于正态分布,此时,标准误)(rrSE或为11

8、2nrr2.当总体相关系数 =0 时,样本相关系数的抽样分布为df=n-2 的 t 分布。其标准误为212nrr3.当总体相关系数 0,样本容量不大时, 由于样本相关系数的分布函数非常复杂,可以利用费舍Z 转换,将 r 转换成 Z,则 Z 渐进服从于正态分布。费舍 Z 分布的标准误为31nSEZ费舍 Z 转换的公式为:rrZrrZrer111 5 1 31112110log.log或第二式有第一式换底得来。换底公式434294010.log,logloglogeaMMbba而(二)积差相关系数的估计1.当总体相关系数不为0,样本容量 n 500 时,总体相关系数置信区间为rrZrZr22,其中

9、112nrr2.当总体相关系数为= 0 时,样本相关系数抽样分布为自由度等于n-2 的 t分布,标准误为212nrr总体相关系数的置信区间为rnrntrtr)()(,22223. 当当总体相关系数不为0,样本容量 n 不太大时,先把 r 转换成费舍 ZrZr渐近服从于正态分布,计算Zr分布的标准误 SEz,计算 Zr的置信区间置信区间中的 Zr转换成 r. (1)将 r 转换成 Zr第一方法是利用公式rrZrrZrer1115131112110log.log或第二方法是查表法:附表8:r-Zr转换表。(2)计算标准误 SEz,31nSEZ(3)计算 Zr的置信区间zrzrSEZZSEZZ22,

10、(4)将 Zr转换成 r 第一种方法利用公式公式变形得到。转换成此时由将rrZrZZreer1122例:某校 120 名学生通过甲乙两种测验,计算相关系数为r=0.24, 问该测验总体相关系数 的置信区间。解 1:假设其总体相关系数=0, 则样本相关系数的抽样分布为df=n-2 的 t 分布,其标准误为,.,.)(9811182120208902120240121118222tndftnrr得表,查,故总体相关系数 的 0.95 的置信区间是16.64,.400008909812400890981240即,.,.这说明总体相关系数不为0,故关于 =0 的假设不恰当。又因为本题n 不是充分的大,

11、故不能采用渐进正态分布。应采用费舍转换。解 2:(1)查附表 8,r=0.24时,Zr=0.245. (2)标准误0925031.nSEZ(3)Zr的 0.95 的置信区间为 0.245-1.960.0925,0.245+1.96 0.0925,即0.064,0.426 (4)将 Zr转换成 r: 查附表 8, 得总体相关系数的0.95的置信区间为 0.064.0.40 八、等级相关系数(斯皮尔曼等级相关系数)区间估计(一)当 9 n 20时此时 Spearman等级相关系数 rR的抽样分布近似为t 分布。Df=n-2,标准误212nrSERr(二)当 n20 时等级相关系数 rR的抽样分布近

12、似为正态分布。标准误仍为212nrSERr例:N=15,rR=0.41,求总体相关系数的0.95 的置信区间。解:N=15,服从于 t 分布。9560136021240212409016225301341012113205022.,.)(.即的置信区间为数的所以,总体等级相关系表,得查,530.6.1.53,0.6.-1.5.ttnrSERr九、比率的区间估计十、比率差异的区间估计第七章假设检验一、假设检验的必要性科学研究的过程是一个假设检验的过程。总是先根据已有的理论和经验提出一种假设,然后,再搜集事实资料,来证实或证伪这一假设。假设检验的必要性。二、假设检验的内容分为(一)一个总体的参数检

13、验(单样本检验)例:有人调查早期教育对儿童智力发展的影响。从受过良好早期教育的儿童中随机抽取 70 人进行韦氏儿童智力测验,测得),.X151003103 。(已知问能否认为受过良好早期教育的儿童智商高于儿童的一般水平?(二)两个总体的参数检验(双样本检验)根据两样本某一相同统计量之间的差异,做出两个样本所来自的两个总体相应的参数之间是否存在真实的差异的结论。(三)一个总体的概率分布的检验问题如何根据样本数据,去判断随机变量总体是否遵从某种分布?三、假设与假设检验假设:关于总体参数或总体分布的某种假定。假设是关于两个或多个变量之间关系的某种假定。是对欲研究问题提出的某种预想的答案。虚无假设与备

14、择假设:虚无假设(无差假设、零假设、原假设):记作212100100,H如备择假设(就是科学假设、研究假设):记作210,5 .0p,虚无假设与备择假设是对立的假设。假设检验所检验的只能是虚无假设。根据样本数据决定是接受还是拒绝虚无假设。四、统计检验的基本思想统计检验的基本思想是带有概率性质的反证法。1.反证法:先提出虚无假设,在承认虚无假设成立的前提下,推导样本统计量是如何分布的;根据样本数据计算出统计量;看其与虚无假设推导出的结果是否符合?如果导出了一个通常不应出现的结果(不合理现象、矛盾现象),则我们拒绝虚无假设;否则,我们接受虚无假设,或称与虚无假设相容。2.带有概率性质的反证法:上述

15、“矛盾形象”、 “不合理现象” ,不是绝对不会发生的现象,而是一个“发生可能性很小的现象”,即“小概率事件” 。因此,当矛盾现象未出现时,我们接受假设,这并不是说我们证明虚无假设是正确的,而只是意味着我们“没有充分证据推翻虚无假设” ;当矛盾现象出现时,我们拒绝假设,这并不意味着我们推翻了假设,只是说我们不接受。 “接受”、 “拒绝”是依据客观数据所作的主观决策。这种决策的正确性是带有概率性质的。五、假设检验中的两类错误1.型错误: 错误2.型错误: 错误3.统计检验力(统计功效):1-六、单侧检验与双侧检验当目的在于检验某一参数是否大于、优于、快于、小于、劣于、慢于另一参数时,使用单侧检验(

16、或单尾检验);当目的在于检验某一参数是否等于另一参数时,或检验两参数是否有差异,而并不关心差异的方向时,使用双侧检验(或双尾检验)。七、假设检验的步骤(一)提出虚无假设和备择假设双总体检验时:;:单侧检验,右侧:;:(双侧检验):;单总体检验时:.)(:.210110100111011010HHHHHH00(二)构造一个待检验的统计量这个统计量可由样本值计算出来,且其分布已知。(三)选择显著性水平(四)计算统计量的值(五)查表得到接受或拒绝虚无假设的临界值(六)比较计算出的统计量与临界值,作出接受或拒绝虚无假设的决策。七、两总体平均数差异的显著性检验一般采用t 检验,当样本为大样本时,或总体方

17、差已知时,也可以采用Z 检验。(一)类型 1:双总体,正态分布,总体方差已知,两样本独立,不论样本大小,都可以采用Z 检验22212121nnXXZ两样本容量两总体方差两组平均分数,22212121n,nX,X例 1:从某地区6 岁儿童中随机抽取男生30 人,测得其平均身高;cmX1141抽取女生 27 人,测得其平均身高。cmX51212.根据以往资料,该地区6 岁男童身高标准差,cm51。女童身高标准差cm562.能否根据这一抽样测量结果下结论:该地区 6 岁男女儿童身高有显著差异?解:1.提出虚无假设 210:H2. 计算统计量 96027563055112114273056551114

18、222221212122121.nnXXn,XX Zn.12.1;,;,3. 指定显著性水平 设=0.05 4. 查表的临界值 当=0.05 时,96100.Z25.5. 作出结论 而 Z=0.960.05,所以接受虚无假设,该地区男女儿童身高无显著差异。从本例可知,欲使差异显著,应使:两样本平均数差异变大;增大样本容量,每组内差异变小。练 1:有长期积累的资料知道,甲、乙两城市20 多岁男青年的体重都服从正态分布,且标准差分别为14.2kg 与 10.5kg,现各随机抽取27 名 20 岁男青年,测得平均体重分别为65.4kg,54.7kg,问甲、乙两城市20 岁男青年平均体重有无显著差异?

19、【答案: Z=3.16,P0.05】(三)类型 3:双总体,大样本,正态分布,总体方差未知,两样本独立,采用t 检验(被类型2 包含),也可可采用Z 检验。22212121nSnSXXZ例 3:有一项关于反馈对知觉判断影响的研究中,将被试随机分为两组,其中一组60 人,为实验组(提供反馈);另一组52 人,为控制组(不提供反馈)。实验结果为:。;157318802211S,XS,X试问实验组与控制组的平均结果有无显著差异?本体用 t 检验, 但因为是大样本,故也可作Z 检验。t 检验的结果为: t=2.196,df=110,查表得0509811102050.P,.t)(.。(四)类型 4:双总

20、体,正态分布,总体方差已知,两样本相关,不论样本大小,都可采用Z 检验。2211222121212nnrnnXXZ例 4:某幼儿园在儿童入园时对49 名儿童进行了比奈智力测验)(16,结果平均智商,X1061一年后再对同组被试施测,结果1102X, 已知两次测试结果的相关系数r=0.74,问能否说,随着年龄增长与一年的教育,儿童智商确实有提高?解:显著的提高。儿童智商有了非常所以可以认为,一年后从而故临界值由于本题是单侧检验,查正态分布表。取,:0.01,P2,.2.0.01,1.1.3243243232432740127161101061222274011010649000021222121

21、222121212121210Z.ZZ.).()r(nXXnrnXXnnrnnXXZ.r ,X,X,nnH(五)类型 5:双总体,正态分布,总体方差未知,两样本相关:采用t 检验。1) 1()(221221nSXXnnDDXXtd,df=n-1 例 5:对 9 名被试进行两种夹角( 15o和 30o)的缪勒莱依尔错觉实验。结果如下。问两种夹角下错觉是否有显著差异。被试1 2 3 4 5 6 7 8 9 夹角15o14.7 18.9 17.2 15.4 15.3 13.9 20.0 16.2 15.3 30o10.6 15.1 16.2 11.2 12.0 14.7 18.1 13.8 10.9

22、 d 4.1 3.8 1.0 4.2 3.3 0.8 1.9 2.4 4.4 解:01035536241732728201022.P.t.nSdt,.S,.d.dd,所以,查表得求得练 5:设有 10 个学生参加数学测验。有某种方法进行教学实验后,又参加第2 次难度相等的数学测验。两次测验成绩如下。试问两次成绩是否有真实差别?被试1 2 3 4 5 6 7 8 9 10 实验前 X1 20 18 19 22 17 20 19 16 21 19 实验后 X2 22 19 17 18 21 23 19 20 22 20 D=X2-X1 2 1 -2 -4 4 3 0 4 1 1 【答案:26229

23、251851102050.t ,df,.t ,.S,d,n.d】(六)类型 6:双总体,非正态分布,大样本,两样本独立,可用近似Z 检验( Z检验)221121211221212121nSnSXXZnnXXZnn总 体 方 差 未 知 时 ,总 体 方 差 已 知 时 ,(七)类型 7:双总体,非正态分布,大样本,样本相关,可用近似Z 检验( Z检验)总体方差已知时:nrXXZ212221212总体方差未知时:nSrSSSXXZnnnn1121212121212(八)类型 7:双总体,正态分布,两总体方差未知,且总体方差不等,采用近似的t 检验( t检验) :柯克兰( Cochran)-柯克斯

24、方法 (Cox) nSSESESEtndfttttSESEtSEtSEtnSnSXXtnXXX)()(XX)(X)(Xnn2122222212222222122221121212112121212121,样本均值分布的标准误变量变量、第分别是第与分布表得到的临界值;查样本自由度、第分别是按第与分布的临界值,是其中,采用下面的公式:其临界值求法比较复杂此外,也可用威尔奇(Wesch)公式求得t分布的自由度df,然后查表得到t的临界值。公式亦比较复杂:2112222212122122n)(n)()(XXXXSESESESEdf用两种方法求得的临界值无大差别。上式有另一个表达形式,两式可以互化:211221121221121)n1)(S()n1)(S()SS(2n1n2nn2121nnnndf(九)双总体:非正态分布,小样本,两样本独立,采用秩和检验(一种非参数检验)(十)双总体,非正态分布,小样本,样本相关,采用符号检验(一种非参数检验)以上类型中最常见的是第(一)(二)(五) 3 种类型。而以的(二)最有代表性112或,有样本方差的估计量代替当总体方差未知时,用为样本容量为总体方差,准误,为样本平均数分布的标其中已知时,当总体方差nSnSnnnXnXXX90.1.-82.8.0.955.-161.6.900155200991122XXXXXXXXPXXPZXZXP即,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1