spss教程均值比较检验与方差分析.docx

上传人:时光煮雨 文档编号:11722437 上传时间:2021-09-01 格式:DOCX 页数:24 大小:1.14MB
返回 下载 相关 举报
spss教程均值比较检验与方差分析.docx_第1页
第1页 / 共24页
spss教程均值比较检验与方差分析.docx_第2页
第2页 / 共24页
spss教程均值比较检验与方差分析.docx_第3页
第3页 / 共24页
spss教程均值比较检验与方差分析.docx_第4页
第4页 / 共24页
spss教程均值比较检验与方差分析.docx_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《spss教程均值比较检验与方差分析.docx》由会员分享,可在线阅读,更多相关《spss教程均值比较检验与方差分析.docx(24页珍藏版)》请在三一文库上搜索。

1、第二章均值比较检验与方差分析在经济社会问题的研究过程中,常常需要比较现象之间的某些指标有无显著差异,特别 当考察的样本容量n比较大时,由随机变量的中心极限定理知,样本均值近似地服从正态分布。 所以,均值的比较检验主要研究关于正态总体的均值有关的假设是否成立的问题。本章主要内容:1、单个总体均值的t检验(One-Sample T Test);2、两个独立总体样本均值的t检验(Independent-Sample T Test );3、两个有联系总体均值均值的t检验(Paired-Sample T Test );4、单因素方差分析(One-Way ANOVA5、双因素方差分析(General Li

2、near Model Uni variate )。假设条件:研究的数据服从正态分布或近似地服从正态分布。在Analyze菜单中,均值比较检验可以从菜单Compare Means和General Linear Model得 出。如图2.1所示。Analyzegraphs Utilities Itindcw Helpa3ReportsDescriptive SWwtizTiblexI Comp : ar e MeansGeneriail Linear Model卜fflliAed HodilikCorrelMeans.eeOikeAS ample tasL . l Indepampies L Te

3、st”,FairedASamp es T Test,.R电gr电骂si onCl assi aDita ReductionScadLeNonpartrie TestsTwe SeriesSurvivalMultiple ResponseMissing Value And-ysis p Complex SemplesOne-Way AHOVA 卜37683.7a 1740819.6a c46485.0k 055669.3k ko68270.0k c 60340.0k c 64715.5c67696.3卜 K 7677B.0 Inn189.3534 E204.4696.E230.6775.(263

4、.91010/305,51200/319,11195(3431215E353.5 1221 C405.71260/“re图2.1均值的比较菜单选择项2.1单个总体的t检验(One-Sample T Test )分析单个总体的t检验分析也称为单一样本的t检验分析,也就是检验单个变量的均值是否与假定 的均数之间存在差异。如将单个变量的样本均值与假定的常 数相比较,通过检验得出预先的假设 是否正确的结论。例1:根据2002年我国不同行业的工资水平(数据库SY-2),检验国有企业 的职工平均年工 资收入是否等于10000元,假设数据近似地服从正态分布。首先建立假设:H。:国有企业工资为10000元;H

5、仁国有企业职工工资不等于10000元打开数据库SY-2,检验过程的操作按照下列步骤:1、单击 Analyze CompareMeans) One-Sample T Test 打开 One-Sample T Test 主对 话框,如图2.2所示。图2.2 一个样本的t检验的主对话框2、从左边框中选中需要检验的变量(国有单位)进入检验框中。3、在Test Value框中键入原假设的均值数10000。4、单击Options按钮,得至(J Options对话框(如图2.3),选项分别是置信 度(默认项是 95%)和缺失值的处理方式。选择后默认值后返回主对话框。图2.3 一个样本t检验的Options对

6、话框5、单击OK得输出结果。如表2.1所示表2.1 (a).数据的基本统计描述One-Sample StatisticsN 样本容量Mea n均值Std. Deviation标准差Std. ErrorMea n标准误国有单位3113559.90324809.97099863.89629表2.1 (b).一个样本均值t检验的检验结果One-Sample Testt值df自由度Test Value = 1000095% Co nfide neeIn terval of theSig. (2-tailed)P值Mea nDiffere nee均值差DifferenceLower置信区间Upper国有

7、单位4.12130.0003559.903231795.59165324.2148从上面检验结果表2.1 (a)可以得出国有单位职工工资的平均值、标准差和均值的标准误等反映数据特征的数据。从表2.1 (b)中可知检验的结果。即相应的检验统计量t值为4.229,自由度为30,假设检验的P值(sig )小于0.05,故原假设不成立,检验结论是拒绝原假设接受假设H。即认为国有企业职工的平均工资与10000元的假设差异显著。2.2 两个总体的t检验2.2.1 两个独立样本的 t 检验(Independent-samples T Test )In depe nden t-sample T Test是检验

8、两个没有联系的总体样本均值间是否存在显著的差异, 两个没有联系的总体样本也称独立样本。如两个无联系的企业生产的同样产品之间的某项指标的 均值的比较,不同地区的儿童身高、体重的比较等,都可以通过抽取样本检验两个总体的均值是 否存在显著的差异。例2 某医药研究所考察一种药品对男性和女性的治疗效果是否有显著差异,调查了 10名 男性服用者及7名女性服用者,对他们服药后的各项指标进行综合评分,服用的效果越好,分值 就越高,每人所得的总分见表2,2,试根据表中的数据检验这种药品对男性和女性的治疗效果是否存在显著差异。解:由于药品对男性或女性的影响是无联系的,因此这两个样本是相互独立 的。可以应用两独立样

9、本的假设检验。首先,建立假设Ho :该药品对男性和女性的治疗效果没有显著差异;Hi :该药品对男性和女性的治疗效果有显著差异1 、单击 AnalyzeCompare Means-; Independent-sample T Test ,打开 Independentsample T Test主对话框如图2.4。图2.4两个独立样本t检验的主对话框2、选择要检验的变量“综合得分”进入检验框中。3、选择分组变量“性别”进入分组框中,然后单击Define Group按纽,打开分组对话框 如2.5图所示,确定分组值后返回主对话框,如果没有分组,可以选择Cut point单选项,并在激 活的框内输入一个值

10、作为分组界限值。4、由Option选择按纽确定置信度值和缺失值的处理方式。5、点击0K可得输出结果,见表2.3统计分析检验结果。 Paired-Sample T Test ,打开 Paired-Sample T Test主对话框如图2.6。2、选择要检验的两变量进入检验框中,注意,一定要选择两个变量进入检验框内, 否则将无法得到检验结果。3、由Option选择按纽确定置信度值95%和缺失值的处理方式。4、点击0K得输出结果。5、根据输出结果作出结论如表2.5所示。图2.6配对样本的t检验主对话框表 2.5 (a) Paired Samples Statistics样本统计量分析Mean样本容所

11、N标准差Std. Deviation均值标准误Std. Error MeanPair 1培训前5.30301.368.250培训后2.5330.973.178表2.5(b) Paired Samples Test配对样本均值差检验表Paired Differences检验统 计量t自由度dfP值(双尾)Sig. (2-tailed)MeanStd.DeviationStd. ErrorMean95% ConfidenceInterval of theDifferenceLowerUpperPair 培训前-1培训后2.77.935.1712.423.1216.20329.000由上表2.5 (

12、b)中的检验结果知,假设检验的P值小于0.05,因此可以得出培训前后 的差异是显著的,故拒绝假设H。,接受假设认为培训的效果是显著的。2.3 单因素方差分析单因变量的单因素方差分析主要解决多于两个总体样本或变量间均值的比较问题。是一种对多个(大于两个)总体样本的均值是否存在显著差异的检验方法。其目的也是对不同的总体的数据的均值之间的差异是否显著进行检验。单因素方差分析的应用范围很广,涉及到工业、农业、商业、医学、社会学等多个方 面。单因素方差分析的应用条件:在不同的水平(因素变量取不同值)下,各总体应当服从方差相等的正态分布。例4,某企业需要一种零件,现有三个不同的地区的企业生产的同种零件可供

13、选择,为了比较这三个零件的强度是否相同,每个地区的企业抽出6件产品进行强度测试,其值如表2,6所示。假设每个企业零件的强度值服从正态分布, 试检验这三个地区企业的零件强度是否存在显著差异。解:首先建立假设Ho :三个地区的零件强度无显著差异;H :三个地区的零件强度有显著差异。然后根据表2.6中数据,建立数据文件SY.6并进行单因素方差(One-Way ANOVA分 析。具体操作过程如下:样本零件强度值单位:百公斤强.样12311161108929810385310011899411510673583107976105116102表2.61、单击 Analyze CompareMeans On

14、eWayANOVA 打开 One-Way ANOVA 对话 框。图2.7单因素方差主对话框2、从左框中选择因变量”零件强度”进入Depe nde nt list框内,选择因素斤变量”地区”进入Factor框内。点击0!就可以得到方差分析表2.7方差来源平方和Sum of Squares自由度DfMean SquareF值P值Sig.Between Groups 组间1125.4442562.7225.591.015Within Groups 组内1509.66715100.644Total总和2635.11117表2.7 AN0VA方差分析表百公表2.7是方差分析表,由于F统计量值的P值明显小

15、于显著性水平0.05,故拒 绝假设 认为这三个地区的零件强度有显著差异。如果需要对各地区间的零件强度进行进一步的比较和分析,可以通过按纽Option选 项,contrast对照比较,Post Hoc多重比较去实现。3、单击Option按纽,打开Option对话框如图2.8所示:在Option选项中选择 输出项。主要有不同水平下样本方差的齐性检验,缺失值的处理方式及均值的图 形。图2.8单因素方差分析Options对话框本例中选择Homogeneity of varianee test进行不同水平间方差齐性的检验以及Descriptive基本统计描述。在Missing Value栏中选择系统默认

16、项。完成所有选择后返回主对话框,然后单击OK就可以得到三个地区零件强度分析表2.8。表2.8 ( a) Descriptives基本统计描述NMeanStd. DeviationStd.Error95% ConfidenceInterval for MeanMinimumMaximumLowerBoundUpperBoundA16102.8312.2545.00389.97115.6983116A26110.005.8992.408103.81116.19103118A3690.8310.8154.41579.48102.1873102Total18101.2212.4502.93595.03

17、107.4173118表 2.8 (b) Test of Homogeneity of Variances方差齐性检验百公斤Levene Statisticdf1df2Sig.1.203215.328从基本统计分析表2.8 (a)可以得到均值、标准差等数据相应的统计特征值。从表2.8(b)中 的统计检验可以得出,因素变量的各水平间的方差是没有显著差异的。4、Contrasts按纽可以用来进一步分析随着控制变量水平的变化,观测值变化的总体趋势以 及进一步比较任意指定水平间的均值差异是否显著。单击 Contrasts 按纽,打开 One-Way ANOVAContrasts 对话框现图 2.9.图

18、2.9单因素方差分析Contrasts对话框如果要对组间平方和进行趋势成分检验,选中Poly no mial多项式复选项,选中后激活 Degree参数框,在Degree框中选择趋势检验多项式的阶数,有最高次数 可达5次。系统将给出 指定阶数和低于指定阶次各阶次的自由度、F值和F检验的概率值。在Contrast栏,指定需要对照比较两个水平的均值。在Coefficients框中输入一个系数,单击Ade按纽,系数就进入到Coefficie nts 框中。重复上述,依次输入各组均值的系数。注意系数的和应当 等于0。如;图2.9中就是指第一个水平与第三个水平的均值差比较。5、如果需要将水平间两两比较,可

19、以单击Post Hoc按纽,打开多重比较对话框。如图2.10 所示:在该对话框中列出了二十种多重比较检验,涉及到许多的数理统计方法,在 实际中只选用其中常用的方法即可。对话框下部的Significanee level表示显著性水平,默认值是0.05,也可以根据需要重新输入其它值。如果满足在水平间方差相等的条件,常用LSD (least-significantdifferenee最小显著性差异法),表示用t检验完成各组均值间的配对比较。当方差不等的情况下,可以选择Tamhane S T2,用t检验进行各组均值间的配对比较。图2.10单因素方差分析PHC对话框选择多重比较方式后,点击OK得到输出结

20、果表2.9表 2.9 Multiple Compariso ns 多重比较Dependent Variable:百公斤(I)地区(J)地区MeanDifference (l-J)Std. ErrorSig.95% Confidence IntervalLower BoundUpper BoundA1A2-7.175.792.235-19.515.18A312.005.792.056-.3524.35A2A17.175.792.235-5.1819.51A319.17(*)5.792.0056.8231.51A3A1-12.005.792.056-24.35.35A2-19.17(*)5.792

21、.005-31.51-6.82LSD从表2.8中可以看出,地区2与地区3之间的差异是非常显著的,它们均值 差的检验的尾概 率为0.005,明显小于显著性水平0.05 oThe mean difference is significant at the .05 level.2.4 双因素方差(Uni variate )分析过程单因变量的双因素方差分析是对观察的现象(因变量)受两个因素或变量的影响进行分析,检 验不同水平组合之间对因变量的影响是否显著。双因素方差分析的应用范围很广,如粮食产量受到气候、温度因素的影响;某生物产品的生产过程不仅受催化 剂多少的影响、还受温度高低的影响等,甚至两因素变量

22、之间的交互作用对因变量也有一定的影 响。要分清楚哪个因素的影响作用比较大,就可以应用双因素方差分析的方法来解决。双因素方差分析应用条件:因变量和协变量必须是数值型变量,且因变量来自或近似来 自正态总体。因素变量是分类变量,变量可以是数值型或字符型的。各水平下的总体假 设服从正态分布,而且假设各水平下的方差是相等的。双因素方差分析过程可以分析出每一个因素的作用;各因素之间的交互作用;检验各总体间 方差是否相等;还能够对因素的各水平间均值差异进行比较等。例5:表2.10是某商品S在不同地区和不同时期的销售量表。已知数据服 从正态分布,则要 检验地区因素及时间因素对销售量的影响是否显著。表2.10某

23、商品S销售量表单位:千件地时、.区期1234516.514.213.42.46.221.87.19.41.54.833.610.87.21.74.943.78.98.62.34.657.612.67.52.85.2由于销售量受地区和时间两个因素的影响,这是一个双因素方差分析的问题,根据上表建立 数据文件SY.7,具体分析的步骤如下:1、单击 An alyze “Gen eral li near Model Uni variate,打开 Uni variate 主对话框。如图 2.11所示:图2.11双因素方差分析对话框2、选择要分析的变量“销售量”进入Depe nde nt Variable框

24、中,选择因素变量”地 区“和“时期”进入Fixed Factor框中。3、单击Model按纽选择分析模型,得到Model对话框。如图2.12所示:在Spedfy框 中,指定模型类型。Full Factorial选项为系统默认项,建立全模型,全模型中包括因素之间的交互作用。如果选 择分析两个因素的交互作用,则必须在每种水平组合下,取得两个以上的实验数据,才能实现两个因素的交互作用的分析结果。 如果不考虑 因素间的交互作用时,应当选择自定义模型。图 2.12 Uni variate : Model 对话框Custo m选项为自定义模型,本例选择此项并激活下面的各项操作。先从左边框中选择因素变量进入

25、Model框中,然后选择效应类型。一般不考 虑交互作用时, 选择主效应Main,考虑交互作用时,选择交互作用Interaction。可以通过单击Build Term卜面的 小菜单完成,本例中选择主效应。最后在Sumof Square中选择分解平方和的方法后返回在主对话 框。一般选取默认项TypeM。单击0K就可以得到相应的双因素方差分析表2.11.表2.11销售量的双因素方差分析检验表Tests of Between-Subjects EffectsDependent Variable:南品 S (千件)SourceType III Sum ofSquaresdfMean SquareFSig

26、.Corrected Model289.717(a)836.21514.679.000Intercept1015.06011015.060411.438.000地区247.218461.80525.052.000时期42.498410.6254.307.015Error39.474162.467Total1344.25025Corrected Total329.19024a R Squared = .880 (Adjusted R Squared = .820)表中用黑体字部分是一般统计学原理书中给出的双因素方差分析表。从表中数据可以看出, F值对应概率P值都小于显著性水平0.05,这说明地区

27、和时期对销 售量的影响都是显著的。4、如果需要进行特定的两水平间的均值比较,可单击Contrast比较按纽,打开Contrast对话框如图2.13。在Factor框中显示所有在主对话框中选择的 因素变量,括号中显 示的是当前的比较方法,点击选中因素变量,可以改变均值的比较方法。OniYariaite: ContrastsFactors:Change ContrastContrast:Reference|NoneNaneDeviation2dContinue ICancelHelp耳 Change st CFirstLSimple DifferenceHelmert图 2.13 Uni vari

28、ate:Con trasts 对话框Change Contrast栏中列出对比方法。在小菜单中供选择的方法依次是:None不进行均数比较;Deviation以观测量均值为标准进行比较;Simple以第一个或最后一个水平的观察值均值为标准;Differe nee各水平上观察值均值与前一个水平的均值进行比较;Hermert各水平上观察值与最后一个水平的均值比较。选择了比较方法后,再点击Change按纽确定,将选中的比较方法显示在选中的因素变量后 的括号内。然后返回主对话框。2.14 Uni variate : Profile Plots 对话框5、如果需要进行图形展示,可单击Plots按纽,打开图

29、形对话框如图2.14所示。选择作均值 轮廓图(Profile)的参数。(1)在Factor框中选择因素变量进入横坐标Hohzontal Axis框内,然 后单击add按纽, 可以得到该因素不同水平的因变量均值的分布。(2)如果要了解两个因素变量的交互作用,将一个因素变量送入横坐标后,将另一个因素变量送入Separate Lines分线框中,然后单击add按纽。就 可以输出反映两个因素变量的交互图。本例中选择因素A为横坐标。6如需要将因素A各水平间均值进行两两比较,单击Post Hoc按纽,打开Post Hoc Multiple 多重比较对话框如图2.15所示。从Factor框中选择因素变量进入

30、Post HocTest for框中,然后选择多重比较方法。本例中各组方差相等,选择LSD方法。r Bonferroni厂 SfdakI Scheffe r R-E-G-W F r R-E-G-W QEqual Variances Assumed厂 S-N-KAnlTukey厂 Tukeyfs-b DuuuanI -s ochbergs GT2 厂 Gabriel1 Waller-DuncanType IfTypc II Error Ratio: 100r DunnettControl Category; LastjrTest 2-sided C ControlEactor:Post Hoc

31、Tests for:Equal Variances Not Assumedr Tamhanefs T2 I DunnetVs T3 厂 Games-Howell 厂 Dunnettvs C地区Q图2.15 Uni variate : Post Hoc多重比较对话框7、单击Save按纽,打开保存对话框,如图2.16所示。选择需要保存的变量。图 2.16 Uni variate : Save 对话框Predicted Value预测值栏,选择此栏系统将给出根据模型计算的有关预 测值的选择项。Diag no sties诊断异常值栏,有库克距离和杠杆值(leveragevalue)。Save to N

32、ew File保存新文件栏Residual残差栏,有非标准化和标准化残差、学生化和剔除残差本例中不作选择8、单击Optio ns按纽,打开Uni variate : Optio ns对话框,从中选择需要输出 的显著性水平,默认值为0.。5。本例中不作选择。在进行所有的选择后,单击OK就可以得到输出结果。由多重比较LSD表中得到不同地区销售量的比较表2.12。表 2.12 Multiple Compariso ns 多重比较表Dependent Variable:商品 SLSD因素A(J)B AMean Difference (l-J)均值Ai-均值AjStd. Error 标准误Sig.P值9

33、5% Confidence Interval95%的置信区间Lower BoundUpper BoundA1A2-6.0800(*).99340.000-8.1859-3.9741A3-4.5800(*).99340.000-6.6859-2.4741A42.5000(*).99340.023.39414.6059A5-.5000.99340.622-2.60591.6059A2A16.0800(*).99340.0003.97418.1859A31.5000.99340.151-.60593.6059A48.5800(*).99340.0006.474110.6859A55.5800(*).

34、99340.0003.47417.6859A3A14.5800(*).99340.0002.47416.6859A2-1.5000.99340.151-3.6059.6059A47.0800(*).99340.0004.97419.1859A54.0800(*).99340.0011.97416.1859A4A1-2.5000(*).99340.023-4.6059-.3941A2-8.5800(*).99340.000-10.6859-6.4741A3-7.0800(*).99340.000-9.1859-4.9741A5-3.0000(*).99340.008-5.1059-.8941A5

35、A1.5000.99340.622-1.60592.6059A2-5.5800(*).99340.000-7.6859-3.4741A3-4.0800(*).99340.001-6.1859-1.9741A43.0000(*).99340.008.89415.1059Based on observed means.* The mean difference is significant at the .05 level.从表2.12中可以看到地区之间的差异比较结果,如Ai与A2, Ai与A3的差异就 比较大,而Ai和A5之间的没有显著差异14因素A图2.17因素A与因素B的交互作用图由图2.1

36、7可以看出,两个因素变量地区和时期的折线之间无交叉,因此两个因素之 间基本上没有交互作用。实验练习题二1、为了比较两种材料的质量,选择15台不同设备对这两种材料进行特别处理,假设未 处理前两种材料的指标数据均为10,一星期后经测量得到两种材料的指标数据如下:试 根据下面的数据检验两种材料的质量有无显著差异?材料A7.67.08.38.25.29.37.98.57.87.56.18.96.19.49.1材料B8.06.48.87.96.89.16.37.57. 06.54.47.74.29.49.12、下面给出的是两个大文学家马克吐温的8篇小品文及斯诺特格拉斯的10篇小品文中 由3个字母组成的词

37、的比例。0.235 0.2170.224 0.223 0.220 0.201马克吐温02250.2620.2170.2400.230 0.229斯诺特格拉斯02090.2050.1960.2100.202 0.207设两组数据分别来自正态总体,试检验两位作家写的小品文稿中包含由3个字母组成的词的比例是否有显著的差异?并且检验两组数据的方差是否相等?3、现有甲、乙、丙3家企业生产同一种型号电池,为评比其质量,从每个生产企业各随 机抽取12只进行寿命测试,数据如下表所示:工厂寿命(h)甲乙内40 48 38 42 45 43 42 39 48 44 47 4326 31 30 34 34 35 29 28 37 32 37 3539 41 40 42 41 42 47 50 43 50 48 43试在显著性水平605下,检验三企业生产的电池的平均寿命3 、口 2、口 3有无显者差 异,并求口仁口 2印仁入印2邛3的95%置信区间。4、下表中给出了某种化工过程在三种浓度、四种温度水平下的得率,浓度()温度(C)1024385221411

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1