SPSS新手简明教程.doc

上传人:时光煮雨 文档编号:14893463 上传时间:2022-02-23 格式:DOC 页数:19 大小:258KB
返回 下载 相关 举报
SPSS新手简明教程.doc_第1页
第1页 / 共19页
SPSS新手简明教程.doc_第2页
第2页 / 共19页
SPSS新手简明教程.doc_第3页
第3页 / 共19页
SPSS新手简明教程.doc_第4页
第4页 / 共19页
SPSS新手简明教程.doc_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《SPSS新手简明教程.doc》由会员分享,可在线阅读,更多相关《SPSS新手简明教程.doc(19页珍藏版)》请在三一文库上搜索。

1、第四章 摘要性分析第一节 Frequencies过程4.1.1 主要功能4.1.2 实例操作第二节 Descriptives过程4.2.1 主要功能4.2.2 实例操作第三节 Explore过程4.3.1 主要功能4.3.2 实例操作第四节 Crosstabs过程4.4.1 主要功能4.4.2 实例操作摘要性分析是对原始数据进行描述性分析,这是统计工作的出发点。统计学的一系列基本描述指标,不仅让人了解资料的特征,而且可启发人们对之作进一步的深入分析。通过调用摘要性分析的诸个过程,可完成许多统计学指标,对于计量资料,可完成均数、标准差、标准误等指标的计算;对于计数和一些等级资料,可完成构成比、率

2、等指标的计算和2 检验。本章将介绍其操作方法。第一节 Frequencies过程4.1.1 主要功能调用此过程可进行频数分布表的分析。频数分布表是描述性统计中最常用的方法之一,此外还可对数据的分布趋势进行初步分析。返回目录 返回全书目录4.1.2 实例操作例4-1调查100名健康女大学生的血清总蛋白含量(g%)如下表,试作频数表分析。7.43 7.88 6.88 7.80 7.04 8.05 6.97 7.12 7.35 8.057.95 7.56 7.50 7.88 7.20 7.20 7.20 7.43 7.12 7.207.50 7.35 7.88 7.43 7.58 6.50 7.43

3、 7.12 6.97 6.807.35 7.50 7.20 6.43 7.58 8.03 6.97 7.43 7.35 7.357.58 7.58 6.88 7.65 7.04 7.12 8.12 7.50 7.04 6.807.04 7.20 7.65 7.43 7.65 7.76 6.73 7.20 7.50 7.437.35 7.95 7.35 7.47 6.50 7.65 8.16 7.54 7.27 7.276.72 7.65 7.27 7.04 7.72 6.88 6.73 6.73 6.73 7.277.58 7.35 7.50 7.27 7.35 7.35 7.27 8.16

4、7.03 7.437.35 7.95 7.04 7.65 7.27 7.72 8.43 7.50 7.65 7.044.1.2.1 数据准备 激活数据管理窗口,定义血清总蛋白含量的变量名为X,然后输入血清总蛋白含量的原始数据,结果见图4.1。图4.1 输入血清总蛋白含量值4.1.2.2 统计分析 激活Statistics菜单,选Summarize中的Frequencies.命令项,弹出Frequencies对话框(图4.2)。现欲对血清总蛋白含量值进行频数表分析,故在对话框左侧的变量列表中选x,点击钮使之进入Variable(s)框。同时可点击Format.钮弹出Frequencies:For

5、mat对话框,在Order by栏中有四个选项:Ascending values为根据数值大小按升序从小到大作频数分布;Descending values为根据数值大小按降序从大到小作频数分布;Ascending counts为根据频数多少按升序从少到多作频数分布;Descending counts为根据频数多少按降序从多到少作频数分布。在Page Formal栏中可定义结果输出的格式。本例选Ascending values项后点击Continue钮返回Frequencies对话框。图4.2 频数表分析对话框点击Statistics.钮,弹出Frequencies:Statistics对话框(

6、图4.3),可点击相应项目,要求系统在作频数表分析的基础上,附带作各种统计指标的描述,特别是可进行任何水平的百分位数计算。本例要求计算四分位数(Quartiles)、均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)、标准差(Std.deviation)、方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、标准误(S.E.mean)、偏度系数(Skewness)和峰度系数(Kurtosis),选好后点击Continue钮返回Frequencies对话框。图4.3 频数表分析的统计指标对话框点击Charts.钮,弹出Freq

7、uencies:Charts对话框,用户可选两种图形,一是直条图(Bar chart),适用于非连续性的变量;另一是直方图(Histogram),适用于连续性的变量。本例要求对变量x绘制直方图,故选择Histogram项,并要求绘制正态曲线(With normal curve),点击Continue钮返回Frequencies对话框,再点击OK钮即可。4.1.2.3 结果解释 在输出结果窗口中将看到如下统计数据:系统对变量x的原始数据作频数分布表,Value为原始值、Frequency为频数、Percent为各组频数占总例数的百分比、Valid percent为各组频数占总例数的有效百分比、C

8、um Percent为各组频数占总例数的累积百分比。X Valid CumValue Label Value Frequency Percent Percent Percent 6.43 1 1.0 1.0 1.0 6.50 2 2.0 2.0 3.0 6.72 1 1.0 1.0 4.0 6.73 4 4.0 4.0 8.0 6.80 2 2.0 2.0 10.0 6.88 3 3.0 3.0 13.0 6.97 3 3.0 3.0 16.0 7.03 1 1.0 1.0 17.0 7.04 7 7.0 7.0 24.0 7.12 4 4.0 4.0 28.0 7.20 7 7.0 7.0

9、35.0 7.27 7 7.0 7.0 42.0 7.35 11 11.0 11.0 53.0 7.43 8 8.0 8.0 61.0 7.47 1 1.0 1.0 62.0 7.50 7 7.0 7.0 69.0 7.54 1 1.0 1.0 70.0 7.56 1 1.0 1.0 71.0 7.58 5 5.0 5.0 76.0 7.65 7 7.0 7.0 83.0 7.72 2 2.0 2.0 85.0 7.76 1 1.0 1.0 86.0 7.80 1 1.0 1.0 87.0 7.88 3 3.0 3.0 90.0 7.95 3 3.0 3.0 93.0 8.03 1 1.0 1

10、.0 94.0 8.05 2 2.0 2.0 96.0 8.12 1 1.0 1.0 97.0 8.16 2 2.0 2.0 99.0 8.43 1 1.0 1.0 100.0 - - - Total 100 100.0 100.0接着输出各基本统计指标,其中均数为7.366, 标准误为0.039, 中位数为7.350, 众数为7.350, 标准差为0.394, 方差为0.155, 峰度系数为0.034, 峰度系数的标准误为0.478, 偏度系数为0.06, 偏度系数的标准误为0.241, 全距为2.000, 最小值为6.430, 最大值为8.430, 25%位数为7.120, 50%位数为7

11、.350, 75%位数为7.580,共100个观察值,无缺失值。Mean 7.366 Std err .039 Median 7.350Mode 7.350 Std dev .394 Variance .155Kurtosis .034 S E Kurt .478 Skewness .060S E Skew .241 Range 2.000 Minimum 6.430Maximum 8.430 Percentile Value Percentile Value Percentile Value 25.00 7.120 50.00 7.350 75.00 7.580Valid cases 100

12、 Missing cases 0最后系统输出带有正态曲线的直方图(图4.4),由图中可见,数据基本呈现正态分布形状。图4.4 频数分布的直方图从上述内容可知,系统在未特别指定的情形下,频数分布表是按照原始数值逐一作频数分布的,这与日常需要的等距分组、且组数保持在815组的要求不符。为此,在调用Frequencies过程命令之前,可先对原始数据进行算术处理:已知最小值为6.430,最大值为8.430,全距为2.000,故可要求分成10组,起点为6.4,组距为0.2。选Transform菜单Recode项的Into Different Variable.命令项,在弹出的Recode Into Di

13、fferent Variable对话框中选x点击钮使之进入Numeric VariableOutput Variable框,在Output Variable栏的Name处输入x1,点击Change钮表示新生成的变量名为x1。点击Old and New Values钮弹出Recode Into Different Variable:Old and New Values对话框,在Old value栏内选Range项,输入第一个分组的数值范围:6.46.599,在New value栏内输入新值:6.4,点击Add钮,依此将各组的范围及对应的新值逐一输入,最后点击Continue钮返回Recode I

14、nto Different Variable对话框,再点击OK钮即完成。系统在原数据库中生成一新变量为x1,这时调用Frequencies过程命令将输出等距分组且组数为10的频数分布表。X1 Valid CumValue Label Value Frequency Percent Percent Percent 6.40 3 3.0 3.0 3.0 6.60 5 5.0 5.0 8.0 6.80 8 8.0 8.0 16.0 7.00 12 12.0 12.0 28.0 7.20 25 25.0 25.0 53.0 7.40 23 23.0 23.0 76.0 7.60 10 10.0 10.

15、0 86.0 7.80 7 7.0 7.0 93.0 8.00 6 6.0 6.0 99.0 8.40 1 1.0 1.0 100.0 - - - Total 100 100.0 100.0Valid cases 100 Missing cases 0返回目录 返回全书目录第二节 Descriptives过程4.2.1 主要功能调用此过程可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,且可将原始数据转换成标准Z分值并存入数据库,所谓Z分值是指某原始数值比其均值高或低多少个标准差单位,高的为正值,低的为负值,相等的为零。返回目录 返回全书目录4.2.2 实例操作 例4-2调查20名男

16、婴的出生体重(克)资料如下,试作描述性统计。2770 2915 2795 2995 2860 2970 3087 3126 3125 46542272 3503 3418 3921 2669 4218 3707 2310 2573 38814.2.2.1 数据准备激活数据管理窗口,定义男婴出生体重的变量名为X,然后输入男婴出生体重的原始数据。4.2.2.2 统计分析激活Statistics菜单选Summarize中的Descriptives.命令项,弹出Descriptives对话框(图4.5)。现欲对男婴出生体重进行描述性分析,故在对话框左侧的变量列表中选x,点击钮使之进入Variable(

17、s)框;本例要求将原始数据转换成z分值,故选Save standardized value as variables项。图4.5 描述性统计对话框点击Options.钮,弹出Descriptives:Options对话框(图4.6)。框中各指标的意义请读者参阅本章第一节。选好项目后点击 Continue钮返回Descriptives对话框,再点击OK钮即可。 图4.6 描述性统计指标对话框4.2.2.3 结果解释 在结果输出窗口中将看到如下统计数据:均数为3188.450, 标准误为140.681, 标准差为629.146, 方差为395824.997, 峰度系数为0.118, 峰度系数的标准

18、误为0.992, 偏度系数为0.732, 偏度系数的标准误为0.512, 全距为2382.000, 最小值为2272, 最大值为4654, 有效例数为100,无缺失值。Number of valid observations (listwise) = 20.00Variable XMean 3188.450 S.E. Mean 140.681Std Dev 629.146 Variance 395824.997Kurtosis .118 S.E. Kurt .992Skewness .732 S.E. Skew .512Range 2382.000 Minimum 2272Maximum 46

19、54 Sum 63769.000Valid observations - 20 Missing observations - 0此外,系统以zx为变量名将原始数据转换成标准z分值,存放在原数据库中(图4.7)。例如,已知均数为3188.450, 标准差为629.146,故原始值2770的Z分值为= - 0.66511;原始值2770的Z分值为= 1.10078。新变量具有均值为0、标准差为1的特征,亦即变量的标准化过程。图4.7 原始数据及其标准Z分值返回目录 返回全书目录第三节 Explore过程4.3.1 主要功能调用此过程可对变量进行更为深入详尽的描述性统计分析,故称之为探索性统计。它在

20、一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,显得更加细致与全面,有助于用户思考对数据进行进一步分析的方案。返回目录 返回全书目录4.3.2 实例操作 例4-3下表为30名10岁少儿的身高(cm)资料,试作探索性分析。编号身高男孩女孩123456789101112131415121.4131.5132.6129.2134.1135.8140.4136.0128.2137.4135.5129.0132.2140.9129.3133.4132.7130.1136.7139.7133.0140.3124.0125.4137.5120.9138.8138.6141.4137.54.

21、3.2.1 数据准备激活数据管理窗口,定义少儿身高的变量名为X,然后再定义一个变质为SEX,用于作性别分组。顺序输入少儿身高的原始数据,在变量SEX中,男孩输入1、女孩输入2。4.3.2.2 统计分析 激活Statistics菜单选Summarize中的Explore.项,弹出Explore对话框(如图4.8),现欲对少儿身高资料进行分组的探索性分析,故在对话框左侧的变量列表中选x点击钮使之进入Dependent List框,再选sex点击钮使之进入Factor List框。图4.8 探索性分析对话框点击Statistics.钮,弹出Explore:Statistics对话框(图4.9),有如

22、下选项:1、Descriptives:输出均数、中位数、众数、5%修正均数、标准误、方差、标准差、最小值、最大值、全距、四分位全距、峰度系数、峰度系数的标准误、偏度系数、偏度系数的标准误;2、M-estimators:作中心趋势的粗略最大似然确定,输出四个不同权重的最大似然确定数;3、Outliers:输出五个最大值与五个最小值;4、Percentiles:输出第5%、10%、25%、50%、75%、90%、95%位数;5、Grouped Frequency tables:输出分组的例数与数值范围表。本例全部选择,之后点击Continue钮返回Explore对话框。图4.9 探索性分析统计对话

23、框点击Plot.钮弹出Explore:Plot对话框(图4.10),在Boxplot栏内选Factor levels together项要求按组别进行箱图绘制;在Descriptive栏内选Stem-and-leaf项要求作茎叶情形描述。之后点击Continue钮返回Explore对话框,再点击OK钮即可。图4.10 探索性分析绘图对话框4.3.2.3 结果解释 在结果输出窗口中将看到如下统计数据:先输出男孩的数据。共15例,无缺失值,其均数为132.9,中位数为132.6,5%修正均数为133.0944,均数的95%置信区间为130.0706132.7294,标准误为1.3192,方差为26

24、.1043,标准差为5.1092,最小值为121.4,最大值为140.9,全距为19.5,四分位全距为6.8,偏度系数为-0.4239,偏度系数的标准误为0.5801,峰度系数为0.4961,峰度系数的标准误为1.1209。接着输出四个不同权重下作中心趋势的粗略最大似然确定数,对于伴有长拖尾的对称分布数据或带有个别极端数值的数据,用粗略最大似然确定数替代均数或中位数,结果更准确。系统还进行数据的茎叶情形描述。如系统指出男孩的身高资料中,有一个数值是茎为12,叶为1,其实该数值是121.4;有四个数值是茎为12,叶为8999,其实这些数值是129.2、128.2、190.0、129.3。再接着输

25、出百分位数:第5%位数是121.4,第10%数是125.48,第25%位数是129.2,第50%位数是132.6,第75%位数是136,第90%位数是140.6。并输出最大五个数和最小五个数:最大五个数是140.9,140.4,137.4,136.0,135.8;最小五个数是121.4,128.2,129.0,129.2,129.3。最后输出频数分布表。X By SEX 1 Valid cases: 15.0 Missing cases: .0 Percent missing: .0Mean 132.9000 Std Err 1.3192 Min 121.4000 Skewness -.423

26、9Median 132.6000 Variance 26.1043 Max 140.9000 S E Skew .58015%Trim 133.0944 Std Dev 5.1092 Range 19.5000 Kurtosis .496195% CI for Mean (130.0706, 135.7294) IQR 6.8000 S E Kurt 1.1209 M-Estimators - Huber ( 1.339) 132.9127 Tukey ( 4.685) 133.0901 Hampel ( 1.700, 3.400, 8.500) 133.0153 Andrew ( 1.340

27、 * pi ) 133.0904 Frequency Stem & Leaf 1.00 12 * 1 4.00 12 . 8999 4.00 13 * 1224 4.00 13 . 5567 2.00 14 * 00 Stem width: 10.0 Each leaf: 1 case(s) Percentiles -Percentiles 5.0000 10.0000 25.0000 50.0000 75.0000 90.0000 95.0000Haverage 121.4000 125.4800 129.2000 132.6000 136.0000 140.6000Tukeys Hinge

28、s 129.2500 132.6000 135.9000 Extreme Values - - 5 Highest Case # 5 Lowest Case # 140.9 Case: 14 121.4 Case: 1 140.4 Case: 7 128.2 Case: 9 137.4 Case: 10 129.0 Case: 12 136.0 Case: 8 129.2 Case: 4 135.8 Case: 6 129.3 Case: 15 Frequency Table - - Bin Valid Cum Center Freq Pct Pct Pct 126.4 5.00 33.33

29、33.33 33.33 136.4 10.00 66.67 66.67 100.00下一部分为系统输出的女孩资料分析结果,其意义同上述。X By SEX 2 Valid cases: 15.0 Missing cases: .0 Percent missing: .0Mean 134.0000 Std Err 1.6428 Min 120.9000 Skewness -.8937Median 136.7000 Variance 40.4829 Max 141.4000 S E Skew .58015% Trim 134.3167 Std Dev 6.3626 Range 20.5000 Kur

30、tosis -.274795% CI for Mean (130.4765, 137.5235) IQR 8.7000 S E Kurt 1.1209 M-Estimators - Huber ( 1.339) 135.4183 Tukey ( 4.685) 136.2104 Hampel ( 1.700, 3.400, 8.500) 135.1852 Andrew ( 1.340 * pi ) 136.2327 Frequency Stem & Leaf 2.00 12 * 04 1.00 12 . 5 4.00 13 * 0233 6.00 13 . 677889 2.00 14 * 01

31、 Stem width: 10.0 Each leaf: 1 case(s) Percentiles -Percentiles 5.0000 10.0000 25.0000 50.0000 75.0000 90.0000 95.0000Haverage 120.9000 122.7600 130.1000 136.7000 138.8000 140.7400Tukeys Hinges 131.4000 136.7000 138.7000 Extreme Values - - 5 Highest Case # 5 Lowest Case # 141.4 Case: 29 120.9 Case: 26 140.3 Case: 22 124.0 Case: 23 139.7 Case: 20 125.4 Case: 24 138.8 Case: 27 130.1 Case: 18 138.6 Case: 28 132.7 Case: 17 Frequency Table - - Bin

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1