SPSS19.0中文版教程资料.pdf

上传人:白大夫 文档编号:5424604 上传时间:2020-05-06 格式:PDF 页数:55 大小:3.07MB
返回 下载 相关 举报
SPSS19.0中文版教程资料.pdf_第1页
第1页 / 共55页
SPSS19.0中文版教程资料.pdf_第2页
第2页 / 共55页
SPSS19.0中文版教程资料.pdf_第3页
第3页 / 共55页
SPSS19.0中文版教程资料.pdf_第4页
第4页 / 共55页
SPSS19.0中文版教程资料.pdf_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《SPSS19.0中文版教程资料.pdf》由会员分享,可在线阅读,更多相关《SPSS19.0中文版教程资料.pdf(55页珍藏版)》请在三一文库上搜索。

1、SPSS应用软件试验指导手册 1 SPSS 中文版工具 统计要与大量的数据打交道,涉及繁杂的计算和图表绘制。现代的数据分析工 作如果离开统计软件几乎是无法正常开展。在准确理解和掌握了各种统计方法原理 之后,再来掌握几种统计分析软件的实际操作,是十分必要的。 常见的统计软件有SAS,SPSS ,MINITAB ,EXCEL 等。这些统计软件的功能 和作用大同小异,各自有所侧重。其中的SAS 和 SPSS是目前在大型企业、各类院 校以及科研机构中较为流行的两种统计软件。特别是 SPSS , 其界面友好、功能强大、 易学、易用,包含了几乎全部尖端的统计分析方法,具备完善的数据定义、操作管 理和开放的

2、数据接口以及灵活而美观的统计图表制作。SPSS在各类院校以及科研机 构中更为流行。 SPSS (Statistical Product and Service Solutions, 意为统计产品与服务解决方案) 。 自 20 世纪 60 年代 SPSS诞生以来,为适应各种操作系统平台的要求经历了多次版 本更新,各种版本的SPSS for Windows大同小异,在本试验课程中我们选择PASW Statistics 18.0作为统计分析应用试验活动的工具。 1 SPSS的运行模式 SPSS主要有三种运行模式: (1) 批处理模式 这种模式把已编写好的程序(语句程序)存为一个文件,提交给开始菜单上

3、 SPSS for Windows Production Mode Facility程序运行。 (2) 完全窗口菜单运行模式 这种模式通过选择窗口菜单和对话框完成各种操作。用户无须学会编程,简单 易用。 (3) 程序运行模式 这种模式是在语句 (Syntax)窗口中直接运行编写好的程序或者在脚本(script) 窗口中运行脚本程序的一种运行方式。这种模式要求掌握SPSS的语句或脚本语言。 本试验指导手册为初学者提供入门试验教程,采用“完全窗口菜单运行模式”。 2 SPSS的启动 (1) 在 windows开始程序PASW,在它的次级菜单中单击 “SPSS 12.0 for Windows” 即

4、可启动 SPSS软件,进入 SPSS for Windows对话框,如图 1.1, 图 1.2 所示。 SPSS应用软件试验指导手册 2 图 1.1 SPSS启动 图 1.1 PASW Statistics 启动对话框 3 SPSS软件的退出 SPSS软件的退出方法与其他Windows 应用程序相同, 有两种常用的退出方法: 按 FileExist 的顺序使用菜单命令退出程序。 直接单击 SPSS窗口右上角的 “关闭”按钮,回答系统提出的是否存盘的问题之 后即可安全退出程序。 4 SPSS的主要窗口介绍 SPSS应用软件试验指导手册 3 SPSS软件运行过程中会出现多个界面,各个界面用处不同。

5、 其中,最主要的界 面有三个:数据编辑窗口、结果输出窗口和语句窗口。 (1) 数据编辑窗口 启动 SPSS后看到的第一个窗口便是数据编辑窗口,如图 1.3 所示。在数据编辑 窗口中可以进行数据的录入、编辑以及变量属性的定义和编辑,是SPSS的基本界 面。主要由以下几部分构成:标题栏、菜单栏、工具栏、编辑栏、变量名栏、观测 序号、窗口切换标签、状态栏。 图 1.3 数据浏览界面 标题栏: 显示数据编辑的数据文件名。 菜单栏 :通过对这些菜单的选择,用户可以进行几乎所有的SPSS操作。关 于菜单的详细的操作步骤将在后续实验内容中分别介绍。 为了方便用户操作, SPSS 软件把菜单项中常用的命令放到

6、了工具栏里。当鼠 标停留在某个工具栏按钮上时,会自动跳出一个文本框,提示当前按钮的功能。另 外,如果用户对系统预设的工具栏设置不满意,也可以用视图 工具栏 设 定 命令对工具栏按钮进行定义。 编辑栏:可以输入数据,以使它显示在内容区指定的方格里。 变量名栏:列出了数据文件中所包含变量的变量名 菜单栏 工具栏 编辑栏 观 测 序 号 变量名栏 窗口切换标签 状态栏 标题栏 SPSS应用软件试验指导手册 4 观测序号:列出了数据文件中的所有观测值。观测的个数通常与样本容量的 大小一致。 窗口切换标签:用于“数据视图”和“变量视图”的切换。即数据浏览窗口 与变量浏览窗口。数据浏览窗口用于样本数据的查

7、看、录入和修改。变量浏览窗口 用于变量属性定义的输入和修改。 状态栏:用于说明显示SPSS当前的运行状态。 SPSS被打开时,将会显示 “PASW Statistics Processor ”的提示信息。 (2) 结果输出窗口 在 SPSS中大多数统计分析结果都将以表和图的形式在结果观察窗口中显示。 窗口右边部分显示统计分析结果,左边是导航窗口,用来显示输出结果的目录,可 以通过单击目录来展开右边窗口中的统计分析结果。当用户对数据进行某项统计分 析,结果输出窗口将被自动调出。当然,用户也可以通过双击后缀名为.spo的 SPSS 输出结果文件来打开该窗口。 SPSS应用软件试验指导手册 5 试验

8、 1 数据文件管理 一、试验目的与要求 通过本试验项目,使学生理解并掌握SPSS软件包有关数据文件创建和整理的 基本操作,学习如何将收集到的数据输入计算机,建成一个正确的SPSS数据文件, 并掌握如何对原始数据文件进行整理,包括数据查询,数据修改、删除,数据的排 序等等。 二、试验原理 SPSS 数据文件是一种结构性数据文件,由数据的结构和数据的内容两部分构 成,也可以说由变量和观测两部分构成。一个典型的SPSS数据文件如表 2.1 所示。 表 2.1 SPSS数据文件结构 姓名性别年龄 张三1 45 李四2 23 王五2 45 SPSS变量的属性 SPSS中的变量共有 10 个属性,分别是变

9、量名( Name) 、变量类型( Type) 、长 度(Width) 、小数点位置(Decimals) 、变量名标签(Label) 、变量名值标签 (Value) 、 缺失值( Missing) 、数据列的显示宽度( Columns) 、对其方式( Align )和度量尺度 (Measure ) 。定义一个变量至少要定义它的两个属性,即变量名和变量类型,其他 属性可以暂时采用系统默认值,待以后分析过程中如果有需要再对其进行设置。在 spss数据编辑窗口中单击“变量视窗”标签,进入变量视窗界面(如图2.1 所示) 即可对变量的各个属性进行设置。 观测 变量 数据内容 SPSS应用软件试验指导手册

10、 6 图 2.1 变量视窗 三、试验内容与步骤 1创建一个数据文件 数据文件的创建分成三个步骤: (1)选择菜单【文件】【新建】【数据】新建一个数据文件,进入数据 编辑窗口。窗口顶部标题为“PASW Statistics数据编辑器”。 (2)单击左下角 【变量视窗】 标签进入变量视图界面, 根据试验的设计定义每 个变量类型。 (3)变量定义完成以后,单击【数据视窗】标签进入数据视窗界面,将每个具 体的变量值录入数据库单元格内。 2读取外部数据 当前版本的 SPSS可以很容易地读取Excel 数据,步骤如下: (1)按【文件】【打开】【数据】的顺序使用菜单命令调出打开数据对话 框,在文件类型下拉

11、列表中选择数据文件,如图 2.2 所示。 SPSS应用软件试验指导手册 7 图 2.2 Open File对话框 (2)选择要打开的 Excel 文件,单击“打开”按钮,调出打开Excel 数据源对 话框,如图 2.3 所示。对话框中各选项的意义如下: 工作表 下拉列表:选择被读取数据所在的Excel 工作表。 范围 输入框:用于限制被读取数据在Excel 工作表中的位置。 图 2.3 Open Excel Data Source对话框 3数据编辑 SPSS应用软件试验指导手册 8 在 SPSS中,对数据进行基本编辑操作的功能集中在Edit 和 Data 菜单中。 4SPSS数据的保存 SPS

12、S数据录入并编辑整理完成以后应及时保存,以防数据丢失。 保存数据文件 可以通过【文件】【保存】或者【文件】【另存为】菜单方式来执行。在数据 保存对话框(如图2.5 所示)中根据不同要求进行SPSS数据保存。 图 2.5 SPSS 数据的保存 5. 数据整理 在 SPSS中,数据整理的功能主要集中在【数据】和【转换】两个主菜单下。 (1)数据排序( Sort Case ) 对数据按照某一个或多个变量的大小排序将有利于对数据的总体浏览,基本操 作说明如下: 选择菜单【数据】【排列个案】 ,打开对话框,如图2.7 所示。 (2)抽样( Select Case ) 在统计分析中,有时不需要对所有的观测

13、进行分析,而可能只对某些特定的对象有 兴趣。利用 SPSS的 Select Case命令可以实现这种样本筛选的功能。以SPSS安装 配套数据文件 Growth study.sav为例,选择年龄大于10 的观测,基本操作说明 SPSS应用软件试验指导手册 9 图 2.7 排列个案对话框 如下: 打开数据文件 Growth study.sav ,选择【数据】【选择个案】命令,打开 对话框,如图 2.8 图 2.8 选择个案对话框 指定抽样的方式:【全部个案】 不进行筛选; 【如果条件满足】 按指定条件进 行筛选。本例设置:产品数量150,如图 2.9 所示; SPSS应用软件试验指导手册 10 图

14、 2.9 选择个案对话框 设置完成以后,点击continue,进入下一步。 确定未被选择的观测的处理方法,这里选择默认选项【过滤掉未选定的个 案】 。 单击 ok 进行筛选,结果如图2.10 图 2.10 选择个案的结果 (3)增加个案的数据合并( 【合并文件】【添加个案】 ) 将新数据文件中的观测合并到原数据文件中,在SPSS中实现数据文件纵向合 并的方法如下: SPSS应用软件试验指导手册 11 选择菜单【数据】【合并文件】【添加个案】 ,如图 2.11,选择需要追加的 数据文件,单击打开按钮,弹出Add Cases对话框,如图 2.12。 图 2.11 选择个体数据来源的文件 图 2.1

15、2 选择变量 (4)增加变量的数据合并( 【合并文件】【添加变量】 ) 增加变量时指把两个或多个数据文件实现横向对接。例如将不同课程的成绩文 SPSS应用软件试验指导手册 12 件进行合并,收集来的数据被放置在一个新的数据文件中。在SPSS中实现数据文 件横向合并的方法如下: 选择菜单【数据】【合并文件】【添加变量】,选择合并的数据文件,单击 “打开” ,弹出添加变量,如图2.12 所示。 图 2.12 单击 Ok 执行合并命令。这样,两个数据文件将按观测的顺序一对一地横向 合并。 (5)数据拆分( Split File) 在进行统计分析时, 经常要对文件中的观测进行分组,然后按组分别进行分析

16、。 例如要求按性别不同分组。在SPSS中具体操作如下: 选择菜单【数据】【分割文件】 ,打开对话框,如图2.13 所示。 SPSS应用软件试验指导手册 13 图 2.13 分割文件对话框 选择拆分数据后, 输出结果的排列方式, 该对话框提供了3 种方式:对全部 观测进行分析, 不进行拆分;在输出结果种将各组的分析结果放在一起进行 比较;按组排列输出结果,即单独显示每一分组的分析结果。 选择分组变量 选择数据的排序方式 单击 ok 按钮,执行操作 (6)计算新变量 在对数据文件中的数据进行统计分析的过程中,为了更有效地处理数据和反映 事务的本质,有时需要对数据文件中的变量加工产生新的变量。比如经

17、常需要把几 个变量加总或取加权平均数,SPSS中通过【计算】菜单命令来产生这样的新变量, 其步骤如下: 选择菜单【转换】【计算变量】 ,打开对话框,如图2.14 所示。 SPSS应用软件试验指导手册 14 图 2.14 Compute Variable对话框 在目标变量输入框中输入生成的新变量的变量名。单击输入框下面类型与标签 按钮,在跳出的对话框中可以对新变量的类型和标签进行设置。 在数字表达式输入框中输入新变量的计算表达式。例如“年龄20” 。 单击【如果】按钮,弹出子对话框,如图2.15所示。包含所有个体:对所有的 观测进行计算;如果个案满足条件则包括:仅对满足条件的观测进行计算。 单击

18、 Ok 按钮,执行命令,则可以在数据文件中看到一个新生成的变量。 SPSS应用软件试验指导手册 15 图 2.15 如果子对话框 四、备择试验 某航空公司 38 名职员性别和工资情况的调查数据,如表2.3 所示,试在 SPSS 中进行如下操作: (1) 将数据输入到 SPSS的数据编辑窗口中, 将 gender定义为字符型变量, 将 salary 定义为数值型变量,并保存数据文件,命名为“试验1-1.sav” 。 (2)插入一个变量 income,定义为数值型变量。 (3)将数据文件按性别分组 (4)查找工资大于 40000美元的职工 (5)当工资大于 40000美元时,职工的奖金是工资的20

19、;当工资小于 40000 美 元时,职工的奖金是工资的10%,假设实际收入工资奖金,计算所有职工的实 际收入,并添加到income变量中。 表 2.3 某航空公司38 名职员情况的调查数据表 Id Gender Salary Id Gender Salary 1 M $ 57000 20 F $ 26250 SPSS应用软件试验指导手册 16 2 M $ 40200 21 F $ 38850 3 F $ 21450 22 M $ 21750 4 F $ 21900 23 F $ 24000 5 M $ 45000 24 F $ 16950 6 M $ 32100 25 F $ 21150 7

20、M $ 36000 26 M $ 31050 8 F $ 21900 27 M $ 60375 9 F $ 27900 28 M $ 32550 10 F $ 24000 29 M $ 135000 11 F $ 30300 30 M $ 31200 12 M $ 28350 31 M $ 36150 13 M $ 27750 32 M $ 110625 14 F $ 35100 33 M $ 42000 15 M $ 27300 34 M $ 92000 16 M $ 40800 35 M $ 81250 17 M $ 46000 36 F $ 31350 18 M $103750 37 M

21、 $ 29100 19 M $ 42300 38 M $ 31350 SPSS应用软件试验指导手册 17 试验2 描述统计 一、试验目的与要求 统计分析的目的在于研究总体特征。但是,由于各种各样的原因,我们能够得 到的往往只能是从总体中随机抽取的一部分观察对象,他们构成了样本,只有通过 对样本的研究,我们才能对总体的实际情况作出可能的推断。因此描述性统计分析 是统计分析的第一步,做好这一步是进行正确统计推断的先决条件。通过描述性统 计分析可以大致了解数据的分布类型和特点、数据分布的集中趋势和离散程度,或 对数据进行初步的探索性分析(包括检查数据是否有错误,对数据分布特征和规律 进行初步观察)。

22、 本本试验旨在于:引到学生利用正确的统计方法对数据进行适当的整理和显 示,描述并探索出数据内在的数量规律性,掌握统计思想,培养学生学习统计学的 兴趣,为继续学习推断统计方法及应用各种统计方法解决实际问题打下必要而坚实 的基础。 二、试验原理 描述统计是统计分析的基础,它包括数据的收集、整理、显示,对数据中有用 信息的提取和分析,通常用一些描述统计量来进行分析。 集中趋势的特征值:算术平均数、调和平均数、几何平均数、众数、中位数等。 其中均数适用于正态分布和对称分布资料,中位数适用于所有分布类型的资料。 离散趋势的特征值:全距、内距、平均差、方差、标准差、标准误、离散系数 等。其中标准差、方差适

23、用于正态分布资料,标准误实际上反映了样本均数的波动 程度。 分布特征值:偏态系数、峰度系数、他们反映了数据偏离正态分布的程度。 三、试验内容与步骤 下面给出的一个例题是来自SPSS 软件自带的数据文件 “Employee.data ”,该文 件包含某公司员工的工资、工龄、职业等变量,我们将利用此例题给出相关的描述 统计说明,本例中,我们将以员工的当前工资为例,计算该公司员工当前工资的一 些描述统计量,如均值、频数、方差等描述统计量的计算。 1频数分析( Frequencies ) 1 基本统计分析往往从频数分析开始。通过频数分析能够了解变量取值的状况, 1频数分析多适用于离散变量,其功能是描述

24、离散变量的分布特征。 SPSS应用软件试验指导手册 18 对把握数据的分布特征是非常有用的。比如,在某项调查中,想要知道被调查者的 性别分布状况。 频数分析的第一个基本任务是编制频数分布表。SPSS中的频数分布 表包括的内容有: (1)频数( Frequency)即变量值落在某个区间中的次数。 (2)百分比( Percent )即各频数占总样本数的百分比。 (3)有效百分比( Valid Percent)即各频数占有效样本数的百分比。这里有效 样本数总样本缺失样本数。 (4)累计百分比( Cumulative Percent )即各百分比逐级累加起来的结果。最终 取值为百分之百。 频数分析的第

25、二个基本任务是绘制统计图。统计图是一种最为直接的数据刻画 方式,能够非常清晰直观地展示变量的取值状况。频数分析中常用的统计图包括: 条形图,饼图,直方图等。 频数分析的应用步骤 在 SPSS中的频数分析的实现步骤如下: 选择菜单 “ 【文件】 【打开】 【数据】 ” 在对话框中找到需要分析的数据 文件“SPSS/Employee data”,然后选择 “ 打开” 。 选择菜单 “ 【分析】 【描述统计】 【频率】 ” 。如图 2.1 所示 图2.1 Frequencies对话框 确定所要分析的变量,例如年龄 在变量选择确定之后,在同一窗口上,点击“Statistics”按钮,打开统计量对话 框

26、,如下图 2.2 所示,选择统计输出选项。 询问是否输出频数分布表 SPSS应用软件试验指导手册 19 图2.2 统计量子对话框 图2.3 Charts子对话框 结果输出与分析 点击 Frequencies 对话框中的 “OK ” 按钮,即得到下面的结果。 表2.4 描述性统计量 Statistics SPSS应用软件试验指导手册 20 Gender N Valid 474 Missing 0 表 2.4 中给出了总样本量 ( N) , 其中变量 Gender 的有效个数(Valid ) 为 474 个、 缺失值 (missing) 为 0。 表2.5 Gender 频数分布表 Frequen

27、cy Percent Valid Percent Cumulative Percent Valid Female 216 45.6 45.6 45.6 Male 258 54.4 54.4 100.0 Total 474 100.0 100.0 表 2.5 中,Frequency是频数,Percent是按总样本量为分母计算的百分比,Valid Percent是以有效样本量为分母计算的百分比,Cumulative Percent是累计百分比。 图 2.5 变量 Gender的条形图,图 2.6 变量 Gender的饼图。 FemaleMale Gender 0 50 100 150 200 25

28、0 300 F r e q u e n c y Gender 图2.5 变量 gender 的条形图 Female Male Gender 图2.6 变量 gender 的饼图 2描述统计(Descriptives) 2 SPSS的【描述】命令专门用于计算各种描述统计性统计量。本节利用某年国内 上市公司的财务数据来介绍描述统计量在SPSS中的计算方法。 具体操作步骤如下: 选择菜单【分析】【描述统计】【描述】,如图 2.7 所示 2 描述统计主要对定距型或定比型数据的分布特征作具体分析。 SPSS应用软件试验指导手册 21 图 2.7 描述对话框 将待分析的变量移入Variables列表框,例

29、如将每股收益率、净资产收益率、资 产负债率等 2 个变量进行描述性统计,以观察上市公司股权集中度情况和负债比率 的高低。 Save standardized values as variables,对所选择的每个变量进行标准化处理,产 生相应的 Z 分值,作为新变量保存在数据窗口中。其变量名为相应变量名前加前缀 z。标准化计算公式: s xxi Zi 单击【选项】按钮,如图2.8 所示,选择需要计算的描述统计量。各描述统计 量同 Frequencies命令中的 Statistics子对话框中大部分相同,这里不再重复。 SPSS应用软件试验指导手册 22 图 2.8 选项子对话框 在主对话框中单

30、击ok 执行操作。 结果输出与分析 在结果输出窗口中给出了所选变量的相应描述统计,如表2.6 所示。从表中可 以看到,我国上市公司前两大股东持股比例之比平均高达102.9,说明“一股独大” 的现象比较严重;前五大股东持股比例之和平均为51.8%,资产负债率平均为 46.78%。 另外,从偏态和峰度指标看出,前两大股东持股比例之比的分布呈现比较明显 的右偏,而且比较尖峭。为了验证这一结论,可以利用Frequencies命令画出变量 z 的直方图,如图 2.9 表2.6 描述统计量表 Descriptive Statistics N Mean Std. Skewnes s Kurtosis Sta

31、tistic Statistic Statistic Statistic Std. Error Statistic Std. Error 前两大股东持股比例 之比 315 102.865 199.1997 46 4.168 .137 22.404 .274 前五大股东持股比例 的平方和 315 .51836 .1496003 .602 .137 -.318 .274 SPSS应用软件试验指导手册 23 资产负债率 315 .4677 .16773 -.165 .137 -.414 .274 Valid N (listwise) 315 -2.000000.000002.000004.00000

32、6.000008.00000 Zscore: 前两大股东持股 比例之比 0 30 60 90 120 150 F r e q u e n c y Mean = -1.4224733 E-16 Std. Dev. = 1.0000. Histogram 图 2.9 变量 Z 的直方图 3探索分析(Explore) 调用此过程可对变量进行更为深入详尽的描述性统计分析,故称之为探索分 析。它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述, 显得更加细致与全面,对数据分析更进一步。 探索分析一般通过数据文件在分组与不分组的情况下获得常用统计量和图形。 一般以图形方式输出, 直观帮助

33、研究者确定奇异值、 影响点、还可以进行假设检验, 以及确定研究者要使用的某种统计方式是否合适。 在打开的数据文件上,选择如下命令:选择菜单“ 【分析】 【描述统计】 【探索】 ” ,打开对话框。 SPSS应用软件试验指导手册 24 因变量列表;待分析的变量名称,例如将每股收益率作为研究变量。 因子列表:从源变量框中选择一个或多个变量进入因子列表,分组变量可以将 数据按照该观察值进行分组分析。 标准个案:在源变量表中指定一个变量作为观察值的标识变量。 在输出栏中,选择两者都,表示输出图形及描述统计量。 选择【统计量】按钮,选择想要计算的描述统计量。如图所示 对所要计算的变量的频数分布及其统计量值

34、作图打开“Plots对话框 ” ,出现如 下图。 结果的输出与说明 SPSS应用软件试验指导手册 25 (1)Case Processing Summary 表 在Case Processing Summary 表中可以看出female 有216个个体, Male258个个体,均无缺 失值。 (2)Descriptives 表 Descriptives Gender Statistic Std. Error Current Salary Female Mean $26,031.92 $514.258 95% Confidence Interval for Mean Lower Bound $2

35、5,018.29 Upper Bound $27,045.55 5% Trimmed Mean $25,248.30 Median $24,300.00 Variance 57123688.2 68 Std. Deviation $7,558.021 Minimum $15,750 Maximum $58,125 Range $42,375 Interquartile Range $7,013 Skewness 1.863 .166 Kurtosis 4.641 .330 Male Mean $41,441.78 $1,213.96 8 95% Confidence Interval for

36、Mean Lower Bound $39,051.19 Upper Bound $43,832.37 5% Trimmed Mean $39,445.87 Median $32,850.00 Variance 380219336. 303 Std. Deviation $19,499.214 Minimum $19,650 Maximum $135,000 Range $115,350 Interquartile Range $22,675 Skewness 1.639 .152 Kurtosis 2.780 .302 (3)职位员工薪水直方图显示 SPSS应用软件试验指导手册 26 $20,

37、000$30,000$40,000$50,000$60,000 Current Salary 0 10 20 30 40 F r e q u e n c y Mean = $26,031.92 Std. Dev. = $7,558.021 N = 216 for gender= Female Histogram (4)茎叶图描述 茎叶图自左向右可以分为3 大部分:频数(Frequency )、茎( Stem)和叶( Leaf )。茎表 示数值的整数部分,叶表示数值的小数部分。每行的茎和每个叶组成的数字相加再乘以茎宽 (Stem Width ),即茎叶所表示的实际数值的近似值。 Current

38、Salary Stem-and-Leaf Plot for gender= Female Frequency Stem & Leaf 2.00 1 . 55 16.00 1 . 6666666666777777 14.00 1 . 88889999999999 31.00 2 . 0000000000000111111111111111111 35.00 2 . 22222222222222222222233333333333333 38.00 2 . 44444444444444444444444444555555555555 22.00 2 . 6666666666677777777777

39、 17.00 2 . 88888899999999999 7.00 3 . 0001111 8.00 3 . 22233333 8.00 3 . 44444555 5.00 3 . 66777 2.00 3 . 88 SPSS应用软件试验指导手册 27 11.00 Extremes (=40800) Stem width: 10000 Each leaf: 1 case(s) (5)箱图 FemaleMale Gender $0 $20,000 $40,000 $60,000 $80,000 $100,000 $120,000 $140,000 C u r r e n t S a l a r

40、y 431 454 106 34 103 446 343 18 32 242 134 277 413 168 29 80 240 468 348 371 图中灰色区域的方箱为箱图的主体,上中下3 条线分别表示变量值的第75、50、25百分位 数,因此变量的50% 观察值落在这一区域中。 方箱中的中心粗线为中位数。箱图中的触须线是中间的纵向直线,上端截至线为变量的最 大值,下端截至线为变量的最小值。 四、备择试验 完成下列试验内容,并按试验(1)所附试验报告的格式撰写报告。 1. 表2.7 为某班级 16位学生的身高数据,对其进行频数分析,并对实验报告作出说明。 表 2.7 某班 16 位学生的

41、身高数据 学号性别身高( cm)学号性别身高( cm) 1 M 170 9 M 150 2 F 173 10 M 157 SPSS应用软件试验指导手册 28 3 F 169 11 F 177 4 M 155 12 M 160 5 F 174 13 F 169 6 F 178 14 M 154 7 M 156 15 F 172 8 F 171 16 F 180 2. 测量18台电脑笔记重量, 见表2.8 ,对其进行描述统计量分析, 并对试验结果作出 说明。 表 2.8 18 台笔记本电脑重量表 序号1 2 3 4 5 6 7 8 9 重量1.75 1.92 1.59 1.85 1.83 1.68

42、 1.89 1.70 1.79 序号10 11 12 13 14 15 16 17 18 重量1.66 1.80 1.83 2.05 1.91 1.76 1.88 1.83 1.79 SPSS应用软件试验指导手册 29 试验 3:统计推断 一、试验目的与要求 1. 熟悉点估计概念与操作方法 2. 熟悉区间估计的概念与操作方法 3. 熟练掌握 T检验的 SPSS 操作 4. 学会利用 T检验方法解决身边的实际问题 二、试验原理 1. 参数估计的基本原理 2. 假设检验的基本原理 三、试验演示内容与步骤 1. 单个总体均值的区间估计 例题:为研究在黄金时段中, 即每晚 8:30-9:00 内, 电

43、视广告所占时间的多少。 美国广告协会抽样调查了20个最佳电视时段中广告所占的时间(单位:分钟)。请 给出每晚 8:30 开始的半小时内广告所占时间区间估计,给定的置信度为95。 操 作程序: 打开SPSS ,建立数据文件: “电视节目市场调查 .sav ” 。这里,研究变量为: time ,即每天看电视的时间。 选择区间估计选项, 方法如下: 选择菜单【分析】 【描述统计】 【探 索】”,打开图 3.1Explore 对话框。 从源变量清单中将 “ time ” 变量移入 Dependent List框中。 SPSS应用软件试验指导手册 30 图 3.1 Explore对话框 单击上图右方的

44、“ 统计量 ” 按钮打开 “ 探索:统计量 ” 对话框。在设置均值的置 信水平,如键入 95,完成后单击 “ 继续 ” 按钮回到主窗口。 图3.2 探索统计量设置窗口 返回主窗口点击 ok运行操作。 计算结果简单说明: 表3.1 描述统计量 Descriptives Statistic Std. Error time Mean 6.5350 .13480 95% Confidence Interval for Mean Lower Bound 6.2529 Upper Bound 6.8171 5% Trimmed Mean 6.5167 Median 6.4500 Variance .363

45、 Std. Deviation .60287 Minimum 5.60 Maximum 7.80 Range 2.20 Interquartile Range .95 Skewness .295 .512 Kurtosis -.612 .992 如上表显示。从上表 “95 Confidence Interval for Mean ” 中可以得出, 每晚8:30 开始的半小时内广告所占时间区间估计(置信度为95) 为:(6.2529 , 6.8171) ,其中 lower Bound 表示置信区间的下限, Upper Bound表示置信区间的上 限。点估计是: 6.5350。 SPSS应用软件试

46、验指导手册 31 2两个总体均值之差的区间估计 例题: The Wall Street Journal (1994,7 )声称在制造业中,参加工会的妇女比 未参加工会的妇女的报酬要多2.5 美元。想通过统计方法,对这个观点是否正确给 出检验。 假设抽取了 7位女性工会会员与 8位非工会会员女性报酬数据。要求对制造业中 参加工会会员的女性报酬与未参加工会的女性报酬平均工资之差进行区间估计,预 设的置信度为 95。 打开SPSS ,按如下图示格式输入原始数据,建立数据文件:“ 工会会员工资 差别.spss ” 。这里,“ 会员” 表示是否为工会会员的变量,y 表示是工会会员, n表示 非工会会员,

47、 “ 报酬” 表示女性员工报酬变量,单位:千美元。 计算两总体均值之差的区间估计,采用“ 独立样本 T 检验” 方法。选择菜单 “【分析】【比较均值】独立样本T检验” , 打开对话框。 变量选择 (1)从源变量清单中将 “ 报酬” 变量移入检验变量框中。表示要求该变量的均值 的区间估计。 (2)从源变量清单中将 “ group” 变量移入分组变量框中。表示总体的分类变量。 图 3.3 独立样本 T检验对话框 定义分组单击定义组按钮,打开 Define Groups 对话框。在 Group1 中输 入1,在Group2 中输入 2 (1表示非工会会员 ,2 表示工会会员) 。完成后单击“继续”

48、SPSS应用软件试验指导手册 32 按钮回到主窗口。 图3.4 define groups设置窗口 计算结果单击上图中 “ OK ” 按钮,输出结果如下图所示。 (1)Group Statistics(分组统计量)表 分别给出不同总体下的样本容量、均值、标准差和平均标准误。从该表中可以 看出,参加工会的妇女平均报酬为19.925 ,不参加工会的妇女平均报酬为20.1429 。 表3.2 分组统计量 Group Statistics 会员N Mean Std. Deviation Std. Error Mean 报酬1.00 8 19.9250 .46522 .16448 2.00 7 20.1

49、429 .52236 .19743 (2)Independent Sample Test (独立样本 T 检验)表 Levene s Test for Equality of Variance ,为方差检验,在 Equal variances assumed (原假设:方差相等)下,F=0.623, 因为其 P-值大于显著性水平,即: Sig.=0.4440.05 , 说明不能拒绝方差相等的原假设,接受两个总体方差是相等的 假设。因此参加工会会员的女性报酬与未参加工会的女性报酬平均工资之差95的 区间估计为 0.76842,0.33271。 T-test for Equality of Means 为检验总体均值是否相等的t 检验,由于在 本例中,其P-值大于显著性水平, 即:Sig.=0.4080.05 , 因此不应该拒绝原假设, 也就是说参加工会的妇女跟未参加工会的妇女的报酬没有显著差异。本次抽样推断 结论不支持 The Wall Street Journal (1994,7 )提出的“参加工会的妇女比未参加工 会的妇女的报酬要多 2.5 美元”观点,即参加工会的妇女不

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1