试验5抽样估计的spss应用.doc

上传人:scccc 文档编号:12574071 上传时间:2021-12-04 格式:DOC 页数:11 大小:121.50KB
返回 下载 相关 举报
试验5抽样估计的spss应用.doc_第1页
第1页 / 共11页
试验5抽样估计的spss应用.doc_第2页
第2页 / 共11页
试验5抽样估计的spss应用.doc_第3页
第3页 / 共11页
试验5抽样估计的spss应用.doc_第4页
第4页 / 共11页
试验5抽样估计的spss应用.doc_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《试验5抽样估计的spss应用.doc》由会员分享,可在线阅读,更多相关《试验5抽样估计的spss应用.doc(11页珍藏版)》请在三一文库上搜索。

1、实验5抽样估计的SPSS应用实验目的根据随机抽样资料,掌握对总体指标做出具有一定可靠性的估计或推断的SPSS实验,并对实验结果做出解释。相关知识5.2.1. 抽样方法:重复抽样和不重复抽样。SPSS软件中所采用的抽样方法 为不重复抽样,本实验采用不重复抽样方法。5.2.2. 抽样组织:按照抽取样本单位时是否遵循随机原则,抽样技术可以 分为概率抽样和非概率抽样。 其中, 概率抽样又称为随机抽样, 即按照随机原则 抽取样本。随机抽样的组织形式有: 简单随机抽样、 类型抽样、等距抽样、整群抽样等, 本实验采用简单随机抽样形式。5.2.3 抽样估计方法:点估计和区间估计1. 点估计:用样本统计量的值直

2、接作为总体参数的估计值。如用样本均值 直接作为总体均值的估计值, 用样本比率(或成数)直接作为总体比率 (或成数) 的估计值,用样本方差直接作为总体方差的估计值等。常用的点估计方法包括: ( 1 )矩估计法;( 2)极大似然估计法( 3)稳健估 计法,本文采用矩估计法。2. 区间估计:是在点估计的基础上,给出总体参数估计的一个范围,所以 区间估计相对于点估计更加精确,要优于点估计。实验内容5.3.1建立SPSS数据文件5.3.2利用SPSS软件抽取随机样本,抽样比率为 30%5.3.3运用SPSS软件,对总体均值进行点估计和区间估计。运用SPSS软件,对各个班级成绩的均值进行点估计和区间估计运

3、用SPSS软件,对总体比率(成数)进行点估计和区间估计。 撰写实验报告。实验要求5.4.1 准备实验数据2009级财管专业 111 名学生的概率论课程成绩,见“表 5-1 2009 级财管 学生概率课成绩 .xls ” 。5.4.2 完成实验任务,对实验结果做出简要分析。1依据样本学生的概率论成绩,采用点估计和区间估计的方法,推断学生 总体概率论课程的平均成绩,置信水平为 90%。2依据样本信息,推断该课程成绩 80 分及以上的学生比率,置信水平为 90%。3分析实验结果,提交实验报告。实验步骤5.5.1 建立SPSS数据文件通过SPSS软件打开Excel表,即表“5-1 2009级财管学生概

4、率成绩.xls ”。 第一步:选择菜单“文件打开数据”,弹出如图5-1所示的“打开数据” 对话框。图 5-1 “打开数据”对话框-在“文件类型(T):”中选择“ Excel”,在“查找范围(L):”中找到要读 取的Excel文件“ 5-1 2009级财管学生概率成绩.xls 单击【打开】按钮第二步:在打开的SPSS数据编辑窗口的变量视图下定义变量的类型单击 工具栏的“保存” ,在弹出的“将数据保存为”对话框(如图 5-2)中,在“查 找范围(L):”中找到要保存文件的位置,在“文件名(N):”中输入要保存的文 件名“ 5-1成绩”,单击【保存】按钮,至此完成 SPSS数据文件“表5-1,200

5、9 财管 1-4 班概率成绩 .sav ”的建立与保存。图 5-2 “将数据保存为”对话框5.5.2 抽取随机样本用简单随机不重复抽样方法抽样,抽样比例为 30%。SPSS的随机抽样抽取的方式有两种:其一,近似抽样:即用户给出一个百分比数值,SPSS将按照这个比例自动从数据编辑窗口中随机抽取相应百分比数目的个案,抽取的个案数不一定精确地等于用户指定的百分比,会有小的偏差,但这种偏差不会对数据分析产生重要影 响。其二,精确抽样:要求用户给出两个参数,第一个参数是希望选取的个案数, 第二个参数是指定在前几个个案中选取。本实验在这里选择“近似抽样”的方式抽取随机样本。第一步:打开数据文件“表5-1,

6、2009财管1-4班概率成绩.sav ”,在菜单 选择“数据选择个案”,得到“选择个案”对话框一选择【随机个案样本】 按钮,如图5-3。图5-3 “选择个案”对话框第二步:在“选择个案”对话框中,单击【样本(ST】按钮,得到“选择 个案:随机样本”对话框一选择【大约(A)】选项,输入数字“ 30”-点击继 续按钮,如图5-4。图5-4选择个案:随机样本对话框第三步:在“选择个案”对话框中,在“输出”框中选择【将选定个案复制 到新数据集(O)】按钮一在“数据集名称(§):”后面的框内输入文件名字“样 本” 一点击【确定】按钮,如图 5-5。图5-5 “选择个案”对话框此时将得到新生成的

7、样本数据文件, 将此文件进行保存到指定的位置,且命 名为“样本.sav ”。综上,通过采用近似随机抽样方法,从111名学生中抽样30%勺学生作为样 本,得到SPSS羊本数据文件,即“2009级财管学生概率成绩样本数据文件.sav ”, 样本容量为42。5.5.3对总体均值进行点估计和区间估计第一步:打开SPSS样本数据文件“ 2009级财管学生概率成绩样本数据文 件.sav ”,依次选择【分析】-【描述统计】-【探索】按钮,得到“探索”对 话框。将“成绩”选入“因变量列表”框内,在“输出”框内选择“统计量”选 项,如图5-6。第二步:单击【统计量】按钮,选择“描述性”选项,在“均值的置信区间(

8、C):”框内输入“ 90”,单击【继续】按钮,如图5-7。(注意:如果只进行点估 计,不需要给出置信度,因此就不需要此步骤了)图5-7探索:统计量对话框第三步:再返回到“探索”对话框中,如图 5-8。图5-8“探索”对话框第四步:单击【确定】按钮,系统输出结果如表5-1表5-1点估计及区间估计结果统计量标准误成绩均值均值的90%置信区间下限上限5%修整均值中值方差标准差极小值极大值范围四分位距偏度峰度.365.717从表5-1可以看出,样本均值为,根据统计学原理,在合理估计的假设前提下,点估计是把样本均值或是成数直接作为总体的均值或是成数。因此,以上计算的样本均值分可以作为总体均值的估计值,即

9、估计的111名学生的概率论课程成绩为分;在90%勺置信度下,对2009级111名财管专业学生的概率论课程平均成 绩进行区间估计,其区间范围在,之间。5.5.4对各个班级成绩的均值进行点估计和区间估计如果按某一标志分组(如以班级为标志分组)的各班进行参数估计,这为各 个班级之间的比较提供了方便。平均成绩的区间估计实现有“频率”、“描述”、“探索”、“均值”等过程, 学生自行练习“描述”过程的操作方法(“描述”过程的操作路径为:“分析”一 “描述统计描述”)。(注意:在“频率”、“描述”实现方法中只能对总体 进行估计,不能一步实现对各班进行估计,“探索”则可以一步实现各班的估计。) 这里主要介绍“

10、均值”过程的实现方法。第一步:打开样本数据文件“ 2009级财管学生概率成绩样本数据文件.sav ”,”,依次选择“分析比较均值均值”,得到“均值”对话框。图5-9“均值”对话框一将“成绩”选入“因变量列表D): ”框内f将“班级”选入“自变量列表”框内,如图5-10图5-10“均值”对话框第二步:单击【选项(O)】按钮,得到“均值:选项”对话框,图5-11“均值:选项”对话框一在“统计量(S):”框中,将“均值、方差、标准差”选入到“单元格统 计量(C):”框中一单击【继续】按钮。图5-12“均值:选项”对话框第三步:在“均值”对话框中,单击【Bootstrap (B)】按钮,得到“ Boo

11、tstrap对话框,图 5-13“ Bootstrap ” 对话框f在“ Bootstrap ”对话框中,选择“执行bootstrap.在“样本数(N): ” 框中输入“ 42”f在“置信区间”中的“水平(% ( D):”框中输入“ 90”f在 “抽样”框内选定“分层(T)选项,在“变量(V):中将变量“班级”移入 到右边的“分层变量(R):”框中f单击【继续】按钮(说明:本次样本容量为 42,置信水平为90%图 5-14“ Bootstrap ” 对话框第四步:再返回到“均值:选项”对话框中,单击【确定】按钮,输出结果见表5-2。表5-2 2009级财管各班平均成绩的区间估计班级Statis

12、ticBootstrap a偏差标准误差90%置信区间下限上限财管1班均值方差标准差.2418.9275.64535财管2班均值方差标准差财管3班均值方差标准差财管4班均值方差标准差.1429总计均值方差标准差.07870a. Unless otherwise noted, bootstrap results are based on 42 stratifiedbootstrapsamples由表5-2可以看出:(1)选取容量为42的样本,以90%勺置信水平下,对2009级111名财管专业学生的概率论课程平均成绩进行区间估计,其区间范围为,;(2)还可以看出对各个班级的概率论课程平均成绩的区间

13、估计结果:财管1班平均成绩的区间范围为,,财管2班平均成绩的区间范围为,财管3 班平均成绩的区间范围为,财管4班平均成绩的区间范围为,。可见,以上实验过程不仅给出了总体的参数估计结果, 同时还给出了按某一 变量分组(如以班级为变量分组)的各班参数估计值,这为各个班级之间成绩的 比较提供了方便。5.5.5对总体比率(成数)进行点估计和区间估计(该估计由学生自己完成)估计总体比率 (成数),需要对成绩分组, 其方法有两种:“可视离散化” 和 “重新编码”过程进行组距式分组。在此以“可视离散化”方法为例,说明总体 比率(成数)的估计过程。1. 用“可视离散化” 方法对成绩分组, 说明总体比率 (成数

14、)的估计过程。Step:打开样本数据文件“ 2009级财管学生概率成绩的SPSS羊本数据文 /k” ”件 .sav ”。在SPSS界面的数据编辑菜单中,选择【转换(T)】-【可视离散化(B)】, 进入“可视化封装”变量选择(对话框略) 。Step:选择“成绩”变量进入“要离散的变量(B)”框中(对话框略) -单击【继续】按钮,进入到“可视化封装”分割点设置对话框(对话框略】 。Step:给分组后的变量命名。在“可视化封装”分割点设置对话框中, 在分割点设置对话框的“离散的变量(B):”两个框后,分别输入“成绩分组(或 成绩分段】”和“成绩(离散化】”作为离散化变量的名称和标签。 在右下方处“上

15、 端点”点击“排除( E)( < )”(对话框略)。Step:设置分割点。直接点击分割点设置对话框右下方的【生成分割点(M】按钮,得到“生成分割点”对话框(窗口略)在“生成分割点”对 话框中,在“等宽度间隔(E”下的“第一个分割点的位置(F)”后的框中输入 80,在“分隔点数量(N)”后的框中输入1,在“宽度(W”后的框中输入20, 单击【应】按钮(对话框略)。Step:生成分组标签。在分割点设置对话框的“网络(G)”区域的“值(V”第一列输如分割点值 80,在“标签”第一列输入值“ 0”;在“值(V)” 第二列“ HIGH位置处输如分割点值 80,在“标签”第二列输入值“ 1”。单击

16、“可视化封装”对话框中右下方的【生成标签(A)】按钮,系统自动生成分组标 签。(对话框略)。Step:单击【确定】按钮,弹出图5-15的对话框,单击【确定】按钮, 即可在数据文件中生成新变量“成绩分组” 。图 5-15 对话框Step:回到数据编辑界面,在数据编辑菜单中点击菜单“分析(A)” -描述统计一频率(F)(对话框略)一将“成绩(已离散化)【成绩”选进“变 量(V)框中,见图5-16所示。图5-16 对话框点击Bootstrap (B)” 弹出Bootstarp对话框(对话框略)。在“ Bootstrap ”对话框中,选择“执行bootstrap.在“样本数(N): ” 框中输入“ 4

17、2”-在“置信区间”中的“水平(% ( D):”框中输入“ 90”-在 “抽样”框内选定“简单(M”选项,-单击【继续】按钮(说明:本次样本容 量为42,置信水平为90%。Step:再返回到数据编辑界面,在数据编辑菜单中点击菜单“分析( A)” -描述统计-频率(F)(窗口略)-将“成绩(已离散化)【成绩”选进“变 量(V)”框中(对话框略)单击【确定】按钮,系统输出结果,见表 5-3。表5-3 2009级财管专业学生概率成绩 80分及其以上人数比重频率百分比有效百分比累积百分比百分比 Bootstrap a偏差标准误差90%置信区间下限上限有0效1合计113142.2.0.0a. Unles

18、s otherwise noted, bootstrap results are based on 42 stratified bootstrap samples表5-3结果显示:(1) 选取容量为42的样本,样本比率可以作为总体比率的估计值,即估计 的111名学生概率论课程成绩80分及以上的人数比率为(% ;(2)选取容量为42的样本,以90%勺置信水平,对2009级111名财管专 业学生的概率论课程成绩80分及以上的人数比率进行区间估计,其区间范围为,或%,%。2. 用“重新编码为不同变量”方法对成绩分组,说明总体比率(成数)的 估计过程。对总体成绩80分及以上的学生比率的区间估计,其过程

19、与平均成绩区间估 计一致。但在区间估计之前需要在数据文件“样本.sav ”中增加一个新变量“是 否80分及以上”(做法:依次选择菜单“转换重新编码为不同变量”,在 此按照组距式分组的方法操作一然后在数据编辑窗口的变量视图下定义值标签,“是”为“1”,“否”为“ 0”一将此文件进行另存,并命名为“样本比率.sav ” 即可)。这里不再详细介绍操作步骤,估计的结果见表 5-4。表5-4 2009级财管各班80分及以上成绩比率区间估计班级StatisticBootstrap a偏差标准误差90%置信区间下限上限财管1班均值.00.00N13001313标准差.000.000.000.000.000财

20、管2班均值.89.00.10.67N90099标准差.333.191.000.500财管3班均值.45.02.16.18.80N11001111标准差.522.038.405.522财管4班均值.56.06.15.33.87N90099标准差.527.046.352.527总计均值.74.02.07.65.86N42004242标准差.445.039.354.484a. Unless otherwise noted, bootstrap results are based on 42 stratified bootstrap samples表5-4结果显示:(1) 选取容量为42的样本,样本比

21、率可以作为总体比率的估计值,即估计 的111名学生的概率论课程成绩80分及以上的学生比率为;(2) 选取容量为42的样本,以90%勺置信水平,对2009级111名财管专 业学生的概率论课程成绩80分及以上的学生比率进行区间估计,其区间范围为,;(3) 还可以看出对各个班级的概率论课程成绩 80分及以上的学生比率的区 间估计结果:财管1班概率论课程成绩80分及以上的学生比率范围为,,说明 该班概率成绩均在80分及以上;财管2班概率论课程成绩80分及以上的学生比 率范围为,;财管3班概率论课程成绩80分及以上的学生比率范围为,,财 管4班概率论课程成绩80分及以上的学生比率范围为,。实验报告思考与

22、练习题1. 请对数据表“某企业员工工资表”,要求采用简单不重复抽样方法,随机 抽取20%勺员工构成样本,以90%勺置信水平,对全体体员工的平均总工资(总工资二基本工资+职务工资+基本津贴)水平进行点估计和区间估计。2. 请对数据表“某市居民家庭收入”,要求采用简单不重复抽样方法,随机 抽取10%勺居民家庭构成样本,以90%勺置信水平,推断总体居民家庭平均收入 水平的置信区间。3请对数据表“某地区电信客户在网时长情况”,要求采用简单不重复抽样方法,随机抽取10%勺居民构成样本,以95%勺置信水平,对全体居民平均在 网时长和结婚率进行区间估计。附:实验报告实验报告包括内容:(一)个人信息姓名学号专业班级实验日期(二)实验内容1.实验项目2.实验题目 3.实验图表 4.实验结果分析(三)报告提交时间在实验课后,填写纸质的实验报告,由各班学习委员统一收交,教师集中批 改,记入实验课成绩

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1