SPSS实践报告(版).pdf

上传人:tbuqq 文档编号:5429204 上传时间:2020-05-07 格式:PDF 页数:31 大小:2.86MB
返回 下载 相关 举报
SPSS实践报告(版).pdf_第1页
第1页 / 共31页
SPSS实践报告(版).pdf_第2页
第2页 / 共31页
SPSS实践报告(版).pdf_第3页
第3页 / 共31页
SPSS实践报告(版).pdf_第4页
第4页 / 共31页
SPSS实践报告(版).pdf_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《SPSS实践报告(版).pdf》由会员分享,可在线阅读,更多相关《SPSS实践报告(版).pdf(31页珍藏版)》请在三一文库上搜索。

1、SPSS应用 实验报告 姓名:胡昆仁 学号:1304100715 指导老师:胡朝明 专业班级:统计 1001 一 目的 SPSS for Windows 使用Windows的窗口方式展示各种管理数据和分析方 法的功能,使用对话框展示各种功能选择项,清晰、直观、易学易用,涵盖面积 广。由于它具有强大的图形功能,使用它不但可以得到分析后的数字结果,还可 以得到直观、 清晰、漂亮的统计图, 形象地显示对原始数据和分析结果的各种描 述。所以,作为统计专业的学生有必要掌握这门软件的使用。这次课程实践的目 的主要有以下三个方面: 1.掌握SPSS 的基本操作,能够熟练应用SPSS 进行基本的统计分析。 2

2、.在用SPSS 对具体实例进行分析的基础上能对结果进行正确的解释。 3.在对SPSS 基本操作熟练的情况下,进一步自学SPSS 更强大的分析能力。 二 内容要求 1. 掌握如何通过 SPSS 进行数据的获取和管理,包括数据的录入,保存,读 取,转化,增加,删除;数据集的合并,拆分,排序。 2. 了解描述性统计的作用,并掌握其 SPSS 的实现(频数,均值,标准差, 中位数,众数,极差)。 3. 应用SPSS 生成表格和图形,并对表格和图形进行简单的编辑和分析。 4. 应用 SPSS 做一些探索性分析(如方差分析,相关分析、回归分析) 5. 应用 SPSS 做一个案例分析(某医院护士长对床旁凝血

3、测定仪的应用研究) 三 实验内容 1. 江西省的投资收益表(单位:亿元) 年份GDP最终消费居民消费工资总额投资总额 19951169.73769.98629.78162.16284.18 19961409.74919.59758.36185.83355.85 19971605.77989.6796.77194.4384.3 19981719.871053.66823.03173.93454.77 19991853.651122.56865.87205.78491.48 20002003.071269.58989.2204.74548.2 20012175.681357.471041.9622

4、5.43660.49 20022450.481459.651114.58243.75924.6 20032807.411515.641161.01271.091379.97 20043456.71822.141431.42305.451819.66 20054056.762117.31642.2358.312292.55 20064670.532372.911804.79417.072168.97 20075500.252793.452047.13499.423301.94 20086480.313279.892522.19573.254745.43 20097589.223545.84275

5、0.72671.396643.14 20109435.364489.223545.46807.148775 (1) 数据的录入过程: 打开 SPSS13.0软件,在 SPSS 的 variable view里面的名称改成如下的格式: 然后再回到data view 输入数据可以得到: (2)数据的保存过程 点击 SPSS的文件 -保存有如下的界面: (3)数据的读取 点击文件 -打开 -数据文件,然后会出现下面的窗口,只要点击你要打开的sav后缀文件: (4)数据的转化过程: 点击数据 -行列转换,将所有的拖到变量中有: 点击确定之后,data view 里就会出现: (5)数据的增加过程: 在

6、 var 上右键点击就会出现插入变量,然后在variable view 修改名称 , 在 data view 里输入相应变量的数据这样就增加了一列数据有: (6)数据的删除过程: 选取某一行,或某一列的数据,右键-清除,例如,清除投资总额的数据,在投资总额上右 键,然后点击清除有: (7)数据集的合并: 观测值合并: 先将需要合并的文件保存 年份GDP居民消费工资总额 1990428.62250.0265.7 1991479.37270.8971.93 1992572.55299.3786.03 1993723.04349.29104.2 1994948.16471.91140.7 点击数据

7、-合并 -合并观测值,然后点击你要合并的文件有: 点击打开之后将不配对变量全部拖入新工作数据文件中的变量有: 点击确定之后,数据就合并了,有: 变量的合并: 年份房地产投资 199827.12 199933.59 2002103.36 2003177.47 2007435.45 先将其保存至一个文件,然后在江西投资收益表这个文件的数据下打开数据-合并文件 -合并 变量有 点击打开之后, 在已经排序的文件中按关键变量匹配观测量前面打勾,并选取两个文件都是 提供观测量,然后将排除变量中的年份移入到关键变量中就有: 点击确定之后出现: (8)数据的拆分 由于上述数据没有分类,不便于拆分和排序,因此,

8、需要换下面的某大学的成绩数据,其中 的性别 1 为男性, 2为女性 某大学基本信息 学号性别年龄成绩 121985 221964 311852 421894 511968 612175 722076 811977 911884 1011952 1121945 1222095 1312278 1421763 将这些数据录入到SPSS后,点击数据 -拆分文件 根据分组安排输出:将性别和年龄拖入,点击确定之后有: (9)数据的排序 对( 8)中合并的数据进行成绩排序,操作步骤为:数据-观测量排序有: 点击确定之后就有: 2 下表是某公司销售某产品的销量: 234 159 187 155 172 18

9、3 182 177 163 158 143 198 141 167 194 225 177 189 196 203 187 160 214 168 172 178 184 209 176 188 161 152 149 211 196 234 185 189 196 206 150 161 178 168 174 153 186 190 160 171 228 162 223 170 165 179 186 175 197 208 153 163 218 180 175 144 178 191 197 192 166 196 179 171 233 179 187 173 174 210 15

10、4 164 215 233 175 188 237 194 198 168 174 226 182 172 190 172 187 189 200 211 156 165 175 210 207 181 205 195 201 172 203 165 196 172 176 182 188 195 202 213 用 SPSS得出频数分布的步骤是:先将这些数据在SPSS中保存为一列的数据,再点击分析- 描述统计 -频数分布表,然后将销售量拖入到变量中,有: 点击统计: 勾选需要统计量,点击继续之后,点确定有: Statistics N Valid 120 Missing 0 Mean 184.

11、5750 Median 182.0000 Mode 172.00 Std. Deviation 21.68245 Range 96.00 销售量 Frequency Percent Valid Percent Cumulative Percent Valid 141.00 1 .8 .8 .8 143.00 1 .8 .8 1.7 144.00 1 .8 .8 2.5 149.00 1 .8 .8 3.3 150.00 1 .8 .8 4.2 152.00 1 .8 .8 5.0 153.00 2 1.7 1.7 6.7 154.00 1 .8 .8 7.5 155.00 1 .8 .8 8.

12、3 156.00 1 .8 .8 9.2 158.00 1 .8 .8 10.0 159.00 1 .8 .8 10.8 160.00 2 1.7 1.7 12.5 161.00 2 1.7 1.7 14.2 162.00 1 .8 .8 15.0 163.00 2 1.7 1.7 16.7 164.00 1 .8 .8 17.5 165.00 3 2.5 2.5 20.0 166.00 1 .8 .8 20.8 167.00 1 .8 .8 21.7 168.00 3 2.5 2.5 24.2 170.00 1 .8 .8 25.0 171.00 2 1.7 1.7 26.7 172.00

13、6 5.0 5.0 31.7 173.00 1 .8 .8 32.5 174.00 3 2.5 2.5 35.0 175.00 4 3.3 3.3 38.3 176.00 2 1.7 1.7 40.0 177.00 2 1.7 1.7 41.7 178.00 3 2.5 2.5 44.2 179.00 3 2.5 2.5 46.7 180.00 1 .8 .8 47.5 181.00 1 .8 .8 48.3 182.00 3 2.5 2.5 50.8 183.00 1 .8 .8 51.7 184.00 1 .8 .8 52.5 185.00 1 .8 .8 53.3 186.00 2 1.

14、7 1.7 55.0 187.00 4 3.3 3.3 58.3 188.00 3 2.5 2.5 60.8 189.00 3 2.5 2.5 63.3 190.00 2 1.7 1.7 65.0 191.00 1 .8 .8 65.8 192.00 1 .8 .8 66.7 194.00 2 1.7 1.7 68.3 195.00 2 1.7 1.7 70.0 196.00 5 4.2 4.2 74.2 197.00 2 1.7 1.7 75.8 198.00 2 1.7 1.7 77.5 200.00 1 .8 .8 78.3 201.00 1 .8 .8 79.2 202.00 1 .8

15、 .8 80.0 203.00 2 1.7 1.7 81.7 205.00 1 .8 .8 82.5 206.00 1 .8 .8 83.3 207.00 1 .8 .8 84.2 208.00 1 .8 .8 85.0 209.00 1 .8 .8 85.8 210.00 2 1.7 1.7 87.5 211.00 2 1.7 1.7 89.2 213.00 1 .8 .8 90.0 214.00 1 .8 .8 90.8 215.00 1 .8 .8 91.7 218.00 1 .8 .8 92.5 223.00 1 .8 .8 93.3 225.00 1 .8 .8 94.2 226.0

16、0 1 .8 .8 95.0 228.00 1 .8 .8 95.8 233.00 2 1.7 1.7 97.5 234.00 2 1.7 1.7 99.2 237.00 1 .8 .8 100.0 Total 120 100.0 100.0 3基本图表 (1)直方图 可以同时上题画出它的正态分布曲线,只要点击图表,直方图: 结果为: (2)饼图 对上述的大学生基本信息中的年龄画饼图操作: 点击图表 -饼图有: 点击定义之后有: 点击确定之后: 从而可以看出这届19 岁的学生为最多。 (3)散点图( SPSS11.5画) 点击图表 -散点图有: 点击确定之后有: 再点击确定之后有: 学 号 1

17、614121086420 成绩 100 90 80 70 60 50 40 从这个图可以看出学生们的成绩有高有低,直观地显示了每个同学的成绩 4 探索性分析 (1)方差分析 单因素方差分析: 为寻求适应本地区的高产量油菜品种,今选了 5 个不同品种, 每一品种在4 块试验田上试种, 得到在每一块田上的亩产量如下表。 田块 /品种ABCDE 1256244250288206 2222300277280212 3280290230315220 4298275322259212 首先对这种数据进行预处理,在SPSS中如下显示: 点击分析 -均值比较 -一维方差分析,将产是拖入因变量列,将因子拖入品种

18、内有: 点击确定之后有: 查出表中的数据和上述的F 值进行比较可以得出,不同品种的为产量在0.05 水平上有显著 差异。 双因素方差分析: 下面记录了3 位操作工分别在4台不同机器上操作二天的日产量 机器 操作工 甲乙丙 1151719161921 2171715152116 3151619151818 4182215171717 对它进行双因素方差分析的过程为: 同理对此, SPSS的显示为 从而点击 -分析 -一般线性模型-单因素双变量方差分析: 点击确定之后有: 通过查表比较F 值从而可以看出机器与机器之间无显著差异,操作工与操作工之间有显著 差异,操作工 * 机器有显著差异。 (2)相

19、关分析 下面是某生产公司的基本信息: 电力消耗(千瓦)温度(华氏)日产量 1283120 1179110 1385128 975101 1487105 1081108 1284110 1177107 1485112 1184119 对它们进行相关分析有: 在中点击分析相关分析两个变量相关分析有: 点击确定之后有: 从输出的结果来看: 电力消耗和温度在0.01 水平上显著相关 电力消耗和日产量之间低度相关 温度和日产量中度相关 (3)回归分析 维尼纶纤维的耐热水性能好坏可以用指标“缩醛化度”来衡量。这个指标越高,耐热水性能 就越好。而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度去控制这

20、一指标, 为此必须找出它们之间关系,现安排了一批试验,获得如下的数据: 甲酫浓度(克/升) 18202224262830 缩醛化度(摩尔%)26.6828.3528.7528.8729.753030.36 先观察它们之间的关系散点图: 根据上面的操作步骤对它们画散点图有: 甲 醛 浓 度 323028262422201816 缩酫化度 31 30 29 28 27 26 从而可以看出基本呈现线性分析,所以对其进行一元线性回归分析,具体操作为 点击分析 -回归 -线性有: 点击确定之后有: 这个显示的是选取的变量,舍弃的变量, 和分析的方法, 这里用到的方法是进入的方法进行 回归。 这个输出显示

21、了拟合的优度,从R 方,我们可以看到,拟合优度可以达到90%,可以看出 还是很理想的 这个就是方差分析。 从这个我可以看出它的方程为:22.3910.274yx 五、案例分析 案例一分析:某医院护士长对床旁凝血测定仪的应用研究(SPSS19.0中文版) 我很赞成护士长的做法,简单,科学,有说服力。但是我自己做了一下,发现护士长做的方 差分析过程中的输出是明显有误的,这里我主要探讨护士长结果是如何做来的,是怎么运用 SPSS得到的,并且指出文章中明显错误的地方,下面是我做的过程: 1、方差分析 将数据录入成这种形势: APTT PT INR 之间的均值比较分析 点击分析 -比较均值 - 单因素

22、anova 有: 然后将 APPT .PT .INR 拖入因变量列表方式拖入因子中 点击两两比较有: 在假定方差齐性中选择LSD 在示假定方差齐性中选择Tamhane s T2 点击继续之后确定有: 多重比较 因变量(I) 方式(J) 方式 均值差 (I-J) 标准误显著性 95% 置信区间 下限上限 APPT LSD 1.00 2.00 -4.01471 * .96543 .000 -5.9303 -2.0991 3.00 -1.72647 .96543 .077 -3.6421 .1892 2.00 1.00 4.01471 * .96543 .000 2.0991 5.9303 3.00

23、 2.28824 * .96543 .020 .3726 4.2039 3.00 1.00 1.72647 .96543 .077 -.1892 3.6421 2.00 -2.28824 * .96543 .020 -4.2039 -.3726 Tamhane 1.00 2.00 -4.01471 * .91633 .000 -6.2596 -1.7698 3.00 -1.72647 .98923 .236 -4.1512 .6983 2.00 1.00 4.01471 * .91633 .000 1.7698 6.2596 3.00 2.28824 .98890 .070 -.1357 4.

24、7121 3.00 1.00 1.72647 .98923 .236 -.6983 4.1512 2.00 -2.28824 .98890 .070 -4.7121 .1357 PT LSD 1.00 2.00 -.18235 .36425 .618 -.9051 .5404 3.00 .07647 .36425 .834 -.6463 .7992 2.00 1.00 .18235 .36425 .618 -.5404 .9051 3.00 .25882 .36425 .479 -.4639 .9816 3.00 1.00 -.07647 .36425 .834 -.7992 .6463 2.

25、00 -.25882 .36425 .479 -.9816 .4639 Tamhane 1.00 2.00 -.18235 .37018 .947 -1.0897 .7250 3.00 .07647 .37473 .996 -.8419 .9948 2.00 1.00 .18235 .37018 .947 -.7250 1.0897 3.00 .25882 .34725 .841 -.5919 1.1095 3.00 1.00 -.07647 .37473 .996 -.9948 .8419 2.00 -.25882 .34725 .841 -1.1095 .5919 INR LSD 1.00

26、 2.00 -.01147 .01879 .543 -.0488 .0258 3.00 .00912 .01879 .629 -.0282 .0464 2.00 1.00 .01147 .01879 .543 -.0258 .0488 3.00 .02059 .01879 .276 -.0167 .0579 3.00 1.00 -.00912 .01879 .629 -.0464 .0282 2.00 -.02059 .01879 .276 -.0579 .0167 Tamhane 1.00 2.00 -.01147 .01820 .897 -.0561 .0331 3.00 .00912 .

27、01880 .949 -.0370 .0552 2.00 1.00 .01147 .01820 .897 -.0331 .0561 3.00 .02059 .01935 .644 -.0268 .0680 3.00 1.00 -.00912 .01880 .949 -.0552 .0370 2.00 -.02059 .01935 .644 -.0680 .0268 *. 均值差的显著性水平为 0.05 。 显然这与文章中的结果不一样, 但是明显可以看出文章中的数据采用了38组数据 (38*3-1=113)来进行计算,但是给出的数据只有34组(34*3-1=101)。 从上面第一个表中可以看出A

28、PTT显著性概率 0.000.01,表示三各方法所得 A数据具有方差齐性,既不同方法 所得PT没有显著差异。 INR显著性概率 0.5490.01,表示三各方法所得 A数据具有方差齐性, 既不同方法 所得INR没有显著差异。 从上面第二个表可以看出 对于APTT(Tamhane 值): 静脉血实验室组与静脉血试条组所得APTT均值组合的显著性概率为 0.000.01, 既 两种方法所得的 APTT均值有显著性差异, 静脉血实验室组与末梢血试条组组 合的显著性概率为 0.236 0.01,既两种方法所得的 APTT均值无显著性差异, 静 脉血试条组与末梢血试条组组合的显著性概率为0.070.01

29、,既两种方法所得的 APTT均值无显著性差异。 对于PT(LSD) 静脉血实验室组与静脉血试条组的显著性概率为0.6180.01,无显著性差异, 静 脉血实验室组与末梢血试条组的显著性概率为0.8340.01,无显著性差异, 静脉 血试条组与末梢血试条组的显著性概率为 0.4790.01,无显著性差异,验证前 面表六的结果。 对于INR(LSD) 静脉血实验室组与静脉血试条组的显著性概率为0.5430.01,无显著性差异, 静 脉血实验室组与末梢血试条组的显著性概率为0.6290.01,无显著性差异, 静脉 血试条组与末梢血试条组的显著性概率为 0.2640.01,无显著性差异,验证前 面表八

30、的结果。 2、相关分析 在SPSS 中的数据排列中,把 APTT1、APTT2、APTT3、PT1、PT2、PT3、INR1、 INR2、INR3各 作为一个变量,分别排成六列。 1)APTT之间的相关分析: 点击分析 -相关-双变量有: 点击确定之后有: 同理可以得到其他两个的相关性分析: 有: 有: 相关系数表明, APTT 值、INR值和PT值在应用不同方法测定时, 对于同一指标, 不同测定方法之间有显著正相关性。 所以综合考虑经济、 准确性、便捷等多种因素, 使用床旁凝血测定仪具有较高的 准确性,采用指端末梢血测定的结果更为可取,即在不影响准确率的情况下, 采用末梢血用床旁凝血测定仪监

31、测的方法(简称末梢血试条组)最为方便、快 捷。 六、实验心得 SPSS是世界上最早的统计软件,它是最早采用图形菜单驱动界面的统计软件,它最突出的 特点就是操作界面极为的友好,输出的结果极其的美观漂亮。它将几乎所有的功能以统一、 规范的界面展现出来,并且操作简单,易学,有着广泛的应用。在数学建模、创新项目、课 题研究中是必不可少的重要工具。在这一次的SPSS实践中,我运用该软件进行全面的学习, 了得到它处理数据的强大性,对数据进行分析的能力,还有一些探索性分析,和漂亮的图表 显示。并且可以将SPSS运用到实际的过程之中,我这次是研究它在医学上的研究,起着很 大的作用, 在这次的实验中可能对输出结果的解释不是很到位。希望老师能够进行指导。我 对 SPSS充满了极大的兴趣。并且希望一直研究下去,深入探讨,在以后的学习过程中多加 运用。能够熟悉的掌握这一软件,能够学以致用。 胡昆仁 2012/9/15

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1