SPSS实验报告71293.doc

上传人:yyf 文档编号:6298045 上传时间:2020-10-22 格式:DOC 页数:50 大小:2.82MB
返回 下载 相关 举报
SPSS实验报告71293.doc_第1页
第1页 / 共50页
SPSS实验报告71293.doc_第2页
第2页 / 共50页
SPSS实验报告71293.doc_第3页
第3页 / 共50页
SPSS实验报告71293.doc_第4页
第4页 / 共50页
SPSS实验报告71293.doc_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《SPSS实验报告71293.doc》由会员分享,可在线阅读,更多相关《SPSS实验报告71293.doc(50页珍藏版)》请在三一文库上搜索。

1、.实验课程SPSS统计分析上课时间 2014 学年 1 学期17周 (2014 年 12月2931日)学生姓名XXX学号XXX班级XXXX所在学院XXXX上课地点XXX指导教师XXX描述性统计分析一、实验目的1. 进一步了解掌握SPSS专业统计分析软件,能更好地使用其进行数据统计分析。2. 学习描述性统计分析及其在SPSS中的实现,内容具体包括基本描述性统计量的定义及计算精品.频率分析描述性分析探索性分析交叉表分析等。3. 复习权重等前章的知识。二实验内容题目一打开数据文件“data4-5.sav”,完成以下统计分析:(1)计算各科成绩的描述统计量:平均成绩、中位数、众数、标准差、方差、极差、

2、最大值和最小值;(2)使用“Recode”命令生成一个新变量“成绩段”,其值为各科成绩的分段:90100为1,8089为2,7079为3,6069为4,60分以下为5,其值标签设为:1-优,2-良,3-中,4-及格,5-不及格。分段以后进行频数分析,统计各分数段的人数,最后生成条形图和饼图。1解决问题的原理因为问题涉及各科成绩,用描述性分析,第二问要先进行数据分段,其后利用频数分析描述统计量并可以生成条形图等。2.实验步骤针对第一问第1步打开数据菜单选择:“文件打开数据”,将“data4-8.sav”导入。第2步 文件拆分菜单选择:“数据拆分文件”,打开“分割文件”对话框,点击比较组按钮,将“

3、科目”加入到“分组方式”列表框中,并确定。第3步 描述分析设置:(1) 选择菜单:“分析 描述统计 描述”, 打开“描述性”对话框,将“成绩”加入到“变量”列表框中。打开“选项”对话框,选中如下图中的各项。精品. 点击“继续”按钮。(4)回到“描述性”对话框,点击确定。针对第二问第1步 频率分析设置:(1) 选择菜单:“分析 描述统计 频率”,(2) 打开“频率(F)”对话框,点击“合计”。再点击“继续”按钮. (3)打开“图表”对话框,选中“条形”精品. 复选框,点击“继续”按钮。(4)回到“频率(F)”对话框,点击确定。(5)重复步骤(1)(2)把步骤(3)改成打开“图表”对话框,选中“饼

4、图” 复选框,点击“继续”按钮。再回到“频率(F)”对话框,点击确定。三、实验结果及分析描述统计量科目N全距极小值极大值均值标准差方差精品.描述统计量科目N全距极小值极大值均值标准差方差语文成绩1579199867.8721.738472.552有效的 N (列表状态)15数学成绩1571249555.8724.348592.838有效的 N (列表状态)15英语成绩1576159157.8022.697515.171语文成绩1579199867.8721.738472.552有效的 N (列表状态)15数学成绩1571249555.8724.348592.838有效的 N (列表状态)15英

5、语成绩1576159157.8022.697515.171有效的 N (列表状态)15统计量成绩语文N有效15缺失0均值67.87中值73.00众数60a标准差21.738方差472.552极小值19极大值98百分位数2560.005073.007583.00数学N有效15缺失0均值55.87中值49.00众数37标准差24.348方差592.838极小值24极大值95百分位数2536.005049.007581.00英语N有效15缺失0均值57.80中值56.00众数56标准差22.697方差515.171精品.统计量成绩语文N有效15缺失0均值67.87中值73.00众数60a标准差21.

6、738方差472.552极小值19极大值98百分位数2560.005073.007583.00数学N有效15缺失0均值55.87中值49.00众数37标准差24.348方差592.838极小值24极大值95百分位数2536.005049.007581.00英语N有效15缺失0均值57.80中值56.00众数56标准差22.697方差515.171极小值15极大值91百分位数2534.005056.007578.00极小值15极大值91百分位数2534.005056.007578.00a. 存在多个众数。显示最小值成绩段科目频率百分比有效百分比累积百分比语文有效优320.020.020.0良16

7、.76.726.7中426.726.753.3及格426.726.780.0不及格320.020.0100.0合计15100.0100.0数学有效优16.76.76.7良320.020.026.7中213.313.340.0不及格960.060.0100.0合计15100.0100.0英语有效优213.313.313.3良16.76.720.0中213.313.333.3及格213.313.346.7不及格853.353.3100.0合计15100.0100.0 精品. 精品. 精品.语文成绩的平均成绩为67.87,中位数是73、众数60、标准差21.738、方差472.552、极差98-19

8、=79、最大值98和最小值19;各分数段人数:语文90100为3,8089为1,7079为4,6069为4,60分以下为3,数学90100为1,8089为3,7079为2,6069为0,60分以下为9,英语90100为2,8089为1,7079为2,6069为2,60分以下为9,生成条形图和饼图如截图所示题目二1. 打开数据文件“data4-6.sav”,完成以下统计分析:(1)对身高进行考察,分析四分位数、计算上奇异值、上极端值、下奇异值和下极端值,并生成茎叶图和箱图;(2)考察身高、体重和胸围的正态性。针对第一问1.解决问题的原理 探索性分析第1步打开数据菜单选择:“文件打开数据”,将“d

9、ata4-9.sav”导入。第2步 探索分析设置: (1)选择菜单“分析 描述统计 探索”,打开“探索” 对话框,将“身高”字段移入“因变量列表”。精品. (2)打开“统计量”对话框,选中“描述性”及“M-估计量”选项; (3)打开“探索:图”对话框,选中“按因子水平分组”、“茎叶图”、“带检验的正态图”精品.等选项。 打开“探索:选项”,选中“按列表排除个案”选项针对第二问与第一问的方法相似也可用探索性分析第1步 探索分析设置: (1)选择菜单“分析 描述统计 探索”,打开“探索” 对话框,将“体重”字段移入“因变量列表”。精品. (2)打开“统计量”对话框,选中“描述性”及“M-估计量”选

10、项; (3)打开“探索:图”对话框,选中“按因子水平分组”、“茎叶图”、“带检验的正态图”精品.等选项。 打开“探索:选项”,选中“按列表排除个案”选项第2步 探索分析设置: (1)选择菜单“分析 描述统计 探索”,打开“探索” 对话框,将“胸围”字段移入“因变量列表”。精品. (2)打开“统计量”对话框,选中“描述性”及“M-估计量”选项; (3)打开“探索:图”对话框,选中“按因子水平分组”、“茎叶图”、“带检验的正态图”精品.等选项。 打开“探索:选项”,选中“按列表排除个案”选项3.结果及分析精品.从上的茎叶图可以更加详细地分析身高数据。从上的箱图可以分析变量“身高”的四分位数。 精品

11、.从上的Q-Q图中可以看出,身高、体重、胸围三个变量都很好的服从正态分布。题目三表4.22是对吸烟与患气管炎的调查表,试分析吸烟与患气管炎之间的关系。(用交叉列联表分析,参见数据文件:data4-10.sav。)1.解决问题的原理:运用交叉表分析2.实验内容第1步打开数据菜单选择:“文件打开数据”,将“data4-10.sav”导入。第2步 加权设置:菜单选择:“数据加权个案”,打开“加权个案”对话框,如图设置。精品.第3步 交叉表分析设置:(1)选择菜单:“分析描述统计 交叉表” ,打开“交叉表”对话框,将“是否吸烟”及“是否换气管炎”字段分别加入“行(s)”及“列(c)”列表框中。(2)打

12、开“统计量”对话框,选中“卡方”选项。精品.(3)打开“单元显示”对话框,选中“观察值”及“四舍五入单元格计数”选项,二者都是缺省设置。3实验结果及分析精品.是否吸烟 * 是否患气管炎 CrosstabulationCount是否患气管炎Total患病健康是否吸烟是43162205否13121134Total56283339Chi-Square TestsValuedfAsymp. Sig. (2-sided)Exact Sig. (2-sided)Exact Sig. (1-sided)Pearson Chi-Square7.469a1.006Continuity Correctionb6.

13、6741.010Likelihood Ratio7.9251.005Fishers Exact Test.007.004Linear-by-Linear Association7.4471.006N of Valid Cases339a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 22.14.b. Computed only for a 2x2 table综上所示,各种检验方法显著水平都远小于0.05,所以有理由拒绝“实验准备与评价结果是独立的”假设,即认为实验准备这一评价指标与评价

14、结果是相关的。三、实验心得与体会精品. 通过本章例子学习描述性统计分析及其在SPSS中的实现,学会了基本描述性统计量的定义及计算、频率分析、描述性分析、探索性分析、交叉表分析。深刻体会到了如何计算诸如样本均值等重要的基本统计量,并辅助于SPSS提供的图形功能来分析把握数据的基本特征和数据的整体分布形态,对进一步的统计推断和数据建模工作起到了重要作用。参数估计与假设检验一、实验目的4. 进一步了解掌握SPSS专业统计分析软件,能更好地使用其进行数据统计分析。2.表5.20 某班学生数学成绩序号成绩序号成绩序号成绩163109419702991198206538112732184477138922

15、845681498239567915772461780166725698631769267398718812760通过样本提供的信息来对总体信息进行估计和推断,如参数估计和假设检验等,从样本的观察或试验结果的特征对总体的特征进行估计和推断。二、实验内容题目一表5.20是某班学生的高考数学成绩,试分析该班的数学成绩与全国的平均成绩70分之间是否有显著性差异。(参见数据文件:data5-16.sav。)1解决问题的原理:单样本T检验2.实验步骤第1步 打开数据菜单选择:“文件打开数据”,将“data4-16.sav”导入。第2步 单样本T检验分析设置(1)选择菜单“分析比较均值单样本T检验(S)”

16、,打开 “单样本T检验” 对话框,将变量“成绩”移入“检验变量”列表框,并输入检验值70。精品.(2)“单样本T检验:选项”对话框 ,设置置信区间为95%(缺省为95%),故此处可不设置,及默认。3.实验结果及分析One-Sample StatisticsNMeanStd. DeviationStd. Error Mean成绩2777.9312.1112.331One-Sample TestTest Value = 70 tdfSig. (2-tailed)Mean Difference95% Confidence Interval of the DifferenceLowerUpper成绩3

17、.40026.0027.9263.1312.72可得到,当置信区间为95%时,显著水平为0.05,从表中可以看出,双尾检测概率P值为0.02,小于0.05,故原假设不成立,也就是说,数学成绩与全国的平均成绩70分之间有显著性差异。题目二在某次测试中,随机抽取男女学生的成绩各10名,数据如下: 男:99 79 59 89 79 89 99 82 80 85 女:88 54 56 23 75 65 73 50 80 65假设样本总体服从正态分布,比较置信度为95%的情况下男女得分是否有显著性差异。(参见数据文件:data5-17.sav。)1解决问题的原理:独立样本T检验2.实验步骤第1步打开数据

18、菜单选择:“文件打开数据”,将“data5-17.sav”导入。第2步 独立样本T检验设置:(1)选择菜单 “选择比较均值独立样本T检验”,打开“独立样本T检验”对话框,将“成绩” 作为要进行T检验的变量,将“性别”字段作为分组变量,定义分组变量的两个分组分别为“1”和“2”。精品. (2)打开“独立样本T检验:选项”对话框,具体选项内容及设置与单样本T检验相同,即默认形式,不更改。Group Statistics性别NMeanStd. DeviationStd. Error Mean成绩男1084.000011.527743.64539女1062.900018.453855.83562精品.

19、上表中是独立样本T检验的均值检验结果。显著水平为0.05,从表中可以看出T统计量的概率P小于0.05,故拒绝原假设,所以男女得分有显著性差异。题目三某医疗机构为研究某种减肥药的疗效,对16位肥胖者进行为期半年的观察测试,测试指标为使用该药之前和之后的体重,数据如表5.21所示。假设体重近似服从正态分布,试分析服药前后,体重是否有显著变化。(参见数据文件:data5-18.sav。)表5.21 服药前后的体重变化体 重服药前198 237 233 179 219 169 222 167 199 233 179 158 157 216 257 151 服药后192 225 226 172 214

20、161 210 161 193 226 173 154 143 206 249 1401解决问题的原理:配对样本T检验2.实验步骤第1步打开数据菜单选择:“文件打开数据”,将“data5-18.sav”导入。第2步 配对样本T检验设置:选择菜单“分析比较均值配对样本T检验”,弹出“配对样本T检验”对话框选中“服药前体重”将其拉入“Variable1”,将“服药后体重”拉入“variable2” 字段。打开“选项”对话框,默认不更改。精品.3.实验结果及分析Paired Samples StatisticsMeanNStd. DeviationStd. Error MeanPair 1服药前体重

21、198.381633.4728.368服药后体重190.311633.5088.377Paired Samples CorrelationsNCorrelationSig.Pair 1服药前体重 & 服药后体重16.996.000 在显著水平为0.05时,概率P值明显小于0.05,拒绝原假设,可以认为减肥药前后的体重有明显的线性关系。从截图第三个和第四个是配对样本T检验的最终结果,可以看出,在显著水平为0.05,由于概率P值明显小于0.05,拒绝原假设,故可以认为服药前后,体重有显著变化。题目四某农民想了解两品种的小麦、产量是否有显著区别,其产量数据如表5.24所示,分别在显著性水平0.05和

22、0.01下检验两品种产量是否有显著性差异。(数据来源:M.R.斯皮格尔,统计学(第3版),科学出版社;参见数据文件:data5-23.sav。)表5.24 两种小麦的产量数据小麦115.915.316.414.915.31614.615.314.516.616小麦216.416.817.116.9181618.117.215.41解决问题的原理:独立样本非参数检验2.实验步骤精品.第1步打开数据菜单选择:“文件打开数据”,将“data5-23.sav”导入。第2步 分析由于是两种小麦,可以认为是两组独立样本,但行使里程数不知道服从何种分布,可以用两独立样本的费参数检验进行分析。第3步 进行独立

23、样本的非参数检验设置(1)选择“分析非参数检验独立样本”,打开“非参数检验:两个或更多独立样本”对话框,设置如下:显著性水平=0.05精品.显著性水平=0.01精品.精品.所以当显著性水平=0.05时,用二样本时拒绝原假设。精品.当显著性水平=0.01时,不拒绝原假设。题目五为研究长跑运动对增强普通高校学生心脏功能的效果,对某校15名男生进行测试,经过5个月的长跑锻炼后看其晨脉是否减少。锻炼前后的晨脉数据如表5.25所示。表5.25 长跑锻炼前后晨脉变化表锻炼前707656636356586065657566565970锻炼后485460644855544551485648645054试问锻炼

24、前后的晨脉在显著性水平0.05下有无显著性差异。(数据来源:卢纹岱,SPSS for Windows统计分析(第3版),电子工业出版社;参见数据文件:data5-24.sav。)1.解决问题的原理:相关样本的非参数检验。2. 实验步骤第1步打开数据菜单选择:“文件打开数据”,将“data5-24.sav”导入。第2 步 进行相关样本的非参数检验设置(1)通过“分析-非参数检验-相关样本”,打开“非参数检验”对话框精品. 精品. 3.实验结果及分析显著性水平=0.05时,拒绝原假设。即长跑锻炼前后晨麦无显著性差异。精品.三、实验心得及体会通过本章的学习以及实例分析的操作,学会了如何用T检验解决两

25、样本间均值比较的问题,可以解决例如两类物品是否存在区别的问题。对数据的分析有了进一步的认识和技能的掌握有了很大的提高。相关分析一、实验目的5. 进一步了解掌握SPSS专业统计分析软件,能更好地使用其进行数据统计分析。2.利用分析多个性质不同的SPSS变量,从而分析总体的多个特征,并分析这些特征的联系。相关分析是比较简单的多元分析,使用多元分析方法,能快速发现总体特征之间的关系,并检验这些特征的显著性。以此广泛用于生物学、经济学等各个领域。二、实验内容题目一K.K.Smith在烟草杂交繁殖的花上收集到如表7.21所示的数据,要求对以上3组数据两两之间进行相关分析,以0.05的显著性水平检验相关系

26、数的显著性。(数据来源:苏金明,统计软件SPSS系列应用实践篇,电子工业出版社;参见数据文件:data7-9.sav。)表7.21 K.K.Smith所调查的长度资料花瓣长494432423253363937454148453940343735花枝长272412221329142016212225231820152013花萼长1916121710191514152114222215141515161. 解决问题的原理:两变量相关分析2. .实验步骤第1步 打开数据菜单选择:“文件打开数据”,将“data7-9.sav”导入。第2步 两变量的相关性分析(1) 选择菜单“分析相关双变量”,打开如图

27、所示的对话框,将变量移入“变量”框中;“相关系数”选择Pearson;在“显著性检验”中选择“双侧检验”精品. 3.实验结果及分析Descriptive StatisticsMeanStd. DeviationN花枝长19.675.02918精品.Descriptive StatisticsMeanStd. DeviationN花枝长19.675.02918花萼长16.173.29418花萼长16.173.29418花瓣长40.445.97318Correlations花枝长花萼长花瓣长花枝长Pearson Correlation1.678*.955*Sig. (2-tailed).002.0

28、00Sum of Squares and Cross-products430.000191.000487.667Covariance25.29411.23528.686N181818花萼长Pearson Correlation.678*1.797*Sig. (2-tailed).002.000Sum of Squares and Cross-products191.000184.500266.667Covariance11.23510.85315.686N181818花瓣长Pearson Correlation.955*.797*1Sig. (2-tailed).000.000Sum of S

29、quares and Cross-products487.667266.667606.444Covariance28.68615.68635.673N181818*. Correlation is significant at the 0.01 level (2-tailed).上面的第一个表列出了描述性统计量均值、标准差和统计量个案数。第二个表是相关分析的主要结果,可以看出:l 花瓣长与花萼长相关系数0.80.7970.5,显著相关;l 花瓣长与花枝长相关系数0.9550.58,高度相关;l 花枝长与花萼长相关系数0.80.6780.5,显著相关。题目二试确定19621988年安徽省国民收入

30、与城乡居民储蓄存款余额两个变量间的线性相关性,数据如表7.22所示。(数据来源:数据统计与管理1990年第5期,中国商场统计研究会主办;参见数据文件:data7-10.sav。)表7.22 19621988年安徽省国民收入数据表年 份19621963196419651966196719681969197019711972197319741975国民收入(亿元)34.6135.6739.5247.3254.1450.8649.6951.6165.0672.5777.7283.578287.44存款余额(亿元)0.590.710.8511.221.141.321.281.351.61.872.22

31、.552.61年 份1976197719781979198019811982198319841985198619871988精品.国民收入(亿元)95.6397.23103.81116.29127.87150.29161.47180.2221.17271.81310.53357.86444.78存款余额(亿元)2.743.133.915.758.7612.1916.3620.9528.3238.4355.4375.289.831. 解决问题的原理:两变量相关分析2. .实验步骤第1步 打开数据菜单选择:“文件打开数据”,将“data7-10.sav”导入第2步 两变量的相关性分析选择菜单“分析

32、相关双变量”,打开如图所示的对话框,将变量移入“变量”框中;“相关系数”选择Pearson;在“显著性检验”中选择“双侧检验”。 3.实验结果及分析精品.从上表的上半部分可以看出,两变量的Kendall相关系数0.9720,双尾检验的相伴概率明显小于0.05,应拒绝两变量不相关的原假设,说明两变量具有显著的正相关性。从上表的下半部分可以看出,两变量的Spearman相关系数为0.9950,同时双尾检验的相伴概率显著性明显小于0.05,也说明两变量呈显著的正相关性。从表的脚注可看出双尾检测下两变量在0.01水平上具有显著的正相关性。故19621988年安徽省国民收入与城乡居民储蓄存款余额两个变量

33、间具有显著的线性相关性。题目三某高校抽样10名短跑运动员,测出100米短跑的名次和跳高的名次如表7.23所示,问这两个名次是否在0.05的显著性水平下具有相关性。(数据来源:马庆国,应用统计学:数据统计方法、数据获取与SPSS应用,科学出版社;参见数据文件:data7-11.sav。)表7.23 10名运动员的100米短跑及跳高名次精品.百米名次12345678910跳高名次431527108961. 解决问题的原理:两变量相关分析2. .实验步骤第1步 打开数据菜单选择:“文件打开数据”,将“data7-11.sav”导入第2步 进行两变量相关分析选择菜单“分析相关双变量”,打开如图所示的对

34、话框,将变量移入“变量”框中;“相关系数”选择Pearson;在“显著性检验”中选择“双侧检验” 3.实验结果及分析Descriptive StatisticsMeanStd. DeviationN百米名次5.503.02810精品.Descriptive StatisticsMeanStd. DeviationN百米名次5.503.02810跳高名次5.503.02810Correlations百米名次跳高名次百米名次Pearson Correlation1.697*Sig. (2-tailed).025Sum of Squares and Cross-products82.50057.50

35、0Covariance9.1676.389N1010跳高名次Pearson Correlation.697*1Sig. (2-tailed).025Sum of Squares and Cross-products57.50082.500Covariance6.3899.167N1010*. Correlation is significant at the 0.05 level (2-tailed).可以看出100米短跑的名次和跳高的名次的相关系数为0.697,sig为0.25,明显大于0.05,故接受原假设,说明在0.05的显著性水平下具有相关性。题目四某公司太阳镜销售情况如表7.24所示

36、,请分析销售量与平均价格、广告费用和日照时间之间的关系,并说明此题用偏相关分析是否有实际意义(显著性水平为0.05)。(数据来源:卢纹岱,SPSS for Windows统计分析(第3版),电子工业出版社;参见数据文件:data7-12.sav。)表7.24 某公司销售太阳镜的数据精品.月 份123456789101112销 量759014818324226327831825620014080价 格6.86.563.532.92.62.13.13.64.25.2广 告 费 用2567222528302218102日 照 时 间2.445.26.888.410.411.59.66.13.421.

37、 解决问题的原理:偏相关分析2. .实验步骤第1步 打开数据菜单选择:“文件打开数据”,将“data7-12.sav”导入。第2步 偏相关性分析(1)控制广告费用和日照时间、月份,分析销售量与平均价格之间的关系,打开“分析相关偏相关”,设置如下:精品.(2)控制平均价格和日照时间、月份,分析销售量与广告费用之间的关系,打开“分析相关偏相关”,设置如下:(3)控制平均价格和广告费用、月份,分析销售量与日照时间之间的关系,打开“分析相关偏相关”,设置如下:精品.3.实验结果及分析控制广告费用和日照时间、月份后得到销售与价格的相关系数为-0.660,是负相关,也是显著相关。精品.控制平均价格和日照时

38、间、月份,销售量与广告费用的相关系数为0.683,正相关,显著相关。精品.控制平均价格和广告费用、月份,分析销售量与日照时间的相关系数为0.775,正相关,显著相关。 综上所述,即得:l 控制广告费用和日照时间、月份后得到销售与价格的相关系数为-0.660,是负相关,也是显著相关。l 控制平均价格和日照时间、月份,销售量与广告费用的相关系数为0.683,正相关,显著相关。l 控制平均价格和广告费用、月份,分析销售量与日照时间的相关系数为0.775,正相关,显著相关。精品.然而,因为日照时间无法控制,所以第一、二个表控制无法实现,第三个表没有研究的意义,所以无实际意义。三、实验心得与体会 通过本章的学习以及SPSS实例分析的训练,学会了如何运用分析多个性质不同的SPSS变量来发现总体特征之间的关系,并检验这些特征的显著性。深刻体会到相关分析的实际意义,在以后的工作学习中,遇到此类问题,能更加的快速地运用SPSS处理,解决类似数模、身高是否受基因的影响等问题。如有侵权请联系告知删除,感谢你们的配合!精品

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 科普知识


经营许可证编号:宁ICP备18001539号-1