SPSS13基础知识.ppt

上传人:爱问知识人 文档编号:5020873 上传时间:2020-01-29 格式:PPT 页数:99 大小:3.18MB
返回 下载 相关 举报
SPSS13基础知识.ppt_第1页
第1页 / 共99页
SPSS13基础知识.ppt_第2页
第2页 / 共99页
SPSS13基础知识.ppt_第3页
第3页 / 共99页
SPSS13基础知识.ppt_第4页
第4页 / 共99页
SPSS13基础知识.ppt_第5页
第5页 / 共99页
点击查看更多>>
资源描述

《SPSS13基础知识.ppt》由会员分享,可在线阅读,更多相关《SPSS13基础知识.ppt(99页珍藏版)》请在三一文库上搜索。

1、2020/1/29,研究生用,1,SPSS 13.0 基础知识,暨南大学医学院医学统计教研室 夏苏建,2020/1/29,2,SPSS的含义,SPSS是软件英文名称的首字母缩写 原意为: Statistical Package for Social Science 即“社会科学统计软件包”,2020/1/29,3,SPSS最显著的特点,SPSS是国际上最流行并具有权威性的统计分析软件之一,它由美国斯坦福大学的三位学生于1968年研制。 SPSS最显著的特点是用菜单和对话框选择并完成统计过程,操作简便,是非统计专业人员应用最多的统计软件。,2020/1/29,4,SPSS的不同版本,尽管SPSS

2、在不断升级,但其基本统计分析内容无变动。 以SPSS 13.0版本为基础介绍。对于SPSS 11.5和16.0版本,本指导也适用。 SPSS 13.0与SPSS 11.5以前版本的最大不同是:变量名可以最多长达64个字节,统计图的编辑更加灵活。,2020/1/29,5,SPSS 13.0安装步骤,运行SPSS13Eval安装程序 安装完成后,拷贝crack目录下的执行文件Patch到安装目录运行即可!,2020/1/29,6,SPSS的教学特点,尽可能用默认选择项或最简捷的操作方式获得必要的结果。 按医学统计学和医学论著的要求来解释结果。,2020/1/29,7,实习一 数据文件的建立、保存和

3、调用,SPSS启动 SPSS主要窗口及其功能 数据文件的建立,2020/1/29,8,一、SPSS启动,有3种方式启动SPSS: 在桌面双击SPSS13.0图标 从菜单选择:开始程序SPSS for Windows SPSS 13.0 for Windows 在资源管理器中双击SPSSWIN.exe文件,2020/1/29,9,二、SPSS主要窗口及其功能,数据编辑窗(Data editor) 结果输出窗(Viewer) 程序编辑窗(Syntax Editor),2020/1/29,10,数据编辑窗(Data editor) SPSSEmployee data.sav,2020/1/29,11

4、,2. 结果输出窗(Viewer) 按性别统计不同岗位人员的收入,2020/1/29,12,3.程序编辑窗(Syntax Editor),2020/1/29,13,三、数据文件的建立,数据文件的建立是指把收集到的数据存入到计算机的磁盘中,以便调用、修改、添加数据和统计分析。主要步骤是: 数据编码 建立数据文件结构 数据录入和保存数据,2020/1/29,14,表1.1 6例某病住院病人的部分资料,2020/1/29,15,(一)数据编码,定义变量名(variable) 定义变量的标签(variable labels) 对数据进行编码和定义变量取值的标签(value labels) 数据编码的一

5、般方法,2020/1/29,16,数据编码,2020/1/29,17,表1.1 6例某病住院病人的部分资料,2020/1/29,18,(一) 定义变量名(variable),变量名的长度不能多于64个字符。每个英文字母或阿拉伯数字为1个字符,每个汉字为2个字符。变量名不应过长,最好有实际含义,如性别或sex。 首字符应该为英文字母或汉字。变量名的任何字符不能使用“+”、“-”、“*”、“?”。 变量名不能使用SPSS的保留字。如:ALL、AND、OR、NOT、EQ、GE、GT、LE、LT、NE、TO、WITH。 系统中不区分变量名的大小写字符。例如TIME和time被认为是同一变量。,2020

6、/1/29,19,(二)定义变量名的标签 (variable labels),定义变量名标签是对变量名做进一步说明。 如果变量名已经说明了变量的内涵,则不必设置变量名标签。如性别、血型、name,等 有时,变量名不能明确表示该变量的含义。如date_in。变量名标签设置为“入院时间”。 变量标签不受字符位数的限制,可以用英文或中文表示。 在统计分析的输出结果中,可显示变量的英文或中文标签,使输出结果的可读性更好。,2020/1/29,20,(三)对数据进行编码 定义变量值标签(value labels),对于分类变量,常用数字对不同的类别进行编码,从而方便数据的输入和统计分析。 有时为了更好理

7、解数据内容和输出结果,给变量的不同取值赋以不同标签,使用户一目了然。如乙型肝炎表面抗原HBsAg:(0:阴性,1:阳性,2:未检测),2020/1/29,21,(四)数据编码的一般方法,数值变量:如:年龄、体重,不必编码就可直接输入。 无序分类变量:如:性别(1:男;2:女)、职业(1:医生;2:护士;3:行政人员;4:工人;5:其他)。 有序分类变量:疼痛(0:无;2:轻度;3:中度;4:重度)、年龄(1:15岁;2:1534岁;3:3559岁;4:60岁)。 可选择多项的变量(复选题),2020/1/29,22,可选择多项的变量(复选题),如药物的不良反应(无0;有:头昏1,恶心2,上腹不

8、适3,口干4,食欲不振5)。此例可以分解为5个数值变量,如A1,A2,A3,A4,A5,用数值0表示“无”,1表示“有”。也可设置1个字符变量,如affect,如同时有“头昏”、“恶心”和“食欲不振”症状,可用字符变量值“125”表示,使得资料输入方便。,2020/1/29,23,二、 建立数据文件结构,打开数据编辑窗口 启动SPSS以后,数据编辑窗口首先自动打开。 单击Cancel按钮,即进入数据窗口(Data View)。 在SPSS运行过程中欲建立新的数据文件,从菜单选择:File New Data。单击数据编辑窗左下方的Variable View按钮,使当前窗口由数据窗口(Data V

9、iew)转为变量窗口(Variable View)。,2020/1/29,24,2020/1/29,25,数据编辑窗口(Data Editor) (数据窗)Data View; (变量窗)Variable View,2020/1/29,26,变量窗口(Variable View),2020/1/29,27,变量名(Name) 在光标处直接输入。 变量类型(Type) 默认设置:数值变量类型(Numeric),长度(Width)是8个字符,小数点(Decimal)2位(记作F8.2)。它的含义是:该变量数字长度共8个字符,其中小数点占1个字符,小数点以前的数值占5个字符,小数点以后的数值占2个字

10、符)。 字符变量(String)的默认长度是8个字符(记作A8),如果输入姓名、地址等文字内容,必须选用字符变量。方法:单击相应变量的Numeric,出现,单击。,2020/1/29,28,2020/1/29,29,数据长度(Width)和小数点位数(Decimals) 通过单击“”“”选择,也可在变量类型(Type)中设置。 日期变量(Date)的设置 单击相应变量的Numeric,出现,单击。,2020/1/29,30,变量标签(Labels) 在光标处直接输入中文或英文标签。如果变量名能够说明该变量的内涵,可不必设置变量标签。 变量取值标签(Values) 不是必须设置项目。设置“性别”

11、的变量值标签:1为男性;2为女性。方法:单击相应变量的Values,出现,单击。 缺失值(Missing Values) 不是必须设置项目。数值变量的默认缺失值为“.”。本例hbsag(乙肝表面抗原)的未检用“2”表示“”,故设“2”为缺失值。方法:单击相应变量的Missing,出现,单击。 列宽(Column) 用于调整数据表中各列的宽度。默认为8个字符宽。,2020/1/29,31,2020/1/29,32,数据表中数据排列方向(Align) 数值变量(Numeric)的默认为右对齐(Right),字符变量(String)的默认为左对齐(Left)(图1.2)。 测量类型(Measure)

12、 对于数值变量默认为Scale(数量),字符变量默认为Nominal(名义,如姓名)。对于等级资料(如疗效的4个等级用数值1,2,3,4表示)可以定义为Ordinal(等级) ,也可默认用Scale。 本例的性别分别用数值1和2表示男性、女性。这时的1和2已经没有数值大小的含义,故可以定义为字符变量,测量类型为Nominal。但为了操作方便和某些统计分析,还是经常把它定义为数值变量,默认测量类型为Scale。 单击变量窗口左下方的Data View按钮,使当前窗口转为数据窗口。,2020/1/29,33,2020/1/29,34,三、数据录入,2020/1/29,35,按变量输入数据(按列输入

13、) 将光标移到该变量与第一个观察单位交叉处的单元格,单击鼠标,被定位的单元格边框加黑显示;输入变量的第一个值,回车或按向下移动光标键“”,黑框单元格定位于观测量序号为2的单元格,输入第二个数据。 按观察单位(按行输入)输入数据 将光标移动要输入的观察单位,单击鼠标,将该观察单位标记,输入变量的第一个值,按“Tab” 或“”键,输入第二个数据。 按单元格输入数据 将光标移动到想要输入的单元格,单击鼠标,输入变量值,按回车键。也可按此法修改变量值。,2020/1/29,36,显示变量值标签,2020/1/29,37,四、数据文件的保存,将数据窗中的数据以文件形式保存到指定磁盘的目录中。 保存数据文

14、件可以使用“File”菜单项中的Save(保存)和Save as(另存为)。保存有两种: 直接保存为SPSS for Windows 的数据文件,扩展名为“.sav”(默认) 保存为其他格式的数据文件,以便其他软件可以使用,如Excel(*.xls) 和dBASEIII(.dbf)。,2020/1/29,38,五、数据文件的调用,从SPSS for Windows对话框中调用:SPSS 启动后,对话框默认选择项为“Open an existing data source”,文件栏中最多可保留以前打开的9个文件(默认)。 从菜单中调用:单击File,展开下拉菜单。菜单的下半部为以前打开的文件。

15、单击Open File图标,按路径选择要打开的文件。 SPSS 可直接调用Excel数据文件(第1行是变量名)。,2020/1/29,39,实习二 数据文件的编辑、 整理、转换和合并,数据文件的编辑 数据文件的整理 数据文件的转换 数据文件的合并,2020/1/29,40,一、数据文件的编辑,(一)变量的插入和删除 (二)观察单位的插入和删除 (三)数据的 剪切(Cut) 复制(Copy) 粘贴(Paste) (四)恢复删除或修改前的数据,2020/1/29,41,(一)变量的删除和插入,删除一个变量 插入一个变量(Variable) 练习:将例1.1数据文件中的变量num删除后,再插入该变量

16、,重新输入。,2020/1/29,42,删除一个变量 把光标移至待删除的变量名处,单击鼠标,按键盘上Delete键(或从菜单上选择Edit Cut)。,2020/1/29,43,插入一个变量(Variable) 在数据窗口,把光标定位于新变量要占据的那一列的任意行上,单击鼠标;单击“插入变量”(Insert Variable)图标。结果在光标位置的左边插入一个变量名为“Var0000n”的变量,其中n是系统定义的变量序号,原来占据此位的变量右移;可在变量窗口对插入的变量重新命名并定义其属性。,2020/1/29,44,(二)观察单位的插入和删除,插入一个观察单位(Case) 删除一个观察单位

17、把光标移至待删除的观察单位序号处,单击鼠标,按键盘上Delete键(或从菜单上选择Edit Cut)。 练习:将例1.1数据文件中的第2个病例删除后,再插入病例,重新输入。,2020/1/29,45,(三)数据的剪切(Cut)、复制(Copy)与粘贴(Paste),练习:如例1.1数据文件中的date_in变量值全部输入完毕后,发现第1个观察单位的“09/29/2004”漏输,使后面的变量值都上移一行,怎么办?,2020/1/29,46,将变量date_in当前的第1个观察单位及以后的变量值标记;从菜单选择Edit Cut;将光标定位于第2个观察单位处,从菜单选择EditPaste;将“09/

18、29/2004”输入到第1个观察单位处。,2020/1/29,47,(四)恢复删除或修改前的数据,如对本次的修改与删除不满意,想恢复操作前的状态,可从菜单选择Edit Undo,也可单击“撤消”或“恢复”快捷图标。,2020/1/29,48,二、数据文件的整理,排序(Sort Cases) 练习:将例1.1中的数据按“性别”和“年龄”从小到大排序,观察到什么?,2020/1/29,49,方法:从菜单选择Data Sort Cases,打开Sort Cases对话框,将变量“性别”和“年龄”分别选入Sort by 栏,默认升序排列(Ascending),单击OK按钮。,2020/1/29,50,

19、(二)选择观察单位 (Select Cases),练习:将例1.1数据文件中“男性”,同时“年龄”在65岁以下的观察单位选择出来。观察到什么?,2020/1/29,51,方法:从菜单选择Data Select Cases,打开Select对话框,选择if condition is satisfied,单击 if 按钮,在条件栏中输入 sex = 1 & age 65 ,单击Continue按钮,单击OK按钮。,2020/1/29,52,条件符号的含义 = : not。数字和符号可从对话框中直接选择。如果从键盘选入,应处于英文输入状态,以减少出错的可能。,2020/1/29,53,单击右键“&”

20、,含义“And”,2020/1/29,54,2020/1/29,55,三、数据文件的转换,用赋值方法生成新变量(Compute) 对变量值重新划分(Recode) 复选题编码与SUBSTR函数的使用,2020/1/29,56,(一)用赋值方法生成新变量(Compute),练习2 根据例1.1数据文件中的“身高”和“体重”,计算体重指数,然后赋值给新变量“bmi” 。体重指数的计算公式如下(注意公式中身高的单位为m): 体重指数(BMI)体重(kg) / 身高(m)2,2020/1/29,57,(二)对变量值重新划分(Recode),练习 将图2-9数据文件中的体重指数bmi变量值重新编码:0:

21、24;1:24;并赋值给新变量“肥胖”。,2020/1/29,58,从菜单选择Transform RecodeInto Different Variables,打开Recode into Different Variables 对话框,将“bmi”选入Numeric Variable栏,在Output Variable栏输入新变量肥胖 ,单击Change 按钮,单击Old and New Values按钮。,2020/1/29,59,2020/1/29,60,(三)复选题编码与SUBSTR函数的使用(不要求),练习:图中的变量case和e代表10位癌症患者化疗后的不良反应。不良反应共有5种,分

22、别用字符1,2,3,4,5表示。如第1位患者无不良反应,用字符0表示;第2位患者同时有1,2,3项不良反应,用字符123表示,依此类推。字符变量e的变量值便于数据录入,但不便于统计分析,因此需要用SUBSTR函数将字符变量e分解为数值变量e1,e2,e3,e4,e5,分别代表5种不良反应,用数值0表示无,1表示有。,2020/1/29,61,数据文件与复选题编码,2020/1/29,62,Paste自动打开Syntax编辑窗口,2020/1/29,63,复制、粘贴、编辑 RunAll,2020/1/29,64,2020/1/29,65,四、数据文件的合并(不要求),(一)增加观察单位(Add

23、Cases) (二)增加变量(Add Variables),2020/1/29,66,(一)增加观察单位 (Add Cases),从外部数据文件中增加变量(variable)到当前数据文件中,称为横向合并。横向合并不仅要求两个需要合并的数据文件必须有一个共同的变量,如病人编号(变量名和数据类型都相同),称为关键变量,还要求两个文件中关键变量的部分变量值是相等的,如病人编号是相同的。,2020/1/29,67,练习:将数据文件a.sav和b.sav合并为c.sav。,a,b,c,2020/1/29,68,打开数据文件a.sav,作为工作文件(Working Data File )。 从菜单选择:

24、DataMerge files Add Cases。选定数据文件b.sav为外部文件,单击“打开” ,单击“OK” ,将合并后的新工作文件(New Working Data File)另存为数据文件c.sav。,2020/1/29,69,2020/1/29,70,(二)增加变量 (Add Variables),从外部数据文件中增加变量(variable)到当前数据文件中,称为横向合并。横向合并不仅要求两个需要合并的数据文件必须有一个共同的变量,如病人编号(变量名和数据类型都相同),称为关键变量,还要求两个文件中关键变量的部分变量值是相等的,如病人编号是相同的。,2020/1/29,71,练习:

25、将数据文件c.sav和d.sav合并为e.sav。,c,d,e,2020/1/29,72,分别对数据文件c.sav和d.sav按关键变量“病人编号”升序排列(DataSort Cases)。 打开数据文件c.sav,作为工作文件(Working Data File )。 从菜单选择:DataMerge files Add Variables。选定数据文件d.sav为外部文件, 单击“打开”;单击Match cases on key variables in sorted files(在已排序的数据文件中匹配关键变量值相等的观察单位),激活它下面的三个选项,本例选择Both files prov

26、ide cases,将“病人编号”选入Key Variables栏(图2.22);单击“OK” ,将合并后的新工作文件另存为数据文件e.sav。,2020/1/29,73,2020/1/29,74,实习三 Frequencies、Descriptives、Means和Case Summaries程序,Frequencies Descriptives Means Case Summaries 窗口转换 输出结果的保存及打印,2020/1/29,75,Frequencies、Descriptives、Means和Case Summaries这4个命令都可以计算均数、标准差、标准误等主要指标。 如果

27、只计算上述3个主要指标,选用Descriptives命令较为方便; 如果需计算中位数、百分位数和绘制频数分布图,应选用Frequencies命令; 如果需分组计算均数、中位数、几何均数、标准差、标准误等指标,应选用Means命令(必须有分组变量); 如果计算几何均数,选用Case Summaries命令较为方便。,2020/1/29,76,一 、Frequencies,(1)计算均数、标准差、标准误 (2)计算中位数、四分位数、P2.5 和P97.5和P95 (3)绘制频数分布图 (4)计算参考值范围,2020/1/29,77,从菜单选择AnalyzeDescriptive Statistic

28、s Frequencies,打开Frequencies对话框,将变量身高选入Variables栏。 单击Statistics按钮,打开Statistics对话框,选择:,2020/1/29,78,2020/1/29,79,单击Charts按钮,打开Charts对话框,选择: Histograms:直方图(对分类资料,可选用条图Bar charts和圆图Pie charts)。 With normal curve:加载正态曲线。本例未选。,2020/1/29,80,2020/1/29,81,图3.3 某农村地区1999年14岁女孩的身高频数分布图,2020/1/29,82,结果解释,均数为143

29、.2(cm)、标准差为6.43(cm)、标准误为0.56(cm); 中位数为142.8(cm);P25和P75分别为139.3(cm)、147.2(cm);P2.5和P97.5分别为129.7(cm)、157.8(cm);P95为154.5(cm); 频数分布图近似正态分布。 小结:该地14岁女孩的身高频数分布近似正态分布,身高均数为143.2(cm)、标准差为6.43(cm),95%的参考值范围为:(143.21.966.43,即130.6155.8)cm。,2020/1/29,83,二、Descriptive,计算身高的最小值、最大值、均数和标准差。 从菜单选择AnalyzeDescrip

30、tive Statistics Descriptives,打开Descriptives对话框,将变量身高选入Variables栏; 单击Options按钮,打开Options对话框(打钩的是默认项目) 单击Continue按钮返回,单击OK按钮。,2020/1/29,84,2020/1/29,85,结果解释,最小值和最大值分别为125.9和162.6厘米,均数和标准差分别为143.2和6.43厘米。,2020/1/29,86,三、频数表资料与Weight(加权),例:某种传染病的潜伏期(天)如下。求平均潜伏期M和潜伏期的第95百分位数P95,2020/1/29,87,用变量 f 进行加权。从菜

31、单选择:DataWeight Cases,打开Weight Cases对话框。单击OK按钮。加权后,虽然数据窗的数据表面上没有改变,但程序已经记住:有26个观察值为6,48个观察值为10,25个观察值为14,等。,2020/1/29,88,从菜单选择AnalyzeDescriptive Statistics Frequencies,打开Frequencies对话框,将变量x选入Variables栏。 单击Statistics按钮,打开Statistics对话框,选择:,2020/1/29,89,结果解释,该种传染病潜伏期的中位数为10.4天,95%的病人潜伏期在18.5天以下。,2020/1/

32、29,90,四、Means,求以下四组资料的均数和标准差。,2020/1/29,91,从菜单选择AnalyzeCompare MeansMeans,打开Means对话框。将x选入Dependent栏,g选入Independent;Options用默认选项即可;单击OK按钮,2020/1/29,92,2020/1/29,93,五、Case Summaries与几何均数,例:有8份血清的抗体效价如下。求平均抗体效价。 x为抗体效价的倒数(F8.0),2020/1/29,94,从菜单选择Analyze Reports Case Summaries,打开Summarize Cases对话框,将x选入V

33、ariables栏,单击Statistics按钮。 在Summarize Cases:Statistics对话框,将几何均数Geometric选入Cell Statistics栏,单击Continue按钮返回,单击OK 按钮。,2020/1/29,95,结果解释,血清的抗体平均效价为1:56.57,约 1:57 。,2020/1/29,96,六、窗口切换和输出结果的 保存及打印,窗口切换 输出结果的保存 将输出结果粘贴(Paste)到Word文件中,2020/1/29,97,(一)窗口切换,从窗口菜单Window可选择SPSS Data Editor(数据编辑)窗口或SPSS Viewer(结果输出)窗口,或选择Minimize All Windows(将全部窗口最小化,放到屏幕的最下端,以便进行其他操作,如Word)。 单击屏幕下端的SPSS数据文件名、结果文件名,可方便地进行窗口转换。,2020/1/29,98,(二)输出结果的保存,文件类型默认为:Viewer Files (*.spo),2020/1/29,99,(三)将输出结果粘贴(Paste)到Word文件中,选择要粘贴的结果; 从菜单选择:EditCopy objects (或Copy)。 切换窗口到Word文件,将光标移到要粘贴处,从菜单选择:编辑粘贴。观察Copy objects和Copy有何不同?,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 研究报告 > 商业贸易


经营许可证编号:宁ICP备18001539号-1