经典实用的spss课件 三、统计描述.ppt

上传人:啊飒飒 文档编号:11934858 上传时间:2021-11-05 格式:PPT 页数:42 大小:850.50KB
返回 下载 相关 举报
经典实用的spss课件 三、统计描述.ppt_第1页
第1页 / 共42页
经典实用的spss课件 三、统计描述.ppt_第2页
第2页 / 共42页
经典实用的spss课件 三、统计描述.ppt_第3页
第3页 / 共42页
经典实用的spss课件 三、统计描述.ppt_第4页
第4页 / 共42页
经典实用的spss课件 三、统计描述.ppt_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《经典实用的spss课件 三、统计描述.ppt》由会员分享,可在线阅读,更多相关《经典实用的spss课件 三、统计描述.ppt(42页珍藏版)》请在三一文库上搜索。

1、,统计描述,在数据收集、整理完毕后,进行深入统计分析之前,首要的工作就是去了解这个数据的整体情况,随后考虑作深入的推断。用少量数字(描述指标)概括大量原始数字,对数据进行描述的统计方法即为描述性统计分析。,统计描述,连续变量的统计描述 分类变量的统计描述,集中趋势的描述指标,算术均数:适合单峰和基本对称的分布 中位数:适用于任意分布类型 截尾均数:数据中有极端值,用截尾均数更好 几何均数:适用于原始数据分布不对称,但经过对数转换 后呈对称分布的资料 众数(Mode):样本数据中出现频次最大的那个数字 调和均数(H):较少使用,观察值x倒数之均数的倒数, 常用于完成的工作量相等而所用时间不 同,

2、求平均速度的情况,全距 大体了解数据的分布范围,用于预备性检查 方差和标准差 适用于正态分布 百分位数 如中位数(P50)、四分位数(P25、P50、P75) 四分位间距 即P75-P25,适用于任意分布类型,不受极端值影响 变异系数(CV) S/ ,适用于测量尺度相差太大或数据量纲不同时, 比较两组数据离散程度的大小,离散趋势的描述指标,SPSS的许多模块均可完成统计描述的任务,除各种用于统计推断的过程会附带进行相关的统计描述外,SPSS还专门提供了几个用于连续变量统计描述的过程,均集中于AnalyzeDescriptive Statistics子菜单中。,Frequencies 过程,De

3、scriptives 过程,Explore 过程,Ratio 过程,Frequencies:产生原始数据的频数表,并能计算各种百分数,并可绘制频数图,如连续型变量的直方图,或分类变量的饼图或条图。下面以demo.sav为例,对人群的年龄数据(age)进行描述。,Frequencies 过程,若无变量标签,则列表框中只显示变量名,对话框中,从左边变量列表中选择要分析的变量, 放入右边的Variables(变量)列表中,至少一个变量选入后,OK按钮才可使用,Frequencies 过程,变量标签,变量名,鼠标右键单击变量,可以获得更多变量信息,选择下拉按钮,显示所有定义的值标签,Frequenci

4、es 过程,:表示该变量为数值型变量,: 表示该变量为字符型变量,且右下角的表示短字符, 即变量长度=8位,Frequencies 过程,Statistics:设定要分析的统计量,分位数值,集中趋势,离散趋势,分布指标,若数据为组中值,将其选中,本例选择四分位数和5、95分位数,Frequencies 过程,本例选中绘制直方图,图表类型:箱式图、饼图、直方图等,Frequencies 过程,Charts:设定要绘制的统计图,Format:在SPSS对话框中,用于设定结果文件中的 数据格式,通常默认即可。,数据排序方式,多变量分析时的显示方式,设定组别超过n组时不显示表格,Frequencies

5、 过程,通过大纲视图可以快速定位各项结果 例如:点击大纲视图上的Histogram,则可快速定位至 age的频数直方图,Frequencies 过程,分析结果,(1) 统计量,人群年龄无缺失值,四分位数为33岁、41岁、51岁,即人群中有1/4小于33岁,1/2小于41岁,1/4大于51岁。另外,90的人在2464岁之间。,Frequencies 过程,Frequencies 过程,分析结果,(2) 频数表,Frequency:频数 Percent:百分比 当前频数/总数(包括缺失值) Valid Percent:有效百分比 当前频数/有效总数(不包括缺失值) Cumulative Perce

6、nt:累积百分比 累积频数/有效总数(不包括缺失值),Frequencies 过程,分析结果,(3)频数直方图,Descriptive:一般性统计描述,相对于Frequencies,它不能绘制统计图,所能计算的统计量也较少,适用于对服从正态分布的连续型变量进行描绘。同样以demo.sav为例,对人群的年龄数据(age)进行描述。,Descriptives 过程,单击中间的箭头,可以实现变量从一张表移入另一张表, 现将变量age移入右边variable列表中,Descriptives 过程,Options:设定要分析的统计量及数据的显示顺序,本例选择: 均数、标准差、最大值、最小值、峰度系数、偏

7、度系数等,Descriptives 过程,人群年龄的最小值为18岁,最大值为77岁,均数42.06岁,标准差12.29岁,偏度系数0.299,峰度系数-0.602,基本近似正态。,Descriptives 过程,分析结果,描述性统计量,Explore:对连续型资料分布不清楚时的探索性分析,可以分类别进行描述(Frequencies和Descriptives不行),计算多种描述统计量,给出各种统计图,进行简单参数估计。以demo.sav为例,对男女性(gender)的年龄(age)分别进行描述。,Explore 过程,要进行分析的应变量:age,分类变量:gender,Explore 过程,点估

8、计中的稳健估计:M估计,极端值,百分位数,一般描述,默认情况下,选择的是Descriptives,本例选择默认,Explore 过程,箱式图,用于正态性检验的QQ图,茎叶图,直方图,Levenes方差齐性检验选项,Explore 过程,缺失值的设置,一般默认即可,Explore 过程,本例无缺失值,有效人数女性3179人,男性3221人,Explore 过程,分析结果,(1) 缺失值报告,现仅对女性的分析结果依次解释,查看详情,Explore 过程,分析结果,(2) 统计量,集中趋势指标、离散趋势指标 分布特征指标、参数估计,Explore 过程,分析结果,集中趋势指标:3179名女性的平均年

9、龄为41.74岁(Mean),去掉两侧各5的极端值后,截尾均数为41.45岁(5 Trimmed Mean),中位数41.00岁(Median),本例上述三指标值基本相同,可推测数据应当是对称分布的。,Explore 过程,离散趋势指标:年龄的方差为142.988岁2(Variance),其平方根即标准差为11.958岁(Std.Deviation)。全部女性中最小的18岁(Minimum),最大的76岁(Maximum)。两者之差即全距58岁(Range),中间一半女性的年龄差即四分位数间距17岁(Interquartile Range)。,分布特征指标:表明数据偏离正态分布程度的偏度系数(

10、Skewness)为0.327,峰度系数(Kurtosis)为-0.534。偏度系数大于0为正偏态,峰度系数小于0表明峰比正态低,本例偏度和峰度系数均接近0,因此认为近似正态分布。,参数估计:均数(Mean)的标准误(Std.Error)为0.212岁,相应的总体均数95可信区间(95Confidence Interval for Mean)为41.3242.15岁,表明有95%的可能性认为该区间包含了总体均数。,Explore 过程,Explore 过程,分析结果,(3) 茎叶图,Explore 过程,分析结果,(4) 箱式图,最小值:18岁,最大值:76岁,四分位间距: 17岁,Ratio

11、:功能较特殊,用于对两个连续性变量计算相对比指标,它可以计算一系列非常专业的相对比描述指标,相对而言使用面较窄,在此不详述。,Ratio 过程,SPSS的许多分析过程均可完成统计描述的任务,还专门提供了用于分类变量统计描述的过程,均集中于AnalyzeDescriptive Statistics子菜单中。,Frequencies 过程,Crosstabs 过程,Frequencies:主要针对分类输出频数表,从而得到频数、百分数、累计百分比,给出原始频数表,众数,条图,饼图等。以demo.sav为例,分别对人群的教育水平(ed)、职业满意度(jobsat)进行描述。,Frequencies 过

12、程,6400人的教育水平和职业满意度的数据都是完整的, 无缺失值。,Frequencies 过程,分析结果,(1) 缺失值报告,Frequencies 过程,分析结果,(2) 频数表,Crosstabs:用于输出交叉列联表,以demo.sav为例,描述人群的婚姻情况marital(0、1)、退休状况retire( 0、1)的交叉频数分布,Crosstabs 过程,用于分类变量统计推断时的参数设定,此例暂不使用,Crosstabs 过程,行变量:ed,列变量:jubocat,Cells:在SPSS对话框中,对于单元格要显示的参数进行设定,合计,百分位数,残差,非整权重设置,Crosstabs 过程,6400人的婚姻状况和退休状况的数据都是完整的, 无缺失值。,Crosstabs 过程,分析结果,(1) 缺失值报告,婚姻状况(行)和退休状况(列)的交叉表,Crosstabs 过程,分析结果,(2) 交叉表,行百分比,列百分比,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 科普知识


经营许可证编号:宁ICP备18001539号-1