第二章:SPSS基本统计分析.docx

上传人:scccc 文档编号:13976141 上传时间:2022-01-28 格式:DOCX 页数:25 大小:687.60KB
返回 下载 相关 举报
第二章:SPSS基本统计分析.docx_第1页
第1页 / 共25页
第二章:SPSS基本统计分析.docx_第2页
第2页 / 共25页
第二章:SPSS基本统计分析.docx_第3页
第3页 / 共25页
第二章:SPSS基本统计分析.docx_第4页
第4页 / 共25页
第二章:SPSS基本统计分析.docx_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《第二章:SPSS基本统计分析.docx》由会员分享,可在线阅读,更多相关《第二章:SPSS基本统计分析.docx(25页珍藏版)》请在三一文库上搜索。

1、第二章:SPSS基本统计分析SPSS软件的基本统计计算和绘图功能主要通过Analyze菜单中的Descriptive Statistics以及Reports来完成的。另外,基本统计分析的报表是利用Analyze菜单中Tables制作的。为更清楚地讨论 SPSS基本统计分析,可引入实际的案例加以介绍。以世界 500强公 司的数据为例:我们想统计世界500强中,主营业务为电信的公司出现的频率怎么做?我们想计算500强公司营业收入的均值、差异程度,怎么做?本章学习内容:1.1 数据的基本统计描述量1.2 频数分析(Frequencies)1.3 描述统计(Descriptives)1.4 探索分析(

2、Explore)1.5 报告输出具体内容:1.1 数据的基本统计描述量表示集中趋势的统计量总和(Sum)所有数据的算术和均值(Mean)算术平均值众数(Mode)n个数据中出现次数最多的数中位数(Median)排在中间位置的数百分位数(Percentile)数据从小到大排序,处在 k%位置的数称为第k百分位数表示离散程度的统计量方差 V Variance)标准差(Std. Deviation)极差(Range)最大值与最小值之差四分位极差(Interquartile )第75百分位数与第25百分位数之差表示分布形状特征的统计量偏度(Skewness)接近0,对称分布;0,右偏态;0,左偏态。峰

3、度(Kurtosis)接近0,为正态分布;0,陡峭;0,平缓。1.2 频数分析(Frequencies1.2.1 主要作用可对数据按组进行归类整理,形成对某一变量不同水平的频数分布表和图形,以便于对数据的分布趋势作出初步判断。1.2.2 实例分析打开文件世界 500强公司,对世界500强公司数据进行频数分析:(1) 对世界500强公司主营业务进行频数分析;(2) 对世界500强公司的营业收入进行频数分析并画出直方图;(3) 对我国进入500强的公司进行频数分析。具体操作如下:题1.对世界500强公司主营业务进行频数分析:Analyze Descriptive Statistics Freque

4、ncies,打开 Frequencies对话框,如下图。国例4-1世界5OU强公司.后亚-SPSS Data Editorata Transform倒回倒嗖14 tic?;graphs Vtili ti es 也 indw MlpRetortsAnal yiDescriptivecs9:公司名称|中文名祢3TablesErequencie占Descriptives. B.1Wal-Mart2Exxon Ma3General4BP6Ford Mot6Enron7DaimlerC沃尔玛商宗事事妾事事垂美车油车克森汽石汽勒食用国徐然姆埃通英福安戴Covnp&re MleaztsGeneral Lin

5、er ModelMixed ModelsCorrelate &电歹虺9与ioa Loglinear ClassifyData REuutimExplorfi,.Crosstabs.-.Ratio.Ft eQuencie;;Chart Type-ss-srn-sr;irfc Kpns Bar chartsContinueCancelHelpchart:Hijtogfam5:jma!irChart Values* FrequenciesPercenhge$电器专卖1.2.218.6电信234.64.623.2电子102.02.025.2电子、机2,4.425.6电子、娱1.2.225.8电子电气3

6、.6.626.4T70AuuanbeLL证券经纪 怖政包奏 邮递包裹 银行烟孽,食 通讯设备 数据服务 石油设备轮胎橡胶 审竹科技产品 金融家用化学 计算机软 化妆品 航空航天 甘咫咨前 ,程建设 名样化投 多样化电力煤气 出版娱乐 餐饮服务 采矿、原 保险办公设备题2.对世界500强公司的营业收入进行频数分析并画出直方图 题目分析:由于营业收入属于数值型变量, 其中每一数值都不相同, 所以直接做频数分析没 有意义。应将其按数值大小分成不同区间, 然后作频数分析;而这一步应首先基于对数值进 行描述统计,找出最小值和最大值。具体步骤分为描述统计、分组(通过“重新编码”(Recode)、频数分析等

7、三步。描述统计:Analyze Descriptive Statistics Descriptives ,打开如下对话框。12Variable(s):勤百万美元盾业收入OK4P后融,一Descriptives:Optionsg 过eaMrs, *jv Sum 9Y:/ ConWueJI-D 博 pSKiQriq Std deviationVariance* RangeMinimumQ Mawinwjnnv S.E. meanCancelHelpDistributionQ Kurtosis Skev/ne$cDispJj Order* VariableAlphabeticAscending me

8、ans DescendingCancelHelp112D22.D105813.9101205.B99699.094311,993424.891176.685929255666.0B2999.179267.377358.9Options.2Descriptive StatisticsNMinimumMaximumSumMean白力美元Valid N (listw ise)50050010096.2219812.01E+00728019.919根据最小值和最大值,对原数据中营业收入进行重新分组:(0-29999.9) , (30000-59999.9) , (60000-89999.9) ,( 9

9、0000-119999.9) ,(120000-149999.9), (150000-179999.9) , ( 180000-209999.9) , ( 210000-)分组(通过重新编码(Recode): Transform Recode Into Different Variables (重新编码为新的变量)wia昌国ICoimpute -,丁 I die*RecodekInto Same Var i ables. B a10:|公司名祢|中Vi Eual Bandar . rCount.RwK Cases. r.Automatic Recode-.Date/Time.,Create T

10、ime Series. t aReplace Missing Values. r.巴吧1”!胤宜业收四,“、1Wal-Mart沃219812.023Exxon MoGeneral191卸.口17726004BPr 174218 05Ford Mot162412.06EnronDaimlerCRandom Number Generators. 38718.0136897 37Run. Fending Trans forniE .- _ . _ . _ _一 一.= . _ . ;_s_8Royal Du1 135211 0Analyze Graphs Utili ties Window Help

11、TransformFile Edi t Vie* Data国例4T世界岳口口强公司耳2卡SPSS Dat a Iidit or此时我们会看到数据编辑窗口中变量栏多了一个:收入分组。频数分析:现在可以对新的变量:收入分组进行频数分析了(Charts选项中选择histograms,并勾选正态曲线)。步骤同一。结果如下两图。收入分组FrequencyPercentValid PercentCumulative PercentValid 1.0036272.472.472.42.0010120.220.292.63.00204.04.096.64.0071.41.498.05.0051.01.099.

12、06.003.6.699.67.001.2.299.88.001.2.2100.0Total500100.0100.0Histogra m收入分组Mean = 1.42Std. De v. = 0.89061N = 500vcneuaer题3:对我国进入500强的公司进行频数分析。(1) 首先挑选出中国的公司,可以通过筛选观测量来完成。具体操作:Data Select Cases,点选If对话框,然后设定“总部所在”为“中国” (总部 所在=“中国”)。将未被选中的数据进行删除,将选中的数据以“中国”为名另存到桌面上。 见下图。Select Cas?s: If含百万美元唐业收入概收入分蛆aSe

13、lectj All uses fRenditionistaljRandom sample Sample.Based on time oi Range. I Usfr filter variable反至奇名称蚁中文名称总部所在凰主营业务船百万美元湾业收入 方收入分姐总部所在=中即jJ jdjd JdUUl-1 1 *1 5 62J -LI212J/上LU -JJl _Sj_Qj 口目由Functions.ABS(tiumeKpr)AN Y(test .value, value,.) ARSlN(numeNpt) ARTAN(mumexpr) CDFNORMfsvalue) CDFBERNOULL

14、I(cm)公司名称|中文名称|总部所在|主营业务|营业收入State PoChina Na Sinopec China Te国国国国中中中中力面行菖电石石电家国13国国中中中力源电能48374.541499.1金Ind 呵ri中国工商6Bank Of中国银行7ghina Mo中国移动8Sinochem中国化工_9:Chtna Co ,中国建设 W COFCO 中粮集国国国国国国国中中中中中中电信银行11 Agricult 中国农业 中国Ok之后将文件另存到桌面。(2) 对中国进入500强公司进行频数分析。打开中国.sav文件,Analyze Descriptive Statistics在cha

15、rts选项中选择Bar Charts,输出结果如下。电信化学贸易 银一 贸易银行40388.022272.219827.817869.3174D5.916164 413082.813003.710656.6Frequencies,打开 Frequencies 对话框,NValid11Missing0Statistics主营业务主营业务FrequencyPercentValid P ercentCumulative PercentValid电力19.19.19.1电信218.218.227.3化学贸易19.19.136.4炼油19.19.145.5贸易19.19.154.5能源19.19.163

16、.6银行436.436.4100.0Total11100.0100.0主营业务电力 电信化学贸易炼油 贸易主营业务vcneuaerF1.3 描述统计(Descriptives)1.3.1 主要作用对变量进行描述性统计分析,计算均值、标准差、全距和均值标准误差等。1.3.2 实例分析刚才已经使用过。可对 500强进行描述统计,操作后输出结果如下:Descriptive StatisticsNRangeMinimumMaximumMeanStd.VarianceSkewnessKurtosisStatisticStatisticStatisticStatisticStatisticStd. Err

17、orDeviation1StatisticStatisticStd.ErrorStatisticStd. Error百万美元Valid N (listwise)500500209715.810096.2219812.028019.9191152.301625766.257E+0083.527.10916.472.218对结果的解释可参照教科书。习题:对“frequencies-舒张压.sav”文件中的数据进彳T频数分析(以 10分组);练习21.4 探索分析(Explore)1.4.1 主要功能:此过程可检查数据是否有错误、考察样本分布特征及对样本分布规律作初步考察。剔除奇异值和错误数据。探测

18、数据的错误来源人为的数据差错仪器测量的误差“与 “1、”“时 “0”输入数据时的手误,如:小写的 数据探测的重要性由于数据的采集和输入可能出现的差错,在分析之前要检查数据的真实性。1.4.2实例分析(1)对日本进入500强的企业进行探索分析,并用茎叶图和箱线图显示。首先筛选出日本公司,步骤同上。Analyze-Descriptive Statistics-Explore 顺序单击,打开 Explore 主对话框。如图:点击ok后,会出现输出窗口,如下:Cas e Proces s ing Sum mary总部所在=日本”(FI LTER)CasesVa idMissingTotalNPerce

19、ntNPercentNPercent百万美元Selected87100.0%0.0%87100.0%Des criptives总部所在=日StatisticStd. Error百万美元SelecteLTER)Mean27871.1022598.804195% ConfidenceLow er Bound22704.851Interval for MeanUpper Bound33037.3545% Trimmed Mean24610.888Median17826.100Variance6E+008Std. Deviation24240.03Minimum10096.2Maximum120814

20、.4Range110718.2Interquartile Range17289.5Skew ness2.058.258Kurtosis3.879.511Percentiles总部所在=日Percentiles本“(FILTER)5102550759095Weighted百万美元 SelectedAverage(Definition 1)0397.780 10627.520 12939.100 17826.100 3()228.600 63848.000 92525.52Tukeys Hinges百万 美元 Selected13070.850 17826.100 29)705.900His to

21、 gra m27871.102v. = 24240.0314百万美元VcneuaelF百万美元 Stem-and-Leaf Plot for filter_$= SelectedFrequency Stem & Leaf33.001.00000000000001111222223333333344415.001.55666666677899911.002.000011223336.002.5556692.003.03.003.7.004.00113331.004.912.00 Extremes (=54997)Stem width: 10000.0Each leaf:1 case(s)茎叶图从

22、左到右分为三部分:频数、茎和叶、茎是整数部分,叶是小数部分,Stem width表示茎宽。每行的茎和叶组成的数字再乘以茎宽,即得到实际数据的近似值,实际数据中与该近似值靠近的值的个数即为频数表示的个数。例如:从茎叶图中可以看出,25000cases30000的数据一共6个,分别大致为 25000、25000、25000、26000、26000、29000 (根据所在位数的数字,而非四舍五入)。125000.0-Toyota M 青极端值用*表示,是寸窕观测量与矩形顶边或底边的距离超过四分Milsu匕国WOOOO 0-位极差的3倍。*Nippon T *有 75000.0-万美元 50000.0

23、奇异值用。表示,是才暗观测量与 矩形的顶边戢底边的距离为四分 位极蹙。3】的i后甘倍-SumitomoY.一上截止横线时观测量本体(*嬲极端 值和奇异值外的观测量)的最大值.+Hitachi o SMatsushi矩爬上边框为U,下边框为25000.0-下截止隔线时观测量本体 *极端 值和奇异值外的驯冽量)的最小值.0.0-Selected总部所在二|本(FILTER)(2)按主营业务绘制日本500强公司的箱线图首先用Select Case能出500强中的所有银行业(If=银行)。然后用Graphs Boxplot ,打开箱线图对话框,如图:125000.0100000.0百万美元75000.

24、050000.025000.00.0习题:421/17Toyota MI I N I I U办保玻出电电公险璃版力对“explore-合金温度测试 线图,找出其中的极端值。,.sav电电电工工工广航化计计胶信子子子程程业告空学算算卷金金炼零轮贸汽汽汽 属属油售胎易车车车、 建建农机娱设筑业公 机机司、主营业务数据文件进行探索分析,并利用制橡、零品胶摩件铁烟银饮邮邮 路草行料递政 运输Boxplot绘制新型合金的箱1.5报告输出作用:对数据进行整理汇总,并作统计分析(仅举例均值、标准差、最大值及最小值),以便于阅读和分析。1.5.1 样品汇总报告(Case Summaries)打开文件“房屋地段

25、与销售情况.sav”,具体操作如下:Analyze ReportsCase Summaries,即会出现如下对话框。随后可见输出结果(对所需图表右击来选择输出形式:图-以图像形式;表-可以两种形式,图像和表格):Cas e Proce ss ing Summ aryCasesIncludedExcludedTotalNPercentNPercentNPercent标价*地段21100.0%0.0%21100.0%出售价格*地段21100.0%0.0%21100.0%Case Sum maries标价出售价格地段 城中133003500心23600350033500365042800280053

26、0503200TotalMean3250.003330.00Std. Deviation327.872338.378Minimum28002800Maximum36003650近郊 122502300区217801650318501780418401700518501900617801680TotalMean1891.671835.00Std. Deviation178.596244.929MinimumMaximum1780165022502300卫星124002350城219501950319001950420502000520202100TotalMean2064.002070.00St

27、d. Deviation196.799168.077Minimum19001950Maximum24002350远郊 117601800区218501780318801750416701650516801650TotalMean1768.001726.00Std. Deviation95.76071.624Minimum16701650Maximum18801800Total Mean2226.672220.95Std. Deviation627.482680.955Minimum16701650Maximum360036501.5.2 行形式报告(Report Summaries in Ro

28、ws )统计量以行的形式列出。Analyze Reports Report Summaries in Rows ,即会出现如下对话框。Report: Final Siruary LinesData Columns标价pricej 金出售价格saleDnsplay cases, Drear, l自展地段 Idistrictj -AscSort Sequence* &cendingDescendingData are already sorted15则口回日iu/*/ Mean oJ values 审 Minimum ?alue J Maximum value* Standaid deviafio

29、nI- kurtfisisr VarianceSkawrlessContinueCancelHelp:- Numbei of casesi - Percenge atwve Percenljge bel旧房屋 Page 1地段标价出售价格城中心Mean32503330Minimum28002800Maximum36003650StdDev328338近郊区Mean18921835Minimum17801650Maximum22502300StdDev179245卫星城Mean20642070Minimum19001950Maximum24002350StdDev197168远郊区Mean176

30、81726Minimum16701650Maximum18801800StdDev9672Grand TotalMean22272221Minimum16701650Maximum36003650StdDev6276811.5.3 列形式报告(Report Summaries in Columns ) 操作过程和行形式报告相似Page 1标价 标价 标价 出售价格出售价格出售价格地段 Mean Minimum Maximum Mean Minimum Maximum城中心325028003600333028003650近郊区189217802250183516502300卫星城206419002400207019502350远郊区176816701880172616501800习题:根据“各地区普通高等学校(机构)教职工情况(2005年).xls”(1)(3)建立“各地区普逋高等学校(机构)教职工情况”的spss数据文件;对其中“止高级”人数进行描述统计;用“列形式报告”汇总文件中五种职称类型人数的均值、最大值和最小值。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1