我国城镇居民人均消费的SPSS统计分析.docx

上传人:苏美尔 文档编号:11742776 上传时间:2021-09-02 格式:DOCX 页数:22 大小:114.86KB
返回 下载 相关 举报
我国城镇居民人均消费的SPSS统计分析.docx_第1页
第1页 / 共22页
我国城镇居民人均消费的SPSS统计分析.docx_第2页
第2页 / 共22页
我国城镇居民人均消费的SPSS统计分析.docx_第3页
第3页 / 共22页
我国城镇居民人均消费的SPSS统计分析.docx_第4页
第4页 / 共22页
我国城镇居民人均消费的SPSS统计分析.docx_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《我国城镇居民人均消费的SPSS统计分析.docx》由会员分享,可在线阅读,更多相关《我国城镇居民人均消费的SPSS统计分析.docx(22页珍藏版)》请在三一文库上搜索。

1、2013年我国城镇居民人均消费的SPSS统计分析一、搜集到的2013年我国31个城市城镇居民人均消费水平的数据加也 WIL3BJtD:*BL山 川出出 晦凶 KlCl里再包学旦I rJ 时期-3 三0 Lr用品竟n蜀国图也畤|Fio町见11食盘的11gnCierrihK-QmWEhoi hr卜 k1ffiftthcftlg的网演rffleiiimDthm,量1溺1BC22 40.25 1D5311 9fl1小?叩1745 101715 W1110 3DJT38 W229CQC&H9 442dtS2E274 M4函如ti?n n27 901441SOSI42GJQ山内V涮/231W 如篝晤TO帏

2、却转抬n齿的削ITT* W2朔d1i网景七如Xg W2M roC117W加的1K1 10中箝川W。1711Jill M聚】“T3T加5HM4为叩巾imwIW.Sfl1M3,V0器时制220.61眼N19百引1皿M22374 知4G5Q; M19l2tt驰fl制T3 10”1751995 Ml匿r翼9,石工H4TE1.ni19637.SD硼丁州1BD3-5D1I543J3DEG加T334.1Dle&ijg13K.4A褥G.赏IDMS眦亚 1 4D9022 M2D12 3D2W9O3D*找加4122/111537.B311;1B却m浊翼克.加71ML1。割”口1&HJ0E融T1HQ一篇JM32.Q

3、Cv血器25733喃.聊。割那鸦州加mM)0IW 4.04$M刎?lXLV15手也1UA 乐 2fl231 UJS37D .1443 0mM2I11J01904.114NJN20098 n渊博40,祗R朴仲和”国映网英HSO2444“第9界15;E1395D 到2际,口踏1 1515“ 5DUM$01Qffld3fi6T241S12B01B71 2f16山寺17112.2吟10542&W22仃吨17M HO1维而iioe w西 74 9019M制党5时一:14E22C0222S8 3D4915 KI1917 DD行好蜀iai wg知17M301911.2A湖即!1549.54Z2TO10525

4、9 2tIBM 90皿*1B593)mi郊im 10,22 MW WMA15SB7 懂5U14 仙5SUM3布15MiMB nFCT8 10MMK)割魄1 M皿勃由:广等融科3 N3 mo 10851邪12物?wno用9 .1122 T O“城加32s稣3_jFB15411 U普妫M精41刘,$ 必领1H6S4mx抬&M 4M542?,如SfllJ 刊337 eauh wIE 口种TJi jg川修四49B 11,的卸用1E到国二、数据来源:国家统计局 对数据的基本分析在数据文件建立好后,通常还需要对待分析的数据进行必要的预加工处理,这是数据分析过程中不可缺少的一个关键环节.(一)、对数据按人均

5、消费(expend)进行降序排列操作步骤:(1):选择“数据” 一 “排序个案”菜单项(2):将“人均消费(expend) ”选入“排序依据”列表框,选中“降序”(3):点击“确认”按钮,生成如下降序排列的数据集4.3牖日皿E5 mgl| IBM W, 1MDAct HWtV_11_Mbhl11-JifrtE MH Mitill ”电。”(MD 为(他 HrMf fib,先 邛处停此 ST速 “刖上上鸟四-r圄品阖tt囹幽HMJ#1%io -町见;的工fi的巾IaepaniincnnHiIwdHMigEHngihavsiMdintealIraniptMtiFuiQhf4Mns132B-l5M4

6、3351 40%22 90割望第.28471)1加5到1350130473(40tag it1fe37 SD22537fl.Wi3JZ1 OQ国I7U工。ZTUffl力瓯g将刑Hirtrea4.1-K.W7364 9014D1 l3f曲 LD.MJJ3EIQ DO旺m1&M 51HER. 101&39 101122 704&44-2AJ222M3 001iWJ:式之士却3脚1 an 2D西vm如M4 M加第但”SM7.1HS天21711M然*010ISM K如整地12DSU府骗初刘律的的“WMBil20JT1 M贷53BM7071 ID2t13OO1M4 30GW1122413135 00mo

7、wrMI怵?陋丁 m3M1&40r1四toW w.2H11 山1416 M,加制321V SO74JS4I鬻,制阳*吉192J39 14菖1妹7fl6117 J7T71941 10W3 4dMill Ml“3加9辽亍1H硒m2WTB30羽H如Z1M7Q1身胸10IWSQ1343(10居距加225sM站工E10百1。咤5节站工I flO119D1M2D01745.10WG.-H1119 即切瑞9022W DO眄9斗11ftim32521 6 10rai5 Ifi2JJ3 的imw1/弓加IHSLSQIgTtJO1722 711沏河12山聚2般弘M5SK50tm 1?*5 Wlai.n11DMQM

8、Mm1TOW聃5强UlW87t赫西M忖HXX*例找ITICI 就Mil1 10次e ri刘14阪|帕普27西丁和mu m1T?7 W1371 Wi*m9ID19C0川形股师时15Ttr25葫用和厘g?Q1MI7 50便3 3四a朋g制割h即w ti川。和15B+159S2.M组M旬4Eaip1前1魏1皿四MH的1BKL1Q2217 001锅E皿.i7加15M7.1*23414 00林拈西西1523.50MMID用加却谏BQ2060 建537.501ftstt1579 M也如匐却1M1 ttUSB.Xi1059 2fl|的3知1T45 101切曾/1弱出事需转3 MH9BLX为旧理1TO-60i

9、sneo*30*1M3021的事ro刚M加rs13 州 Ml13ag川绝IJ却1。14 $0i山弘1硼MHI *j汕州制* N琳找斛宁及茹泌W2113? 70WPQ1TJT301OQ1WH需翱uw n胸ii硼M打. rJP_ 耳再融却严门则皿必1LU曾T*K尼图黛LU,1制旧天晚和;|叫 一一 DJaiBll FTM1 Mrawg 由数据的降序排列可以看出,全国只有上海、北京、广东等九个城市的城镇人均 消费在全国城镇人均消费水平以上.(二)、作出人均收入和人均消费的直方图操作步骤:(1):选择“图形”,打开“图表构建程序”菜单项(2):从“库”中选择“直方图”将其拉入“图表预览使用数据实例”(

10、3):将变量“地区”设置为x轴,将“人均收入”和“人均消费”设置为y轴(4):点击“确认”按钮,即生成如下直方图通过一个复合条形图,可以很明确的发现我国城镇居民生活水平存在很大的地区 差异,地区发展很不平衡,从图中的生活消费支出和人均收入来看, 北京,上海,浙江这些省市城镇居民消费水平最高, 人均收入也是最高的,各省市的城镇居民消费水平差异较大,大多数省份城镇居民人均消费集中在15000元左右.(三)、对数据按照人均消费作出直方图,以统计我国农村人均消费的水平1、首先对数据分组,分组数目的确定.按照Sturges提出的经验公式来确定组数 K,K=1+,计算得组数为6.lg22、确定组距组距=(

11、最大值-最小值)/组数=()/6=,可近似取值为元.操作步骤:(1):选择“转换” 一 “可视离散化”菜单项,将“人均消费”选 入”要离散的变量”列表框中,单击“继续”按钮进入主对话框 .(2):单击“生成分割点”按钮,设定分割点数量为 6,宽度为,可 见系统会自动会填充第一个分割点的位置为,单击“应用”返回到主对话框 .(3):此时可以看到下部数值标签网格里的“值”列已被自动填充, 单击“生成标签”按钮,是标签列也得到自动填充.(4):将离散的变量名设定为 expendNew.(5):单击“确定”按钮.3、频数分析操作步骤:(1):选择“分析” 一 “描述统计” 一 “频率”,打开频率对话框

12、(2):选定expendNeW,点击“图表”,选择“条形图”点击继(3):点击“确认”,生成如下三张表Statistics人均消费(已离散化)NValid32Missing0MeanMedianStd. DeviationMinimum1Maximum7Percentiles255075人均消费(已离散化)FrequencyPercentValidPercentCumulative PercentValid=1-10-13-3-3-1+1Total3212.5-10.0-=1223190 12231S1 -15231,91 -1B231-91 -21231.91 -24231.91 -2723

13、1,91 +1S231 9013231 9021231 9024231.9027231 加人均消费(已渤散fD- 5.Aoumnb事u_o.cr人均消济(已离散化)由上图的频数分析可以看出,我国 2013年城镇居民人均消费支出集中在第二组 和第三组,大约占到百分之七十.由于在表格中不存在缺失值,因此频数分布表 中的百分比和有效百分比相同.从此次分析中可以看出,我国城镇家庭居民人均 消费的总体水平比较集中,大约在12000元-18000元之间,还有少数省市的消费水平处在中等阶段,而有上海、北京、浙江等一些经济较发达的地区的城镇 家庭居民人均消费达到了 21000元以上.三、对数据的回归分析(一)

14、、作出人均收入与消费支出散点图,以观察他们的线性关系如何操作步骤:(1):选择“图形”,打开“图表构建程序”菜单项(2):从“库”中选择“散点图”将其拖入“图表预览使用数据实例”(3):将“人均U入”选定为x轴,将“人均消费”选定为y轴人均消费1000DJOD-30000.0025000.00-20000 00-1 5000 00-15D0D,0D 200DOJOO 25000.0030000.0035DQ0.004D00Q 0045000.00人均收入(4):点击“确认”生成如下散点图由散点图可以看出,人均消费Y和人均收入X大概呈一元线性关系,因此可以建立一元线性模型进行回归分析.(二)假设

15、回归模型为Y=a+bX,其中,Y表示城镇人均消费支出,为被解释变量,X表示人均收入,为解释变量,b为回归系数.操作步骤:(1)选择“分析” 一 “回归” 一 “线性”菜单项,打开“线性回归” 对话框.(2)将“人均消费”选入“因变量”列表框,将“人均收入”选入“自 变量”列表框.(3)单击“确定”按钮.得到如下(1)、(2)、(3)、(4)四张表格,依次分析如下:表(1):移入/移出的变量Variables Entered/Removed bModelVariablesEnteredVariablesRemovedMethod1人均收入a.Entera. All requested varia

16、bles entered.b. Dependent Variable:人均消费从上表可以看出,放入模型的变量只有一个即“人均收入”,选择变量的方法为强行进入法,也就是说将所有的自变量都放入模型中, 模型的因变量为“人均消费”.表(2):模型汇总Model SummaryModelRR SquareAdjustedRSquareStd. Error ofthe Estimate1a.960.922.920a. Predictors: (Constant),人均收入上表是对模型的简单汇总,其实就是对回归方程拟合情况的描述,通过这张表可以知道相关系数R二,决定系数R2=,调整决定系数R2 =,和回归

17、系数的标准误=.由于决定系数接近于1,说明模型的拟合程度较好表(3):方差分析表anovAModelSum of SquaresdfMean SquareFSig.1Regression1.000 aResidual.47430Total31a. Predictors: (Constant),人均收入b. Dependent Variable:人均消费F=, P=,所以不能拒绝原假设,可以认为人均消费水 平在18000元.同时,可知全国城镇居民2013年人均消费在95%的置信水平下 的置信区间为:(,).五、非参数检验一一多配比样本分参数检验数据中我国城镇家庭居民人均消费包括食品、衣着、居住、

18、家庭设备、交通及通 讯、文教娱乐、医疗保健、和其他8个指标,为了比较清楚的了解这8项指标对 我国城镇居民人均消费总体的影响,以及其大概的消费动向,可以利用多配比样 本的非参数检验Friedman检验对各个指标进行检验.(一):操作步骤:(1)选择“分析” 一 “非参数检验” 一 “旧对话框” 一 “ k个相关样本”菜单 项,打开如下对话框:(2):单击“确定”按钮,得到如下两张表格:表(1):RanksMean Rank食物消费衣物消费居住消费家居设备交通通讯医疗保健文教娱乐RanksMean Rank食物消费衣物消费居住消费家居设备交通通讯医疗保健文教娱乐其它表(2):Test Statis

19、ticsaN32Chi-Squaredf7Asymp. Sig.000a. Friedman Test(二)、结果分析检验结果中的p值小于给定水平,故拒绝原假设,认为八个指标对我国城镇居民 人均消费的影响是有显著差异的.由表(1)知食物消费对人均消费的影响最大, 其次是交通通讯和衣物消费,而影响最小的是其它 .六、因子分析在研究我国城镇居民的消费情况时收集了食物、 衣物、居住等八个影响居民消费 情况的因素,以期对问题能够有比较全面、完整的把握和认识 .由于数据过多, 在实际建模时,这些变量未必能真正发挥预期的作用, 会给统计分析带来许多问 题,可以表现在:计算量的问题和变量间的相关性问题 .为

20、了解决这些问题,最 简单和最直接的解决方案是削减变量个数,但这又必然会导致信息丢失和信息不 完整等问题的产生.为此,人们希望探索一种更有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失.因子分析正是解决这种问题的方法.(一)操作步骤(1)、选择菜单“分析” 一 “降维” 一 “因子分析”,出现因子分析对话框;(2)、把参与因子分析的样本选到变量对话框中,如下图:(3)单击“确定”按钮,得到如下11张图:图(1)原有变量的相关系数矩阵:Correlation Matrix食物消费衣物消费居住消费家居设备医疗保健交通通讯文教娱乐其它Correlation食物消费.2

21、88.656.744.295.787.782.732衣物消费.288.337.517.694.368.374.634居住消费.656.337.676.505.849.750.771家居设备.744.517.676.441.830.853.767医疗保健.295.694.505.441.479.414.600交通通讯.787.368.849.830.479.860.782文教娱乐.782.374.750.853.414.860.831其它.732.634.771.767.600.782.831从上图可以看到,大部分的相关系数都较高,各变量呈较强的线性关系,能够从 中提取公共因子,适合进行因子分析

22、.图(2)巴特利特球度检验和KMO佥验KMO and Bartletts TestKaiser-Meyer-Olkin Measure of Sampling Adequacy.BartlettsTestof Approx. Chi-Square.833SphericitydfSig.28.000由上图知,巴特利特球度检验统计量的观测值为,相应的概率 p为0.如果给出 的显著性水平为,由于概率p小于显著性水平,应拒绝零假设,认为相关系数矩 阵与单位阵有显著地差异.同时,KMOS为,根据Kaiser给出了 KMCE量标准可 知原有变量适合进行因子分析.图(3)因子分析的初始解Communalit

23、iesInitialExtraction食物消费.798衣物消费.862居住消费.750家居设备.812医疗保健.821交通通讯.897文教娱乐.885其它.872ExtractionMethod:PrincipalComponent Analysis.由上图第二列可知,所有变量的共同度均较高,各个变量的信息丢失较少.因此,本次因子提取的总体效果较理想.图(4)因子解释原有变量总方差的情况:Total Variance ExplainedInitial EigenvaluesExtraction Sums of SquaredLoadingsRotation Sums of SquaredLo

24、adingsCompone ntTotal%ofVarianceCumulative %Total%ofVarianceCumulative %Total%ofVarianceCumulative %12345678.473.258.237.178.091.068.853Extraction Method: Principal Component Analysis.上图第一组数据项描述了初始因子解的情况.可以看到,第一个因子解的特征 根值为,解释原有八个变量总方差的,累计方差贡献率为 .其余数据含义类 似.在初始解中由于提取了八个因子,因此原有变量的总方差均被解释掉 .第二组数据项描述了因子解

25、的情况.可以看到,由于指定提取两个因子,两个 因子共解释了原有变量总方差的 .总体上,原有变量的信息丢失较少,因子分 析效果较理想.第三组数据项描述了最终因子解的情况.可见,因子旋转后,累计方差比没有 改变,也就是没有影响原有变量的共同度, 但却重新分配了各个因子解释原有变 量的方差,改变了各因子的方差贡献,使得因子更容易解释 .图(5)因子的碎石图:Scree PlotComponent Number上图横坐标为因子数目,纵坐标为特征根.可以看到,第一个因子的特征根值很 高,对原有变量的贡献最大;第3个以后的因子特征根都较小,对解释原有变量 的贡献很小,已经成为可被忽略的“高山脚下的碎石”,

26、因此提取两个因子是合 适的.图(6)因子载荷矩阵:Component MatrixComponent12其它.929.097交通通讯.921文教娱乐.909家居设备.895居住消费.854食物消费.822衣物消费.599.710医疗保健.635.646a. 2 components extracted.上图因子载荷矩阵是因子分析的核心内容.根据该表可以写出本案例的因子分析模型:其它=f1+ f2交通通讯=f1 f2文教娱乐=f1 f2家居设备=fif2居住消费=flf2食物消费二fif2衣物消费=fi+f2医疗保健=f1 + f2由上表知,八个变量在第一个因子上的载荷都很高, 意味着他们与第一

27、个因子的相关度高,第一个因子很重要.图(7)旋转后的因子载荷矩阵:Rotated Component MatrixComponent12交通通讯.915.244文教娱乐.914.222食物消费.889.084家居设备.836.336居住消费.819.281其它.770.528衣物消费.188.909医疗保健.250.871a. Rotation converged in 3 iterations.由上图知,交通通讯、文教娱乐、食物消费、家居设备、居住消费、其它在第一个因子上有较高的载荷,第一个因子主要解释了这几个变量; 衣物消费、医疗保健在第二个因子上的载荷较高,第二个因子主要解释了这几个变量

28、.图(8)因子旋转中的正交矩阵Component Transformation MatrixComponent1212.879.477.879图(9)因子协方差矩阵:Component Score Covariance MatrixComponent1212.000.000从上表可以看出,两因子没有线性相关性,实现了因子分析的设计目标 图(10)旋转后的因子载荷图:aluiuEoiduJouCIE巾M3 u QottiicrsOhrsuMhcld 1s射口曝+山霸廿 前 fiinrs 阳wTflft 门 ng01 .D-0.5-Component Plot in Rotated SpaceCo

29、mponenT 11 o由上图可以直观的看出,衣物消费和食物消费比较靠近两个因子坐标轴, 表明如 果分别用第一个因子刻画食物消费,用第二个因子刻画衣物消费,信息丢失较少, 效果较好.图(11)因子得分系数矩阵:Component Score CoefficientMatrixComponent12食物消费.271衣物消费.576居住消费.194家居设备.184.001医疗保健.532交通通讯.236文教娱乐.241其它.110.152根据上表可以得到以下因子得分函数:F尸食物消费衣物消费+居住消费+家居设备医疗设备+交通通讯+文教娱乐+其它 52=食物消费+衣物消费居住消费+家居设备+医疗设备

30、交通通讯文教娱乐+其它 可见计算两个因子得分变量的变量值时,食物消费和衣物消费的权重较高,但方 向恰好相反,这与因子的实际含义是相吻合的.七、实验心得本科的时候有概率统计和数理分析的基础, 但是从来没有接触过应用统计分 析的东西,SPS他只是听说过,从来没有学过.一直以为这一块儿会比较难,这 学期最初学的时候,因为没有认真看教材,课下也没有认真搜集相关资料,所以 学起来有些吃力,总感觉听起来一头雾水.老师说最后的考核是通过提交学习报 告,然后我从图书馆里借了些教材查了些资料,发现很多问题都弄清楚了.结合软件和书上的例子,实战一下,发现 SPSS勺功能相当强大.这门课要学习完了, 整个学习的过程

31、是充满曲折和挑战的,我见证了自己从一无所知到困惑迷茫再到 略懂再到会用的过程.甚至学完之后有些问题还没有彻底搞清楚,自己接下来还 会不断的探索的.SPSS是个很神奇的工具,结合 AMOS口 EXCE匝是如虎添翼,相信学习了 SPSS在以后的论文和数据分析中很有用.这门课给我的感觉是看起来很难, 但是实际学起来就好很多, 因为当我结合具体实例和软件的时候, 很多抽象的问题就豁然开朗了 . 但是想给老师一个建议,这门课需要很强的统计和概率论的基础,要不然就会很难听懂或者听得半懂 . 然后这门课的很多方法的相关资料都是用在医疗卫生、自然科学领域的,在管理中的应用的资料不怎么多 . 老师希望我们上课的时候结合在管理中的应用来学习, 但是资料有限, 希望老师在这个方面多给学生一些引导 .

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 科普知识


经营许可证编号:宁ICP备18001539号-1