基于SPSS因子分析在地区经济发展综合评价中的应用.doc

上传人:韩长文 文档编号:5020756 上传时间:2020-01-29 格式:DOC 页数:22 大小:962.50KB
返回 下载 相关 举报
基于SPSS因子分析在地区经济发展综合评价中的应用.doc_第1页
第1页 / 共22页
基于SPSS因子分析在地区经济发展综合评价中的应用.doc_第2页
第2页 / 共22页
基于SPSS因子分析在地区经济发展综合评价中的应用.doc_第3页
第3页 / 共22页
基于SPSS因子分析在地区经济发展综合评价中的应用.doc_第4页
第4页 / 共22页
基于SPSS因子分析在地区经济发展综合评价中的应用.doc_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《基于SPSS因子分析在地区经济发展综合评价中的应用.doc》由会员分享,可在线阅读,更多相关《基于SPSS因子分析在地区经济发展综合评价中的应用.doc(22页珍藏版)》请在三一文库上搜索。

1、基于SPSS因子分析在地区经济发展综合评价中的应用一、 研究背景与研究意义地区经济是国民经济的基础层次,任何国家的地区经济发展失衡都会使其面临严峻的挑战。而我国各地区由于各种原因,经济发展水平有较大差异,尽管我国地区经济发展的不平衡通常是地区经济快速发展的特征之一,但缩小和规避内部差异是地区经济一体化和地区可持续发展的关键。促进地区经济的发展,需要对经济能力、稳定的专业化生产力和地区经济目标的新机遇有充分的理解。这一认识是规划加强地区经济发展和竞争力必备的基础要素,这些因素包括:人力资源、技术和创新、基础设施、管理、经营环境和市场定位。导致地区发展不平衡的因素是多样化的,所以有必要用定量化的方

2、法来进行评价并提出对策,从而正确选择重点投资区、实施重点地带(或城市)开发布局和带动战略。这是促进我国经济持续发展、进一步缩小地区差异的重要途径之一,而对各地区经济进行综合评价是实现这一目标的科学参考和基本工作。本文通过对中国统计年鉴2007中的我国各地区主要指标统计数据为依据,从地区经济实力水平、地区经济实力水平、产业结构、地区对外开放水平、地区文化教育和卫生水平、高等教育水平;、地区交通水平以及映地区环境保护水平等几个方面选取了28个指标,来反映我国地区经济发展水平的并应用因子分析方法对这些指标进行降维分析。二、 问题提出与变量选取由于地区经济复合系统结构非常复杂,单靠一个或几个指标往往难

3、以客观评估一个地区的经济发展水平,所以需要建立指标体系来描述系统的发展状况。指标太少或过于简单不能反映可持续发展的内涵,指标过少会对评估结果的精度产生影响,指标过多和过于复杂则不利于评估工作的开展。本文从衡量地区发展的各类指标中选取了28个指标,如表 21所示。表 Error! No text of specified style in document.1 变量符号及含义序号变量符号变量含义1X1人均GDP(元)2X2固定资本形成总额(亿元)3X3工业企业单位个数(个)4X4第一产业生产总值占比5X5第三产业生产总值占比6X6地方财政收入(万元)7X7财政支出(万元)8X8人均粮食占有量(公

4、斤)9X9居民消费支出(亿元)10X10平均货币工资(元)11X11总人口(万人)12X12城镇人口比例13X13各地区国际旅游外汇收入(亿美元)14X14入境旅游人数(万人次)15X15外商投资企业年底注册登记投资总额(亿美元)16X16高等学校数(所)17X17每十万人口在校生数(人)18X18普通高等学校教职工数(人)19X19各地区图书馆数(个)20X20图书馆总藏量(千册)21X21卫生机构数(个)22X22铁路营业里程(公里)23X23交通运输业客运量(万人)24X24交通运输业货运量(万吨)25X25邮电业务总量(亿元)26X26城市人口密度(人每平方公里)27X27生活垃圾无害

5、化处理率(%)28X28工业废水排放达标量(万吨)这里指标X2-X12主要是反映地区经济实力水平,X3-X5其中反映了产业结构;X13- X15主要是反映地区对外开放水平;X16-X21主要是反映地区文化教育和卫生水平,其中X16 和X18反映了高等教育水平;X22-X25主要是反映地区交通邮电水平,从属于X5;X26-X28主要是反映地区环境保护水平。三、 原始数据收集3.1 原始数据来源本文选取2007年我国31个省、直辖市及自治区的统计资料作为数据源。统计数据来源于中国统计年鉴2008等。统计数据见表 附录- 1各地区主要指标统计数据。3.2 数据标准化处理为了消除变量间的量纲关系,从而

6、使数据具有可比性,首先将原始数据进行标准化处理。可以直接使用SPSS进行数据标准化处理,这里采用的是Z标准化,即使均值为0,方差为1。标准化后的数据见标准化数据SAV文件。四、 因子分析因子分析的目的是从众多指标中,抽取少数几个综合性指标来反映原指标所包含的主要信息。用少数几个因子来描述众多指标之间的联系,并反映原始数据的大部分信息,通过公共因子的提取可以简化变量间的复杂关系。因子分析的过程如下。1.2.3.4.4.1 变量相关性检验因子分析的前提是变量间有较强的相关性。因此,为确定变量是否适合做因子分析,即变量间是否有意义的关系,首先需要对变量进行相关性分析。4.1.1 相关系数矩阵首先观察

7、相关系数矩阵,这里仅列出前18个变量的相关系数矩阵,如图 41所示:相关矩阵相关ZX1ZX2ZX3ZX4ZX5ZX6ZX7ZX8ZX9ZX10ZX11ZX12ZX13ZX14ZX15ZX16ZX17ZX18.ZX11.000.408.433-.768.562.688.499-.417.393.743-.077.938.689.391.633.283-.538.403ZX2.4081.000.876-.389-.146.844.900.010.907.035.790.294.556.518.683.827-.244.812ZX3.433.8761.000-.432-.041.851.800-.2

8、22.891.156.622.316.653.628.767.672-.137.625ZX4-.768-.389-.4321.000-.351-.598-.441.323-.372-.593.024-.717-.571-.371-.480-.296.344-.376ZX5.562-.146-.041-.3511.000.234.046-.476-.022.814-.372.517.459.211.203-.100-.209.068ZX6.688.844.851-.598.2341.000.937-.324.911.392.556.589.884.770.888.714-.254.727ZX7.

9、499.900.800-.441.046.9371.000-.117.944.171.769.403.749.699.747.845-.252.825ZX8-.417.010-.222.323-.476-.324-.1171.000-.165-.503.121-.297-.447-.318-.348-.013-.242-.011ZX9.393.907.891-.372-.022.911.944-.1651.000.094.806.304.757.782.758.822-.104.759ZX10.743.035.156-.593.814.392.171-.503.0941.000-.339.62

10、6.512.256.385-.096-.333.046ZX11-.077.790.622.024-.372.556.769.121.806-.3391.000-.168.291.414.340.841.062.720ZX12.938.294.316-.717.517.589.403-.297.304.626-.1681.000.645.390.576.224-.551.355ZX13.689.556.653-.571.459.884.749-.447.757.512.291.6451.000.910.846.482-.137.492ZX14.391.518.628-.371.211.770.6

11、99-.318.782.256.414.390.9101.000.742.443.081.385ZX15.633.683.767-.480.203.888.747-.348.758.385.340.576.846.7421.000.514-.182.522ZX16.283.827.672-.296-.100.714.845-.013.822-.096.841.224.482.443.5141.000-.217.926ZX17-.538-.244-.137.344-.209-.254-.252-.242-.104-.333.062-.551-.137.081-.182-.2171.000-.30

12、0ZX18.403.812.625-.376.068.727.825-.011.759.046.720.355.492.385.522.926-.3001.000Sig.单侧ZX1.011.008.000.001.000.002.010.014.000.340.000.000.015.000.061.001.012ZX2.011.000.015.217.000.000.478.000.425.000.054.001.001.000.000.093.000ZX3.008.000.008.413.000.000.114.000.201.000.042.000.000.000.000.232.000

13、ZX4.000.015.008.026.000.006.038.020.000.448.000.000.020.003.053.029.019ZX5.001.217.413.026.102.402.003.453.000.020.001.005.127.137.296.130.358ZX6.000.000.000.000.102.000.038.000.014.001.000.000.000.000.000.084.000ZX7.002.000.000.006.402.000.265.000.178.000.012.000.000.000.000.086.000ZX8.010.478.114.

14、038.003.038.265.188.002.258.052.006.040.028.472.095.476ZX9.014.000.000.020.453.000.000.188.307.000.048.000.000.000.000.289.000ZX10.000.425.201.000.000.014.178.002.307.031.000.002.082.016.303.033.402ZX11.340.000.000.448.020.001.000.258.000.031.183.056.010.031.000.371.000ZX12.000.054.042.000.001.000.0

15、12.052.048.000.183.000.015.000.112.001.025ZX13.000.001.000.000.005.000.000.006.000.002.056.000.000.000.003.232.002ZX14.015.001.000.020.127.000.000.040.000.082.010.015.000.000.006.332.016ZX15.000.000.000.003.137.000.000.028.000.016.031.000.000.000.002.163.001ZX16.061.000.000.053.296.000.000.472.000.3

16、03.000.112.003.006.002.120.000ZX17.001.093.232.029.130.084.086.095.289.033.371.001.232.332.163.120.050ZX18.012.000.000.019.358.000.000.476.000.402.000.025.002.016.001.000.050图 Error! No text of specified style in document.1 相关系数矩阵相关系数值越大表明两变量间相关性越强,较弱。相关系数小于0.3时表明相关性较弱。由上图看出,大部分相关系数为大于0.3,大部分单边检验值小于

17、0.05,可以初步判定变量间有较强的相关性,适合做因子分析。4.1.2 KMO与Bartlett检验下面进一步做KMO与Bartlett检验,进行变量相关性检验,检验结果如图 42所示:KMO 和 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量。.627Bartlett 的球形度检验近似卡方1372.245df378Sig.000图 Error! No text of specified style in document.2 KMO与Bartlett检验由图看出,KMO度量值为0.6270.5,样本大小达到要求,虽然度量值未达到0.7,属于较差的范围,但变量

18、间仍存在共同因素,可以做因子分析。同时, Bartlett球度检验中,近似卡方值为1372.245,显著水平值为0.0000.005,达到显著性水平要求,表明相关系数矩阵与单位矩阵有显著差异,即原始变量间可能存在有意义的关系,可进一步做因子分析。1.2.3.4.4.1.4.2 抽取因子接下来抽取变量间的共同因子。这里利用SPSS,采用常用的主成分法进行因子抽取。所谓主成分法就是以较少的成分,解释原始变量方差较大的部分。4.2.1 公因子方差首先得到公因子方差表,如图 43所示:公因子方差初始提取Zscore(X1人均GDP(元))1.000.945Zscore(X2固定资本形成总额(亿元))1

19、.000.921Zscore(X3工业企业单位个数)1.000.871Zscore(X4第一产业生产总值占比)1.000.659Zscore(X5第三产业生产总值占比)1.000.652Zscore(X6地方财政收入(万元))1.000.984Zscore(X7财政支出(万元))1.000.963Zscore(X8人均粮食占有量(公斤))1.000.846Zscore(X9居民消费支出(亿元))1.000.980Zscore(X10平均货币工资(元))1.000.814Zscore(X11总人口(万人))1.000.922Zscore(X12城镇人口比例)1.000.875Zscore(X13

20、各地区国际旅游外汇收入(亿美元))1.000.965Zscore(X14入境旅游人数(万人次))1.000.946Zscore(X15外商投资企业年底注册登记投资总额(亿美元))1.000.821Zscore(X16高等学校数(所))1.000.869Zscore(X17每十万人口在校生数(人))1.000.841Zscore(X18普通高等学校教职工数(人))1.000.804Zscore(X19各地区图书馆数(个))1.000.867Zscore(X20图书馆总藏量(千册))1.000.761Zscore(X21卫生机构数(个))1.000.824Zscore(X22铁路营业里程(公里))

21、1.000.866Zscore(X23交通运输业客运量(万人))1.000.863Zscore(X24交通运输业货运量(万吨))1.000.764Zscore(X25邮电业务总量(亿元))1.000.968Zscore(X26城市人口密度(人每平方公里))1.000.890Zscore(X27生活垃圾无害化处理率(百分比))1.000.797Zscore(X28工业废水排放达标量(万吨))1.000.873提取方法:主成份分析。图 Error! No text of specified style in document.3 公因子方差公因子方差表示了变量中能够被公因子所解释的部分,公因子方差

22、越大,变量能够被因子解释的程度越高。 公因子方差越大,变量能够被因子解释的程度越高。表中大部分变量的公因子方差均大于0.8,各个变量丢失的信息都较少,因此本次因子分析的因子抽取效果较为理想。4.2.2 因子解释的总方差进一步,通过因子解释的总方差,观察因子抽取的效果,如图 44所示:解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的 %累积 %合计方差的 %累积 %合计方差的 %累积 %113.21547.19547.19513.21547.19547.19511.03339.40539.40526.37122.75569.9506.37122.75569.9505.42719.

23、38358.78832.2277.95577.9052.2277.95577.9053.17911.35570.14341.2814.57682.4811.2814.57682.4813.11811.13581.27851.0583.77786.2581.0583.77786.2581.3944.98086.2586.8172.91789.1767.6242.22791.4038.4641.65793.0609.4061.44994.50910.3231.15495.66311.242.86696.52912.205.73197.26013.179.64197.90014.147.52398.

24、42415.122.43498.85816.093.33199.18917.071.25499.44318.050.18099.62319.039.13999.76320.021.07699.83921.018.06499.90322.009.03299.93523.008.02899.96424.005.01999.98225.003.01099.99226.002.00699.99827.000.00199.99928.000.001100.000提取方法:主成份分析。图 Error! No text of specified style in document.4 解释的总方差特征值反映

25、了每个变量在某一公因子上的因子负荷的平方总和,特征值大的因子将先被提取,从而以最少的因子量解释最大的变异信息量。由上图看出,初始特征值大于1的因子有5个,累计贡献率为86.258%,即5个因子共解释了原始变量总信息量的86.258%,大于80%。可以认为提取的5个公因子反映了原始变量的大量信息,有较好的解释能力。4.3 因子载荷矩阵及因子旋转4.3.1 原始因子载荷矩阵原始因子载荷矩阵如图 45所示:成份矩阵a成份12345Zscore(X9居民消费支出(亿元)).974.094.118.020-.090Zscore(X7财政支出(万元)).970.056-.081.109.021Zscore

26、(X6地方财政收入(万元)).959-.245.006.064-.025Zscore(X2固定资本形成总额(亿元)).924.176-.116-.147.035Zscore(X25邮电业务总量(亿元)).917.029.216.178-.220Zscore(X3工业企业单位个数).897-.010.132-.213-.061Zscore(X16高等学校数(所)).845.288-.131.014.234Zscore(X28工业废水排放达标量(万吨)).831.260.197-.274-.029Zscore(X20图书馆总藏量(千册)).823-.224-.149.075.076Zscore(X

27、18普通高等学校教职工数(人)).812.140-.235.002.263Zscore(X15外商投资企业年底注册登记投资总额(亿美元)).811-.349.137.040-.147Zscore(X24交通运输业货运量(万吨)).798.314-.143-.090.012Zscore(X13各地区国际旅游外汇收入(亿美元)).782-.465.160.257-.216Zscore(X23交通运输业客运量(万人)).764.414.242-.216-.040Zscore(X11总人口(万人)).741.589.107-.053.103Zscore(X14入境旅游人数(万人次)).735-.199

28、.322.318-.403Zscore(X21卫生机构数(个)).672.595-.063-.101.060Zscore(X10平均货币工资(元)).182-.879-.068.008.060Zscore(X5第三产业生产总值占比).042-.806.003.002-.027Zscore(X19各地区图书馆数(个)).463.786-.066.083.154Zscore(X1人均GDP(元)).529-.733-.321.086.133Zscore(X12城镇人口比例).436-.715-.387.155.004Zscore(X22铁路营业里程(公里)).069.689-.573.178-.1

29、65Zscore(X8人均粮食占有量(公斤))-.203.581-.566.001-.384Zscore(X4第一产业生产总值占比)-.489.551.280-.133-.144Zscore(X27生活垃圾无害化处理率(百分比)).274-.541.242-.532.295Zscore(X17每十万人口在校生数(人))-.230.264.820.214-.017Zscore(X26城市人口密度(人每平方公里))-.040.363.186.657.539提取方法 :主成份。a. 已提取了 5 个成份。图 Error! No text of specified style in document.

30、5 因子载荷矩阵由上图可以看出,因子载荷不够分散,存在部分重叠现象。比如,X13、X21、X19、X1、X12、X4在因子1和因子2上都有较大的载荷,X22、X8在因子2和因子3上都有较大的载荷,X27在因子2和因子4上有较大的载荷,X26在因子5和因子6上有较大的载荷。因此,为了更好的解释因子,需要对载荷矩阵进行旋转。4.3.2 因子旋转为了更好的解释因子,需要对载荷矩阵进行旋转,这里采用的是正交旋转法。旋转后的因子载荷矩阵如图 46所示:旋转成份矩阵a成份12345Zscore(X11总人口(万人)).914-.203-.125.096.141Zscore(X2固定资本形成总额(亿元)).

31、910.250-.033.150-.085Zscore(X16高等学校数(所)).885.213-.082.045.178Zscore(X28工业废水排放达标量(万吨)).885-.059.137.211-.155Zscore(X23交通运输业客运量(万人)).876-.207.055.209-.082Zscore(X9居民消费支出(亿元)).860.192.062.446-.016Zscore(X21卫生机构数(个)).860-.144-.247.001.054Zscore(X24交通运输业货运量(万吨)).841.134-.163.107-.034Zscore(X7财政支出(万元)).83

32、9.369-.034.341.081Zscore(X3工业企业单位个数).810.193.210.314-.189Zscore(X18普通高等学校教职工数(人)).803.368-.059-.005.143Zscore(X19各地区图书馆数(个)).732-.299-.391-.084.287Zscore(X25邮电业务总量(亿元)).725.166.052.642.026Zscore(X6地方财政收入(万元)).707.504.180.444-.023Zscore(X20图书馆总藏量(千册)).613.552.093.267.029Zscore(X1人均GDP(元)).155.912.247

33、.164-.044Zscore(X12城镇人口比例).043.899.111.215-.078Zscore(X4第一产业生产总值占比)-.187-.758-.162-.145-.038Zscore(X17每十万人口在校生数(人))-.137-.718.302.329.327Zscore(X10平均货币工资(元))-.198.714.461.187-.132Zscore(X5第三产业生产总值占比)-.302.559.424.204-.164Zscore(X22铁路营业里程(公里)).271-.097-.865-.172.071Zscore(X8人均粮食占有量(公斤))-.005-.185-.85

34、4-.192-.212Zscore(X27生活垃圾无害化处理率(百分比)).189.272.767-.134-.284Zscore(X14入境旅游人数(万人次)).410.191.107.854-.006Zscore(X13各地区国际旅游外汇收入(亿美元)).386.504.242.709-.011Zscore(X15外商投资企业年底注册登记投资总额(亿美元)).522.422.268.535-.114Zscore(X26城市人口密度(人每平方公里)).058-.178-.076-.030.921提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。a. 旋转在 8 次迭代后

35、收敛。图 Error! No text of specified style in document.6 旋转后的因子载荷矩阵由上图可见,旋转后,因子载荷的分离程度得到了改善。4.3.3 因子模型因子分析的基本模型为Xi =i + ai1F1 + ai2F2 + ai3F3 + +i;根据旋转后的因子载荷矩阵,可以得到因子模型:X1 = 0.155F1 + 0.912F2 + 0.247F3 + 0.164F4 + 0.044F5;X2 = 0.910F1 + 0.250F2 + 0.033F3 + 0.150F4 + 0.085F5;X3 = 0.897F1 + 0.010F2 + 0.13

36、2F3 + 0.213F4 + 0.061F5; X26 = 0.058F1 + 0.178F2 + 0.076F3 + 0.030F4 + 0.921F5;X27 = 0.189F1 + 0.272F2 + 0.767F3 + 0.134F4 + 0.284F5;X28 = 0.831F1 + 0.260F2 + 0.197F3 + 0.274F4 + 0.029F5;4.4 因子解释及命名由旋转后的因子载荷矩阵得到如下信息:(一) 因子1的解释X11总人口、X2固定资本形成总额、X16高等学校数、X28工业废水排放达标量、X23交通运输业客运量、X9居民消费支出、X21卫生机构数、X24交

37、通运输业货运量、X7财政支出、X3工业企业单位个数、X18普通高等学校教职工数、X19各地区图书馆数、X25邮电业务总量、X6地方财政收入、X20图书馆总藏量在因子1上的载荷较大,即因子1在较大的程度上反映了地区的总体经济水平,工业发展,以及教育水平和文化卫生水平。教育文化卫生水平并未如预期那样单独抽取一个因子,这可能是由于指标量不足,或者解释为地区的教育文化卫生水平很大程度上依赖于地区的经济发展水平。因此因子1可定义为经济发展因子,符号为F1。(二) 因子2的解释X1人均GDP、X12城镇人口比例、X4第一产业生产总值占比、X17每十万人口在校生数、X10平均货币工资、X5第三产业生产总值占

38、比在因子2上的载荷较大;同时因子2也对X7财政支出、X6地方财政收入、X20图书馆总藏量。因此因子2可定义为社会发展因子,符号为F2。(三) 因子3的解释X22铁路营业里程、X8人均粮食占有量、X27生活垃圾无害化处理率在因子3上的载荷较大;同时因子3对X9居民消费支出、X25邮电业务总量、X10平均货币工资、X5第三产业生产总值占比也有一定程度的载荷。这说明因子3在较大程度上反映了居民生活水平。因此因子3可定义为居民生活因子,符号为F3。(四) 因子4的解释X14入境旅游人数、X13各地区国际旅游外汇收入、X15外商投资企业年底注册登记投资总额在因子4上的载荷较大,即因子4较大程度的反映了地区的对外开放程度。因此因子4可定义为对外开放因子,符号为F4。(五) 因子5的解释X26城市人口密度在因子5上的载荷较大,因子5仅反映了人口密度指标,若删除该指标或增加一些相关指标可能可以得到关于因子更好的解释。因此因子5可定义为城市人口密度因子,符号为F5。图 Error! No text of specifie

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 研究报告 > 商业贸易


经营许可证编号:宁ICP备18001539号-1