SPSS处理因子分析.doc

上传人:scccc 文档编号:11309277 上传时间:2021-07-22 格式:DOC 页数:17 大小:483KB
返回 下载 相关 举报
SPSS处理因子分析.doc_第1页
第1页 / 共17页
SPSS处理因子分析.doc_第2页
第2页 / 共17页
SPSS处理因子分析.doc_第3页
第3页 / 共17页
SPSS处理因子分析.doc_第4页
第4页 / 共17页
SPSS处理因子分析.doc_第5页
第5页 / 共17页
点击查看更多>>
资源描述

《SPSS处理因子分析.doc》由会员分享,可在线阅读,更多相关《SPSS处理因子分析.doc(17页珍藏版)》请在三一文库上搜索。

1、实验七 因子分析一实验目的 使用SPSS软件对多元数据进行因子分析。二实验要求 实验题目:为了研究全国各地年人均收入的差异性和相似性。收集到1997年全国31个省市自治区各类经济单位的年人均收入数据,由于涉及变量较多,直接进行地区比较较为繁琐。试通过因子分析做综合比较。三实验内容 1.给变量重新命名。打开“因子分析(各地区年平均收入).sav”文件,切换到变量视窗,将题目中的“国有经济单位”,“集体经济单位”,“联营经济单位”,“股份制经济单位”,“外商投资经济单位”,“港澳台经济单位”,“其它经济单位”分别用x1,x2, x3 ,x4 ,x5, x6 ,x7表示。2、对数据预处理。选择“分析

2、”,点击“描述统计”,选择并弹出“描述”对话框,将x1、x2、x3、x4、x5、x6、x7移入变量框中,勾选“将标准化结果另存为变量”后点击“确定”。如下图一所示: 【图一】进行该步操作的目的是为了标准化数据,消除数据的量纲。打开数据视窗后,发现增加了7列标准化后的数据,以后的所有操作都是对这7组数据进行的,该数据如下图二所示: 【图二】3对数据进行因子分析。(1)点击“分析”,选择“数据降维”中的“因子分析”,将标准化后的数据Zx1、Zx2、Zx3、Zx4、Zx5、Zx6、Zx7移入变量框中。点击“描述”按钮,在“相关矩阵”中勾选“系数”、“显著性水平”、“KMO和Bartlett的球形度检

3、验”后点击“继续”。点击“抽取”,勾选“显示”中的“碎石图”,在“抽取”中设置“特征值大于0”后点击“继续”,最后“确定”。详细过程如下图三所示: 【图三】【注意】这一步中没有改变“旋转”中的值。(2)结果输出如下表一: 【表一】相关矩阵 Zscore: 国有经济单位Zscore: 集体经济单位Zscore: 联营经济单位Zscore: 股份制经济单位Zscore: 外商投资经济单位Zscore: 港澳台经济单位Zscore: 其他经济单位相关Zscore: 国有经济单位1.000.916.707.807.878.882.628 Zscore: 集体经济单位.9161.000.711.741.

4、823.845.663 Zscore: 联营经济单位.707.7111.000.693.579.663.508 Zscore: 股份制经济单位.807.741.6931.000.785.855.586 Zscore: 外商投资经济单位.878.823.579.7851.000.898.714 Zscore: 港澳台经济单位.882.845.663.855.8981.000.760 Zscore: 其他经济单位.628.663.508.586.714.7601.000Sig.(单侧)Zscore: 国有经济单位 .000.000.000.000.000.000 Zscore: 集体经济单位.00

5、0 .000.000.000.000.000 Zscore: 联营经济单位.000.000 .000.001.000.002 Zscore: 股份制经济单位.000.000.000 .000.000.000 Zscore: 外商投资经济单位.000.000.001.000 .000.000 Zscore: 港澳台经济单位.000.000.000.000.000 .000 Zscore: 其他经济单位.000.000.002.000.000.000 KMO 和 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量。.887Bartlett 的球形度检验近似卡方210.

6、446 df21 Sig.000 公因子方差 初始提取Zscore: 国有经济单位1.000.892Zscore: 集体经济单位1.000.853Zscore: 联营经济单位1.000.605Zscore: 股份制经济单位1.000.783Zscore: 外商投资经济单位1.000.849Zscore: 港澳台经济单位1.000.914Zscore: 其他经济单位1.000.606提取方法:主成分分析。说明的总方差成分初始特征值 合计方差的 %累积 %15.50278.59478.5942.5557.92386.5173.3945.62492.1414.2844.06096.2015.1261

7、.80298.0026.0761.08999.0927.064.908100.000提取方法:主成分分析。 成分矩阵(a) 成分 1Zscore: 国有经济单位.944Zscore: 集体经济单位.923Zscore: 联营经济单位.778Zscore: 股份制经济单位.885Zscore: 外商投资经济单位.922Zscore: 港澳台经济单位.956Zscore: 其他经济单位.778提取方法 :主成分分析法。a 已提取了 1 个成分。(3)结果分析: 在“相关矩阵”表中可以看出x1和x2之间的相关系数高达0.917,再结合其它变量间相关系数也比较高的事实,我们可以大致得出数据适合做因子分

8、析的结论。在“ KMO 和 Bartlett 的检验”中可知:巴特利特球度检验统计量的观测值为210.446,相应的概率P-值接近0小于显著性水平0.05,故应拒绝原假设,认为相关系数矩阵与单位陈有显著差异。模型的KMO值为0.887,接近于1,根据kaiser给出的KMO度量标准可知原有变量适合进行因子分析。“公因子方差” 表显示了所有变量共同度数据。第一列数据是因子分析初始解下的变量共同度,它表明:如果对原有7个变量采用主成分分析方法提取所有特征值(7个),那么原有变量的所有方差都可被解释,变量的共同度均为1(原有变量标准化后的方差为1)。事实上,因子个数小于原有变量的个数才是因子分析的目

9、标,所以不可提取全部特征值。第二列的数据是在按指定提取条件(这里为特征值大于1)提取特征值时的共同度。可以看到:港澳台经济单的绝大部分信息可被解析(大于83%)。在“说明的总方差”中,“合计,方差的,累积”,分别表示特征值,方差贡献率,累计方差 贡献率。它们描述了因子分析初始解的情况,。可以看到,第一个因子的特征值为5.502,解释原有7个变量总方差的78.594%(即5.502/7*100%),累积方差贡献率为78.594%;第二个因子的特征值为0.555,解释原有7个变量总方差7.923(即0.555/7*100%),累积方差贡献率为86.517即502+0.555)/7*100%)。其余

10、数据含义类似。在初始解中由于提取了7个因子,因此原有变量的总方差均被解释,累积方差贡献率100%。在“碎石图”中,横坐标为因子数目,纵坐标为特征值。可以看到第一个因子特征值很高,对解释原有变量的贡献最大,第三个以后的因子特征值都较小,对解释原有变量的贡献很小,因此提取两个因子是合适的。但,7个变量在第一个因子上的载荷都很高,意味着它们与第一个因子的相关程度高,第一个因子很重要。第二个因子与原有变量的相关性均较小,它对原有变量的解释作用不显著。因此我们可以做一步改进。(4)方差最大法。该步的操作基本和第2步相同,不同的地方如下:点击“抽取”,将方法改为“主轴因子分解”,设置特征值大于0,在显示中

11、选择“碎石图”,把第2步中选择的“未旋转的因子解”去掉。点击“继续”。点击“旋转”,方法中选择“最大方差法”,显示中选择“旋转解”和“载荷图”,点击“继续”。点击“得分”,勾选“保存为变量”和“显示因子得分系数矩阵”,方法选择“回归”,点击“继续”。如下图四所示: 【图四】进行过所有相应的设置操作之后,点击“确定”得到的结果如下表二所示:【表二】旋转成分矩阵(a) 成分123456Zscore: 国有经济单位.696.245.374.338.389.099Zscore: 集体经济单位.796.330.274.346.207.064Zscore: 联营经济单位.296.199.259.886.1

12、35.057Zscore: 股份制经济单位.334.247.806.338.243.059Zscore: 外商投资经济单位.471.389.372.193.663.077Zscore: 港澳台经济单位.465.442.477.273.371.384Zscore: 其他经济单位.256.903.202.193.193.055提取方法 :主成分分析法。 旋转法 :具有 Kaiser 标准化的正交旋转法。 说明的总方差成分初始特征值旋转平方和载入 合计方差的 %累积 %合计方差的 %累积 %15.50278.59478.5941.82026.00126.0012.5557.92386.5171.43

13、120.44846.4493.3945.62492.1411.33919.12965.5784.2844.06096.2011.28218.31783.8945.1261.80298.002.88712.66696.5606.0761.08999.092.1772.53199.0927.064.908100.000 提取方法:主成分分析。得到的相关阵、KMO检验、公因子方差表和前面得到的结果是一致的,在这里不加说明。但从上表的结果可以看出,旋转平方和载入所占的累积方差的比例一直到第4个成分时达到80以上,这说明旋转后的效果不如旋转前好,因此需要进一步改进。(5)主轴法探索未旋转的因子解。该步的

14、操作基本和第(4)步相同,其不同的地方只是在“抽取”对话框中重新抽选“未旋转的因子解”。如图五所示: 【图五】其它步骤不变,点击确定后得到说明的总方差表的结果如下表三所示:【表三】 说明的总方差因子初始特征值 合计方差的 %累积 %15.50278.59478.5942.5557.92386.5173.3945.62492.1414.2844.06096.2015.1261.80298.0026.0761.08999.0927.064.908100.000提取方法:主轴因子分解。 结果较第(4)步大有改进,从表中可以看出,用1、2主成分就可以基本概括变量中的信息。这和第(2)步中得到的结果其实

15、是相同的。而综合指标的计算公式如下: 将各个样本对应变量的数据代入以上公式,比较求出值的大小,值大的地区我们就可以认为其整体上的年均收入高。从以上步骤可以看出,进行因子旋转确实不如不旋转,而因子分析只需要设置两个公因子。下面我们对模型进一步改进。 (6)模型的最终改进:该步骤与第(4)步的区别在于在“抽取”对话框中,将方法改回原来的“主成分分析”,然后设置“因子数”为2,其它步骤不变,操作过程如下图六所示: 【图六】得到的结果如下表四所示: 【表四】 成分矩阵(a) 成分 12Zscore: 国有经济单位.944.083Zscore: 集体经济单位.923.063Zscore: 联营经济单位.

16、778.497Zscore: 股份制经济单位.885.144Zscore: 外商投资经济单位.922-.183Zscore: 港澳台经济单位.956-.114Zscore: 其他经济单位.778-.479 提取方法 :主成分分析法。 a 已提取了 2 个成分。旋转成分矩阵(a) 成分 12Zscore: 国有经济单位.612.724Zscore: 集体经济单位.612.695Zscore: 联营经济单位.203.900Zscore: 股份制经济单位.527.725Zscore: 外商投资经济单位.784.518Zscore: 港澳台经济单位.759.592Zscore: 其他经济单位.890.

17、207 提取方法 :主成分分析法。 旋转法 :具有 Kaiser 标准化的正交旋转法。 a 旋转在 3 次迭代后收敛。成分转换矩阵成分121.710.7042-.704.710 提取方法 :主成分分析法。 旋转法 :具有 Kaiser 标准化的正交旋转法。成分得分系数矩阵 成分 12Zscore: 国有经济单位.016.227Zscore: 集体经济单位.039.199Zscore: 联营经济单位-.530.736Zscore: 股份制经济单位-.069.298Zscore: 外商投资经济单位.352-.117Zscore: 港澳台经济单位.268-.023Zscore: 其他经济单位.708

18、-.514提取方法 :主成分分析法。 旋转法 :具有 Kaiser 标准化的正交旋转法。 构成得分。成分得分协方差矩阵成分1211.000.0002.0001.000提取方法 :主成分分析法。 旋转法 :具有 Kaiser 标准化的正交旋转法。 构成得分。 该步的结果分析:a.由“成分矩阵”知;主成分分析确实恰好提取了两个公共因子。这正好符合模型的要求。且各个案例的因子分析模型如下:国有经济单位集体经济单位其他类似。b.由“旋转成分矩阵(a)”知,其他经济单位,港澳台经济单位,外商投资经济单在第一个因子上有较高的载荷,第一个因子主要解释了这几个变量,可解释为外来投资经济单位。联营经济单位,外商

19、投资经济单,国有经济单位,股份制经济单位在第二个因子上有较高的载荷,第二个因子主要解释了这几个变量,可解释为内部投资经济单位。采用具有 Kaiser 标准化的正交旋转法得到改进后的成分矩阵,如据该表可知有如下等式成立:,依次类推,7个变量均可以分解成两个公共因子的线性组合加上一个特殊因子的形式。c.“分转换矩阵”:成分转换阵即为未旋转前的因子载荷阵与正交阵的乘积。旋转空间中的成分图:从图中可以看出原变量经标准化后得到的7个变量之间的相关性很明显,这就说明因子分析会得到好的结果。d.“成分得分系数矩阵”:成分得分系数阵给出了各个变量与两个共同成分之间的得分系数情况。由此表可得,计算两个因子得分变

20、量值时,联营经济单位和其他经济单位的权重较高,但方向恰好相反,这与因子的实际含义是相吻合的。另外,因子得分的均值为0,标准差为1,正值表示高于平均水平,负值表示低于平均水平。因子得分函数如下:=0.016国有+0.039集体-0.530联营-0.069股份+0.352外商+0.268港澳台+0.708其他=0.227国有+0.199集体+0.736联营+0.298股份-0.117外商-0.023港澳台-0.514其他e.“成分得分协方差矩阵”说明得到的两个公共因子之间是正交的。四、存在问题与解决情况 问题一:不理解各样本的因子得分。 解决:因子分析的最终目标是减少变量的个数,以便在进一步的分析

21、中用较少的因子代替原有变量参与数据建模,而计算因子得分是因子分析的最终体现。在因子分析的实际应用中,当因子确定以后,便可以计算各因子在每个样本上的具体数值,这些数值就成为因子得分,形成的变量称为因子变量。于是,在以后的分析中就可以以因子变量代替原有变量进行数据建模,或利用因子变量对样本进行分类或评价等研究,进而实现降维和简化问题的目的。 问题二:试验过程较为繁琐,没能理清思路。 解决:现对因子分析的基本步骤进行一个总结:(1) 因子分析的前提条件。(判别原有变量是否适合做因子分析)(2) 因子提取。(研究如何在样本数据的基础上提取综合因子)(3) 使因子具有命名解释性(通过各种方法是提取出来的因子实际含义清晰)(4) 计算各因子的得分。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1