主成分分析和因子分析.ppt

上传人:本田雅阁 文档编号:2988148 上传时间:2019-06-20 格式:PPT 页数:129 大小:5.98MB
返回 下载 相关 举报
主成分分析和因子分析.ppt_第1页
第1页 / 共129页
主成分分析和因子分析.ppt_第2页
第2页 / 共129页
主成分分析和因子分析.ppt_第3页
第3页 / 共129页
主成分分析和因子分析.ppt_第4页
第4页 / 共129页
主成分分析和因子分析.ppt_第5页
第5页 / 共129页
点击查看更多>>
资源描述

《主成分分析和因子分析.ppt》由会员分享,可在线阅读,更多相关《主成分分析和因子分析.ppt(129页珍藏版)》请在三一文库上搜索。

1、第 九 章,第一组,第1题,全国重点水泥企业某年的经济效益分析,评价指标有: X1为固定资产利税率, X2为资金利税率, X3为销售收入利税率, X4为资金利润率, X5为固定资产产值率, X6-流动资金周转天数, X7-万元产值能耗, X8-全员劳动生产率 现有15家水泥企业的数据,试利用主成分法综合评价其效益。,先将数据标准化:,得到标准化的数据如下:,对标准化后的数据作主成分分析:,由上表可以看到,前面三个主成分解释了全部方差的89.854%,说明可由前三个主成分代表原来的8个指标评价经济效益。,在因子对话框中,点击抽取按钮,输入抽取3个因子数:,第一主成分的方差为5.054,第二主成分

2、的方差为1.288,第三主成分的方差为0.847。,由上表得出三个主成分的线性组合如下:,计算各企业经济效益的综合得分,由综合得分可排出企业经济效益的名次。,九章第2题,在企业经济效益的评价中,涉及的指标往往很多.为了简化系统结构,抓住经济效益评价中的主要问题,可利用主成分分析法进行综合评价。在对我国部分省,市,自治区独立核算的工业企业的经济效益评价中,涉及到9项指标,用主成分分析进行综合评价。 x1-100元固定资产原值实现产值, X2-100元固定资产原值实现利税, X3-100元资金实现利税, X4-100元工业总产值实现利税, X5-100元销售收入实现利税, X6-每吨标准煤实现工业

3、产值, X7-每千瓦时电力实现工业产值, X8-全员劳动生产率, X9-100元流动资金实现产值,SPSS操作:分析描述统计描述,标准化数据,SPSS操作:分析降维因子分析,分析结果:,1、相关矩阵,主成分分析方法适用于变量之间存在较强相关性的数据。上表为各个指标的相关系数矩阵,由表中数据可以看出各个变量之间存在较强的相关性,因此运用主成分分析可以起到很好的降维作用。,2、特征值、贡献率结果表,上表是特征值、贡献率的结果表。该表显示了各主成分解释原始变量总方差的情况,由表中数据可以看出前两个成分的累积贡献率是87.036%大于85%,因此保留2个主成分最合适。,3、成分矩阵和成分得分矩阵,对上

4、表中的第i列的每个元素分别除以第i个特征根的平方根 ,这样得到主成分分析的第i个主成分的系数,结果如下表。,3、成分矩阵和成分得分矩阵,对上表中的第i列的每个元素分别乘以第i个特征根的平方根 ,这样得到主成分分析的第i个主成分的系数,结果如下表。,4、计算主成分得分,构造综合评价函数,将标准化原始数据代入主成分表达式计算各个企业的主成分得分,或将spss输出的得分乘以特征值的平方根,即可得到主成分得分。(转换计算变量),构造综合评价函数,计算综合得分并排名,由表中数据可以看出有许多城市工业企业得分是负数,但这并不表明该城市工业企业的经济效益为负,这里的正负表示与平均水平的位置关系,企业的经济效

5、益的平均水平算作零点,这是我们在整个过程中将数据标准化的结果。 从表可看出上海工业企业的综合经济效益最好排在第一名,青海的工业企业的综合经济效益则最差。,九章第3题,某主管局管辖20个工厂,现要对每个工厂作经济效益分析,经研究确定从所取得的生产成果同所消耗的人力,物力,财力的比率,选取五个指标作分析 x1-固定资产产值率, X2-净产值劳动生产率, X3-百元产值流动资金占用率, X4-百元产值利润率, X5-百元资金利润率. 试用主成分法进行综合评价。,首先进行变量标准化,SPSS操作如下,接着进行主成分分析,SPSS操作如下:,分析结果:,1、相关系数矩阵,主成分分析方法适用于变量之间存在

6、较强相关性的数据。上表为各个指标的相关系数矩阵,由表中数据可以看出各个变量之间存在较强的相关性,因此运用主成分分析可以起到很好的降维作用。,2、特征值、贡献率结果表,上表是特征值、贡献率的结果表。该表显示了各主成分解释原始变量总方差的情况,由表中数据可以看出前两个成分的累积贡献率是87.952%,大于85%,因此保留2个主成分最合适。并且第一主成分的特征根是2.683,第二主成分的特征根是1.715。,特征值的贡献还可以从碎石图看出,从碎石图可以看出,从第2个因子开始,曲线变得比较平缓,最后接近一条直线。因此,可以抽取前2个因子。,3、成分矩阵和成分得分矩阵,对上表中的第i列的每个元素分别除以

7、第i个特征根的平方根 ,这样得到主成分分析的第i个主成分的系数,结果如下表。,3、成分矩阵和主成分系数,由主成分载荷矩阵可得主成分系数,求法是:各自主成分载荷量除以各自主成分特征值的算术平方根,4、计算主成分得分,成分的得分是相应的因子得分乘以相应的方差的算数平方根,结果如下:,5、综合得分模型及排序,按照综合得分大小进行企业的排序,操作及结果如下:,由表中数据可以看出有许多企业得分是负数,但这并不表明该企业的经济效益为负,这里的正负表示与平均水平的位置关系,企业的经济效益的平均水平算作零点,这是我们在整个过程中将数据标准化的结果。 从表可看出企业A的综合经济效益最好排在第一名,企业T的工业企

8、业的综合经济效益则最差。,按照综合得分大小进行企业的排序,操作及结果如下:,第4题,朗莱曾分析美国联邦政府雇员人数(Y)与国民总产出隐含平减指数(X1),国民总产出(X2),失业人数(X3),武装力量人数(X4),14岁及以上非慈善机构人口数(X5),时间变量(X6)等的关系,数据如下。他利用了美国4762年数据(如下)做多元线性回归。现请你重新做下朗莱的工作,判断有无多重共线性,如有,试用主成分法回归分析消除多重共线性。,判断多重共线性: 多元线性回归,共线性检验,多个维度特征根约为0证明存在多重共线性;条件指数大于10时提示我们可能存在多重共线性;相关系数矩阵,存在数值接近1的相关,这也提

9、示出可能存在多重共线性。,主成分回归分析:,数据标准化,得到标准化的数据如下:,主成分分析:,由上表可以看到,前面二个主成分解释了全部方差的82.047%,说明可由前二个主成分代表原来的6个原始变量。,第一主成分的方差为3.686,第二主成分的方差为1.237 根据成分矩阵得到两个主成分的线性方程:,计算两个主成分对应的值:,两个主成分对应值如下表:,做标准化的因变量与主成分的线性回归:,原始变量均值和标准差如下表:,第5题,经济工作者希望通过国内总产值x1,存储量x2,消费总量x3,去预测进口总额y,为此收集了某地区共计十一年的有关数据,利用主成分估计建立回归方程。,操作过程:(1)数据标准

10、化,结果如图所示:,结果如图所示:,前两个主成分的累计贡献率达到99.9%,足以解释所有变量,所以我们剔除第三个成分,根据成分矩阵得到两个主成分线性方程:,第一主成分的方差为1.999,第二主成分的方差为0.998,(3)线性回归:,得到两个主成分对应的值:,得到结果:,还原为元变量:,第6题,影响电的需求量的指标有: (1)钢的产量x1; (2)生铁产量x2; (3)钢材产量x3; (4)有色金属产量x4; (5)原煤产量x5; (6)水泥产量x6; (7)机械工业总产值x7; (8)化肥产量x8; (9)硫酸产量x9; (10)烧碱产量x10; (11)棉纱产量x11 共11个指标。收集了

11、23年的指标值,建立发电站需求模型。,操作过程如下: (1)数据标准化:,得到结果:,主成分分析:,得到结果:,第一主成分的方差贡献率已达89.7%,足以代表其他变量。所以只选取这一个主成分。,转换变量: (转换-计算变量),结果为:,进行线性回归:,得出结果:,还原为元变量:,第 十 章,第一组,十章第1题,全国重点水泥企业某年的经济效益分析,评价指标有: X1为固定资产利税率, X2为资金利税率, X3为销售收入利税率, X4为资金利润率, X5为固定资产产值率, X6-流动资金周转天数, X7-万元产值能耗, X8-全员劳动生产率 现有15家水泥企业的数据如下,试利用探索性因子分析方法分

12、析可能存在的公共因子并命名。,Spss 操作:分析因子分析降维,分析结果: 1、因子分析的前提条件判断KMO和Bartlett的检验,Bartlett球度检验的概率P值为0.000,即拒绝原假设,即相关矩阵不是单位矩阵,代表母群体的相关矩阵间有共同因素存在,适合进行因素分析。同时,KMO值为0.422,根据度量标准可知,原变量适合做因子分析。,2、构造因子变量 (1)公因子方差,这是因子分析的共同度,第二列显示了初始的共同度,全部为1;第三列是提取特征根的共同度,表中大部分变量的共同度都高于80%,变量丢失信息较少,因子分析的效果较好。,(2)未旋转的解释总方差,主成分个数提取原则为特征值大于

13、1的为主成分,因此本题只取前两个主成分,它们的累积解释方差占到79.27%,并且第一主成分的特征根是5.054,第二主成分的特征根是1.288。,(3)碎石图,从碎石图可以看出,从第2个因子开始,曲线变得比较平缓,最后接近一条直线。因此,可以抽取前2个因子。,(4)未旋转成份矩阵,如果一个变量在某个因子上有较大的负荷,就说明可以把这个变量纳入该因子,但是,常常会有很多变量同时在几个未旋转的因子上有较大的负荷,比如本题中全员劳动生产率X8这一变量在因子1和因子2上都有较大的负荷,这就使得解释起来比较困难,因此查看旋转以后的结果能较好地解决这个问题。,3、利用因子旋转,使因子更具有命名可解释性 (

14、1)旋转后总的解释方差,与旋转前相比,旋转后的特征值有所变化,最大特征值与最小特征值之间的差距变得相对集中,但是,旋转前、后的总特征值没有改变,最后的累积方差百分比也没有改变,仍然为79.27%。,(2)旋转成份矩阵,表中各变量根据负荷量的大小进行了排列。旋转后的因子矩阵与旋转前的因子矩阵有明显的差异。从旋转后的矩阵表中,根据这些变量的原始意义可以对两个因子进行命名。因子1可命名为资产类,因子2可命名为产能类。,十章第2题,对我国部分省,市,自治区独立核算的工业企业的经济效益评价中,涉及到9项指标,如下 x1-100元固定资产原值实现产值, X2-100元固定资产原值实现利税, X3-100元

15、资金实现利税, X4-100元工业总产值实现利税, X5-100元销售收入实现利税, X6-每吨标准煤实现工业产值, X7-每千瓦时电力实现工业产值, X8-全员劳动生产率, X9-100元流动资金实现产值 试利用探索性因子分析方法分析可能存在的公共因子并命名。,Spss 操作:分析因子分析降维,分析结果: 1、因子分析的前提条件判断KMO和Bartlett的检验,Bartlett球度检验的概率P值为0.000,即拒绝原假设,即相关矩阵不是单位矩阵,代表母群体的相关矩阵间有共同因素存在,适合进行因素分析。同时,KMO值为0.771,根据度量标准可知,原变量适合做因子分析。,2、构造因子变量 (

16、1)公因子方差,这是因子分析的共同度,第二列显示了初始的共同度,全部为1;第三列是提取特征根的共同度,表中大部分变量的共同度都高于80%,变量丢失信息较少,因子分析的效果较好。,(2)未旋转的解释总方差,主成分个数提取原则为特征值大于1的为主成分,因此本题只取前两个主成分,它们的累积解释方差占到87.036 %,并且第一主成分的特征根是6.363,第二主成分的特征根是1.470。,(3)碎石图,从碎石图可以看出,从第2个因子开始,曲线变得比较平缓,最后接近一条直线。因此,可以抽取前2个因子。,(4)未旋转成份矩阵,如果一个变量在某个因子上有较大的负荷,就说明可以把这个变量纳入该因子,但是,常常

17、会有很多变量同时在几个未旋转的因子上有较大的负荷,比如百元销售收入实现利税X5这一变量在因子1和因子2上同时有较大的负荷,这就使得解释起来比较困难,因此查看旋转以后的结果能较好地解决这个问题。,3、利用因子旋转,使因子更具有命名可解释性 (1)旋转后总的解释方差,与旋转前相比,旋转后的特征值有所变化,最大特征值与最小特征值之间的差距变得相对集中,但是,旋转前、后的总特征值没有改变,最后的累积方差百分比也没有改变,仍然为87.036% 。,(2)旋转成份矩阵,表中各变量根据负荷量的大小进行了排列。旋转后的因子矩阵与旋转前的因子矩阵有明显的差异。从旋转后的矩阵表中,根据这些变量的原始意义可以对两个

18、因子进行命名。因子1可命名为资金及工业产值,因子2可命名为产值利税。,十章第3题,某主管局管辖20个工厂,现要对每个工厂作经济效益分析,经研究确定从所取得的生产成果同所消耗的人力,物力,财力的比率,选取五个指标作分析 x1-固定资产产值率, X2-净产值劳动生产率, X3-百元产值流动资金占用率, X4-百元产值利润率, X5-百元资金利润率. 试利用探索性因子分析方法分析可能存在的公共因子并命名。,Spss 操作:分析因子分析降维,分析结果: 1、KMO和Bartlett的检验,Bartlett球度检验的概率P值为0.000,即原假设被拒绝,也就是说,可以认为相关系数矩阵和单位矩阵有显著差异

19、。同时,KMO值为0.495,根据度量标准可知,原变量适合做因子分析。,2、公因子方差,这是因子分析的共同度,第二列显示了初始的共同度,全部为1;第三列是提取特征根的共同度,本题是在指定特征根大于1的条件下的共同度。表中每个变量的共同度都高于80%,变量丢失信息较少。,3、解释的总方差,该表由三部分组成,分别是初始因子解的方差解释、提取因子解的方差解释和旋转因子解的方差解释。第一个因子的特征值为2.683,解释了5个原始变量总方差的53.65%,第二个因子的特征值为1.715,解释了5个原始变量总方差的34.302%,累积方差贡献率为87.952%,也就是两个因子解释了所有变量的87.952%

20、。 从表中可以看出,有两个因子被提取和旋转,其累积解释总方差的百分比和初始解的前两个变量相同,但经过旋转后的因子重新分配了各个因子解释原始变量的方差,使得因子方差更接近,也更易于解释。,4、成分矩阵和旋转后成分矩阵,成分矩阵给出了每一个变量在因子上载荷。从表中可以看出,除第4个变量外,所有变量在第一个因子上的载荷都比较高,即与第一个因子的相关度较高,第一个因子解释了大部分变量的信息。第二个因子与原始变量的相关程度相对小,对原始变量解释效果不太明显。,旋转成分矩阵给出了每一个变量在因子上载荷。从表中可以看出,因子1可以替代X1、X3的作用,因子2替代X2、X4、X5的作用。将因子1命名为物力指标

21、,因子2命名为人力及财力指标。,5、旋转空间中的成分图,旋转后的载荷矩阵图可以看作是旋转后的载荷矩阵的图形的表示。,第4题,朗莱曾分析美国联邦政府雇员人数(Y)与国民总产出隐含平减指数(X1),国民总产出(X2),失业人数(X3),武装力量人数(X4),14岁及以上非慈善机构人口数(X5),时间变量(X6)等的关系,数据如下。试利用探索性因子分析方法分析可能存在的公共因子并命名。,输入数据,选择分析降维因子分析,选入变量,检验是否适合进行因子分析,上述结果表明了原始变量间有较强的相关性,因而进行因子分析是合适的。,因子分析:,因子矩阵,主成分分析方法得到两个因子。因子的载荷如表中所示,共同度,

22、左表是反应因子的共同度,因子共同度反应公共因子对变量方差的贡献,对公共因子还是特殊因子的依赖性大。可以看出除X6对特殊因子依赖性较大外,其余因子都对公共因子依赖性较大。,方差贡献表,旋转因子矩阵表,从上面结果看出,只有前两个因子特征值大于1,选取两个主要因子,累积贡献率达82.047%,左表为旋转后的因子载荷矩阵,可以看出经过旋转后的相关系数已经发生了变化。因子1可以替代国民总产出隐含平减指数(x1)、国民总产出(x2)、14岁以上及非慈善机构人口数(x5)的作用,因子2替代失业人数(x3)、武装力量人数(x4)和时间变量(x6)的作用。将因子1命名为国民产出,因子2命名为非劳动人口及时间。,

23、第5题,影响电的需求量的指标有: (1)钢的产量x1; (2)生铁产量x2; (3)钢材产量x3; (4)有色金属产量x4; (5)原煤产量x5; (6)水泥产量x6; (7)机械工业总产值x7; (8)化肥产量x8; (9)硫酸产量x9; (10)烧碱产量x10; (11)棉纱产量x11 共11个指标。收集了23年的指标值如下,试利用探索性因子分析方法分析可能存在的公共因子并命名。,检验是否适合做因子分析:,上述结果表明了原始变量间有较强的相关性,因而进行因子分析是合适的。,因子分析:,共同度,方差贡献表,上表是反应因子的共同度,可以看出所有变量都对公共因子依赖性较大。,从上面结果看出,只有第一个因子特征值大于1,选取该主要因子,累积贡献率达89.721%,用主成分分析法得到一个因子,因子载荷如表中所示。,因子矩阵:,由于只得到一个因子,所以无法进行因子旋转,该因子较好地替代了所有变量的作用,可将该因子命名为工业原材料产量因子。,谢谢聆听!,THANK YOU VERY MUCH!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1