sas数据分析报告(回归分析和主成分分析与因子分析).doc

上传人:rrsccc 文档编号:9271651 上传时间:2021-02-13 格式:DOC 页数:22 大小:55.50KB
返回 下载 相关 举报
sas数据分析报告(回归分析和主成分分析与因子分析).doc_第1页
第1页 / 共22页
sas数据分析报告(回归分析和主成分分析与因子分析).doc_第2页
第2页 / 共22页
sas数据分析报告(回归分析和主成分分析与因子分析).doc_第3页
第3页 / 共22页
sas数据分析报告(回归分析和主成分分析与因子分析).doc_第4页
第4页 / 共22页
sas数据分析报告(回归分析和主成分分析与因子分析).doc_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《sas数据分析报告(回归分析和主成分分析与因子分析).doc》由会员分享,可在线阅读,更多相关《sas数据分析报告(回归分析和主成分分析与因子分析).doc(22页珍藏版)》请在三一文库上搜索。

1、sas数据分析报告(回归分析和主成分分析与因子分析)sas主成分分析第七章 主成分分析实验目的:熟悉并掌握主成分分析和因子分析的原理和在变量分类、综合评价、主成分回归等几个方面的应用,以及相应的SAS程序实现。 实验内容:对我国钢铁行业上市公司的财务绩效状况进行主成分分析,选择的财务指标共有以下几个:流动比率,速动比率,存货周转率,总资产周转率,净资产收益率,经营净利率,每股收益,净资产收益率增长率,股东权益增长率。数据如下:完成以下工作:(1) 选取累积贡献率85%的前几个主成分,分别计算得分;并对选取的主成分进行解释;(2) 对各上市公司的财务绩效进行综合评价;(3) 利用选取的主成分得分

2、,借助聚类分析过程对钢铁行业上市公司进行分类。data zcf;input name$ x1-x9;cards;邯郸钢铁 1.551 0.971 7.165 0.8891(来自:WwW.xIelW.cOm 写 论文 网:sas数据分析报告(回归分析和主成分分析与因子分析)0.7689.268 0.451 -16.0246.122武钢股份 2.192 1.82 8.088 0.975 15.054 11.114 0.336 -3.0392.588钢联股份 1.286 0.941 8.044 1.124 7.389 4.599 0.205 -59.988122.041宝钢股份 0.979 0.57

3、1 8.13 0.601 9.742 8.78 0.205-17.6853.989莱钢股份 1.364 0.497 5.078 0.93 14.103 9.1370.523-24.26114.16西宁特钢 1.433 0.672 1.462 0.471 6.4297.2680.1559.3493.027杭钢股份 2.108 1.498 8.373 1.418 16.756 7.937 0.531 -18.72513.662邢台轧辊 2.1 1.595 1.883 0.396 6.484 8.981 0.1325.275-1.061宁夏恒力 1.3641.064 1.868 0.278 7.46

4、9 19.842 0.201 -35.19455.428凌钢股份 1.772 1.061 7.8411.119 12.883 8.804 0.5285.34310.107南钢股份 1.818 1.392 8.866 1.54612.885 5.153 0.409-7.0286.131酒钢宏兴 1.441 0.884 10.168 1.071 12.831 7.825 0.36744.0376.686抚顺特钢 0.955 0.652 3.416 0.509 7.147 6.8510.193-8.0741.93安阳钢铁 1.893 1.333 5.1070.9810.9497.9150.3500上

5、海科技 1.313 1.182 4.643 0.568 9.549 9.4230.19935.6353.582沪昌特钢 10.813 9.53 6.585 0.567 1.103 1.656 0.01915.031-7.171山川股份 1.252 0.585 1.485 0.451 10.344 14.693 0.209-1.6159.799浦东不锈 6.186 5.121 2.363 0.265 0.754 2.513 0.013-45.439-1.176新华股份 1.817 1.314 3.291 0.746 9.924 9.028 0.137-3.5771.985工益股份 1.809 1

6、.267 4.046 0.828 0.695 0.45 0.011 104.419-4.714马钢股份 1.584 1.069 4.318 0.569 2.003 2.183 0.032 35.279 -12.487宝信软件 3.594 3.201 5.014 0.821 14.66 9.721 0.147 126.911 23.243北特钢 1.385 1.092 2.691 0.467 -11.21 -7.917 -0.148 53.839 -11.058广钢股份 0.859 0.51 3.884 0.722 4.247 2.685 0.096 -32.409 -4.004;proc pr

7、incomp n=9 out=prin ;var X1-x9 ;run;proc print data=prin;var prin1-prin9;run;主要输出结果:相关阵的特征值和特征向量Eigenvalue Difference Proportion Cumulative1 3.62673045 1.71087724 0.4030 0.40302 1.91585321 0.51933718 0.2129 0.61583 1.39651602 0.34900854 0.1552 0.77104 1.04750748 0.37104774 0.1164 0.88745 0.67645974

8、0.47891329 0.0752 0.96266 0.19754644 0.10650119 0.0219 0.98457 0.09104526 0.04487848 0.0101 0.99468 0.04616677 0.04399214 0.0051 0.99989 0.00217463 0.0002 1.0000EigenvectorsPrin1 Prin2 Prin3 Prin4 Prin5 Prin6 Prin7 Prin8 Prin9x1 -.263257 0.552819 0.325172 0.099932 0.012334 0.129289 0.077190 -.021550

9、 0.697189x2 -.269673 0.551229 0.317649 0.090993 0.060093 0.065411 -.019668 0.049407 -.709595x3 0.320743 0.454750 -.227474 -.195841 0.013020 -.772900 0.038270 0.008686 0.033825x4 0.379033 0.331485 -.342911 -.184084 0.014402 0.490904 -.323121 0.498672 0.026498x5 0.460853 0.105228 0.123536 0.367092 0.0

10、90387 0.094185 -.486791 -.610331 -.003691x6 0.308953 -.191838 0.476228 0.450529 0.202663 -.228562 -.028587 0.584869 0.042126x7 0.480226 0.125512 0.021910 0.155827 -.245428 0.255863 0.762567 -.122168 -.082054x8 -.169384 0.077314 -.510664 0.444014 0.675965 0.035311 0.220767 -.021431 0.005659x9 0.21044

11、0 -.065201 0.347445 -.591886 0.655328 0.113230 0.140544 -.135595 0.001607由输出特征值可知,第一主成分的贡献率为40.30%,第二个主成分的贡献率为61.58%,第三个主成分的贡献率为77.10%,前四个主成分累计贡献率为88.74%。因此只需前三个主成分就更很好的概括这组数据。且第一主成分,第二主成分,第三主成分,第四主成分为:Z1=-0.263257x1-0.269673x2+0.320743x3+0.379033x4+0.460853x5+0.308953x6+0.480226x7-0.169384x8+0.2104

12、40x9,Z2=0.552819x1+0.551229x2+454750x3+331485x4+0.105228x5-0.191838x6+0.125512x7+0.077314x8-0.065201x9,Z3=0.325172x1+0.317649x2-0.227474x3-0.342911x4+0.123536x5+0.476228x6+0.021910x7-0.510664x8+0.347445x9,Z4=0.099932x1+0.090993x2-0.195841x3-0.184084x4+0.367092x5+0.450529x6+0.155827x7+0.444014x8-0.59

13、1886x9,data pingjia;set prin;y=0.4030*prin1+0.2129*prin2+0.1552*prin3+0.1164*prin4+0.0752*prin5+0.0219*prin6+0.0101*prin7+0.0051*prin8+0.0002*prin9;run;proc sort data=pingjia;by y;run;proc print; var name y x1-x9;Title上市公司经济效益综合评价;run;上市公司经济效益综合评价Obsname yx1 x2 x3 x4 x5x6x7x8 x91 北特钢-2.38947 1.385 1

14、.092 2.691 0.467 -11.210 -7.917 -0.14853.839 -11.0582 工益股份 -1.04671 1.809 1.267 4.046 0.8280.6950.450 0.011 104.419-4.7143 马钢股份 -1.00209 1.584 1.069 4.318 0.5692.0032.183 0.03235.279 -12.4874 浦东不锈 -0.90647 6.186 5.121 2.363 0.2650.7542.513 0.013 -45.439-1.1765 广钢股份 -0.72740 0.859 0.510 3.884 0.7224.

15、2472.685 0.096 -32.409-4.0046 西宁特钢 -0.59066 1.433 0.672 1.462 0.4716.4297.268 0.155 9.349 3.0277 邢台轧辊 -0.51112 2.100 1.595 1.883 0.3966.4848.981 0.132 5.275-1.0618 抚顺特钢 -0.40960 0.955 0.652 3.416 0.5097.1476.851 0.193-8.074 1.9309 沪昌特钢 -0.25438 10.813 9.530 6.585 0.5671.1031.656 0.01915.031-7.171 10

16、 新华股份 -0.11020 1.817 1.314 3.291 0.7469.9249.028 0.137-3.577 1.985 11 上海科技 -0.07628 1.313 1.182 4.643 0.5689.5499.423 0.19935.635 3.582 12 山川股份 -0.02253 1.252 0.585 1.485 0.451 10.344 14.693 0.209-1.615 9.799 13 宝钢股份 0.12676 0.979 0.571 8.130 0.6019.7428.780 0.205 -17.685 3.989 14 宁夏恒力 0.22215 1.364

17、 1.064 1.868 0.2787.469 19.842 0.201 -35.19455.428 15 安阳钢铁 0.37215 1.893 1.333 5.107 0.980 10.9497.915 0.350 0.000 0.000 16 宝信软件 0.41768 3.594 3.201 5.014 0.821 14.6609.721 0.147 126.91123.243 17 钢联股份 0.60934 1.286 0.941 8.044 1.1247.3894.599 0.205 -59.988 122.041 18 邯郸钢铁 0.63486 1.551 0.971 7.165 0

18、.889 10.7689.268 0.451 -16.024 6.122 19 酒钢宏兴 0.77353 1.441 0.884 10.168 1.071 12.8317.825 0.36744.037 6.686 20 莱钢股份 0.77883 1.364 0.497 5.078 0.930 14.1039.137 0.523 -24.26114.160 21 武钢股份 0.87849 2.192 1.820 8.088 0.975 15.054 11.114 0.336-3.039 2.588 22 南钢股份 0.92856 1.818 1.392 8.866 1.546 12.8855.

19、153 0.409-7.028 6.131 23 凌钢股份 0.96954 1.772 1.061 7.841 1.119 12.8838.804 0.528 5.34310.107 24 杭钢股份 1.33502 2.108 1.498 8.373 1.418 16.7567.937 0.531 -18.72513.662proc cluster data=pingjia method=ave std pseudo rsqouttree=opingjia;var x1-x9; id name;run;RMS iNCL -Clusters Joined-FREQ SPRSQ RSQ PSF P

20、ST2Dist e23 西宁特钢 邢台轧辊2 0.0013 .999 34.2. 0.174722 CL23 抚顺特钢3 0.0031 .996 21.4 2.3 0.247121 邯郸钢铁 凌钢股份2 0.0027 .993 21.0. 0.247920 杭钢股份 南钢股份2 0.0035 .989 19.6. 0.284819 上海科技 新华股份2 0.0037 .986 19.1. 0.292918 CL21 莱钢股份3 0.0045 .981 18.4 1.7 0.303917 CL22 CL19 5 0.0070 .974 16.5 2.6 0.325416 CL18 安阳钢铁4 0

21、.0053 .969 16.6 1.5 0.329115 CL16 武钢股份5 0.0064 .962 16.5 1.6 0.357814 CL17 山川股份6 0.0090 .953 15.7 2.4 0.399713 马钢股份 广钢股份2 0.0078 .946 15.9. 0.423412 CL15 酒钢宏兴6 0.0141 .931 14.8 3.0 0.488411 CL12 CL20 8 0.0210 .910 13.2 3.5 0.494610 CL14 CL13 8 0.0245 .886 12.1 4.6 0.52839 宝钢股份 CL10 9 0.0190 .867 12.

22、2 2.4 0.5728 工益股份 北特钢 2 0.0236 .843 12.3. 0.73737 CL11 CL9 17 0.1736 .670 5.7 19.6 0.80666 沪昌特钢 浦东不锈2 0.0368 .633 6.2. 0.91995 CL7宝信软件 18 0.0568 .576 6.5 3.0 0.94814 CL5宁夏恒力 19 0.0644 .512 7.0 3.0 1.00673 CL4CL8 21 0.1682 .344 5.5 7.1 1.20992 CL3钢联股份 22 0.1083 .235 6.8 3.5 1.2821 CL2CL6 24 0.2353 .0

23、00.6.8 1.438由RSQ准则支持分为三类或四类;SPRSQ准则支持分为二类,三类或四类;上,分为三类。proc tree data=opingjia horizontal graphics n=3 out=avepingjia;title 使用类平均法的谱系聚类图;run;title 使用类平均法;proc sort data=avepingjia;by cluster;run;proc print data=avepingjia;run;PSF支持分为三类;PST2支持分为两类或三类。综篇二:主成分分析、因子分析实验报告 SPSS一、实验目的及要求:1、目的用SPSS软件实现主成分分

24、析、因子分析及其应用。 2、内容及要求用SPSS对2009年我国88个房地产上市公司做因子分析,并做出相关解释。二、仪器用具:三、实验方法与步骤:准备工作:把实验所用数据从Word文档复制到Excel,并进一步导入到SPSS数据文件中,以备后续分析。四、实验结果与数据处理:在因子分析的SPSS操作中所用到的部分选项的设置如下面四个图所示,其余为软件默认的选项,因此不再列示,具体的分析如这些表之后所示。图一 图二图三图四分析结果:由表1可知,巴特利特球度检验统计量的观测值为398.287,相应的概率p值接近0,小于显著性水平?(取0.05),所以应拒绝原假设,认为相关系数矩阵与单位矩阵有显著差异

25、。同时,KMO值为0.637,根据Kaiser给出的KMO度量标准(0.9以上表示非常适合;0.8表示适合;0.7表示一般;0.6表示不太适合;0.5以下表示极不适合)可知原有变量不算特别适合进行因子分析。表2为公因子方差,即因子分析的初始解,显示了所有变量的共同度数据。第一列是因子分析初始解下的变量共同度,它表明,对原有10个变量如果采用主成分分析方法提取所有特征根(10个),那么原有变量的所有方差都可被解释,变量的共同度均为1(原有变量标准化后的方差为1)。事实上,因子个数小于原有变量的个数才是因子分析的目标,所以不可提取全部特征根;第二列是在按指定提取条件(这里为特征根大于1)提取特征根

26、时的共同度。可以看到,总资产报酬率、成交量、流通市值、总市值的绝大部分信息可被因子解释,这些变量的信息丢失较少。但毛利率这一变量的信息丢失相当严重(近70%),净资产收益率、应收应付比率两个变量的信息丢失较为严重(近40%)。因此本次因子提取的总体效果并不理想。表3展示了特征根及累积贡献率情况,按照特征根大于1的原则,选入了4个公共因子,其累积方差贡献率为72.343%,同时也可以看出,因子旋转后,累计方差比并没有改变,也就是没有影响原有变量的共同度,但却重新分配了各个因子解释原有变量的方差,改变了各因子的方差贡献,使各因子更易于解释。图五为因子的碎石图,需要说明的是这里累积方差贡献率并不高,

27、远没有达到85%,但是根据碎石图我们可以看出在这里选四个因子还是比较合适的。图五表4成份矩阵也即是因子载荷矩阵,根据该表可以写出因子分析模型:流通市值=0.934f1?0.253f2?0.125f3?0.067f4 总市值=0.926f1?0.257f2?0.064f3?0.013f4成交量(手)=0.849f1?0.357f2?0.065f3?0.082f4总资产报酬率=0.322f1?0.791f2?0.295f3?0.073f4 净资产收益率=0.269f1?0.669f2?0.125f3?0.271f4 市盈率=?0.333f1?0.582f2?0.418f3?0.286f4毛利率=0

28、.202f1?0.418f2?0.222f3?0.122f4 营业利润占比=0.198f1?0.155f2?0.776f3?0.341f4 应收应付比=?0.231f1?0.190f2?0.019f3?0.687f4 资产现金率=0.195f1?0.052f2?0.544f3?0.627f4采用最大方差法对成份矩阵(因子载荷矩阵)实施正交旋转以使因子具有命名解释性。指定按第一因子载荷降序的顺序输出旋转后的因子载荷矩阵如表5所示:篇三:主成分分析与因子分析的区别主成分分析和因子分析十大不同发表于 2013-06-28 13:22 来源:数据挖掘工人主成分分析和因子分析无论从算法上还是应用上都有着

29、比较相似之处,本文结合以往资料以及自己的理解总结了以下十大不同之处,适合初学者学习之用。1.原理不同主成分分析基本原理:利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个不相关的综合指标(主成分),即每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能(主成分必须保留原始变量90%以上的信息),从而达到简化系统结构,抓住问题实质的目的。因子分析基本原理:利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量表示成少数的公共因子和仅对某一个变量有作用的特殊因子线性组合而成。就是要从数据中提取对变量

30、起解释作用的少数公共因子(因子分析是主成分的推广,相对于主成分分析,更倾向于描述原始变量之间的相关关系)2.线性表示方向不同因子分析是把变量表示成各公因子的线性组合;而主成分分析中则是把主成分表示成各变量的线性组合。3.假设条件不同主成分分析:不需要有假设(assumptions),因子分析:需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specificfactor)之间也不相关,共同因子和特殊因子之间也不相关。4.求解方法不同求解主成分的方法:从协方差阵出发(协方差阵已知),从相关阵出发(相关阵R已知),采用的方法只有主成分法。(实际研究中,总体协方差阵与相关阵是未知的

31、,必须通过样本数据来估计)注意事项:由协方差阵出发与由相关阵出发求解主成分所得结果不一致时,要恰当的选取某一种方法;一般当变量单位相同或者变量在同一数量等级的情况下,可以直接采用协方差阵进行计算;对于度量单位不同的指标或是取值范围彼此差异非常大的指标,应考虑将数据标准化,再由协方差阵求主成分;实际应用中应该尽可能的避免标准化,因为在标准化的过程中会抹杀一部分原本刻画变量之间离散程度差异的信息。此外,最理想的情况是主成分分析前的变量之间相关性高,且变量之间不存在多重共线性问题(会出现最小特征根接近0的情况);求解因子载荷的方法:主成分法,主轴因子法,极大似然法,最小二乘法,a因子提取法。5.主成

32、分和因子的变化不同主成分分析:当给定的协方差矩阵或者相关矩阵的特征值唯一时,主成分一般是固定的独特的;因子分析:因子不是固定的,可以旋转得到不同的因子。6.因子数量与主成分的数量主成分分析:主成分的数量是一定的,一般有几个变量就有几个主成分(只是主成分所解释的信息量不等),实际应用时会根据碎石图提取前几个主要的主成分。因子分析:因子个数需要分析者指定(SPSS和sas根据一定的条件自动设定,只要是特征值大于1的因子主可进入分析),指定的因子数量不同而结果也不同;7.解释重点不同:主成分分析:重点在于解释个变量的总方差,因子分析:则把重点放在解释各变量之间的协方差。8.算法上的不同:主成分分析:

33、协方差矩阵的对角元素是变量的方差;因子分析:所采用的协方差矩阵的对角元素不在是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的部分)9.优点不同:因子分析:对于因子分析,可以使用旋转技术,使得因子更好的得到解释,因此在解释主成分方面因子分析更占优势;其次因子分析不是对原有变量的取舍,而是根据原始变量的信息进行重新组合,找出影响变量的共同因子,化简数据;主成分分析:第一:如果仅仅想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析,不过一般情况下也可以使用因子分析; 第二:通过计算综合主成分函数得分,对客观经济现象进行科学评

34、价;第三:它在应用上侧重于信息贡献影响力综合评价。第四:应用范围广,主成分分析不要求数据来自正态分布总体,其技术来源是矩阵运算的技术以及矩阵对角化和矩阵的谱分解技术,因而凡是涉及多维度问题,都可以应用主成分降维;10.应用场景不同:主成分分析:可以用于系统运营状态做出评估,一般是将多个指标综合成一个变量,即将多维问题降维至一维,这样才能方便排序评估;此外还可以应用于经济效益、经济发展水平、经济发展竞争力、生活水平、生活质量的评价研究上;主成分还可以用于和回归分析相结合,进行主成分回归分析,甚至可以利用主成分分析进行挑选变量,选择少数变量再进行进一步的研究。一般情况下主成分用于探索性分析,很少单独使用,用主成分来分析数据,可以让我们对数据有一个大致的了解。几个常用组合:主成分分析+判别分析,适用于变量多而记录数不多的情况;主成分分析+多元回归分析,主成分分析可以帮助判断是否存在共线性,并用于处理共线性问题;主成分分析+聚类分析,不过这种组合因子分析可以更好的发挥优势。因子分析:首先,因子分析+多元回归分析,可以利用因子分析解决共线性问题;其次,可以利用因子分析,寻找变量之间的潜在结构;再次,因子分析+聚类分析,可以通过因子分析寻找聚类变量,从而简化聚类变量; 此外,因子分析还可以用于内在结构证实

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1