数理统计大作业Word版.doc

上传人:doc321 文档编号:14395731 上传时间:2022-02-05 格式:DOC 页数:16 大小:291.50KB
返回 下载 相关 举报
数理统计大作业Word版.doc_第1页
第1页 / 共16页
数理统计大作业Word版.doc_第2页
第2页 / 共16页
数理统计大作业Word版.doc_第3页
第3页 / 共16页
数理统计大作业Word版.doc_第4页
第4页 / 共16页
数理统计大作业Word版.doc_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《数理统计大作业Word版.doc》由会员分享,可在线阅读,更多相关《数理统计大作业Word版.doc(16页珍藏版)》请在三一文库上搜索。

1、 应用数理统计(论文)国家财政收入的逐步回归分析指导教师 院系名称 学 号 学生姓名 2012年11月18日摘要 财政收入是国民经济基础,是实现国家职能的财力保证。本文采用SPSS统计软件中的逐步回归分析方法,得出影响我国财政收入的显著性变量,建立国家财政收入回归模型,并将所得的模型给予合理的经济解释。关键字:国家财政收入,逐步回归,SPSS1 引言 财政收入是指国家财政参与社会产品分配所取得到的收入,是实现国家职能的财力保证。影响财政收入的因素有很多,包括工业总产值、农业总产值、建筑业总产值、社会商品零售总额、人口数、受灾面积等等。 在经济模型的建立中,其中有些自变量对问题的研究可能并不重要

2、,有些自变量数据的质量可能很差,有些变量可能和其它变量有很大程度的重叠。如果用回归模型把这些变量都包含进来不但会使模型计算复杂,而且往往会扩大估计方差,降低模型精度,直接影响到回归方程的应用。另外,选进太多的自变量又会造成共线性的存在。因此,本文采用线性回归中的逐步回归方法,利用SPSS多元统计软件得出影响我国财政收入的显著性变量,剔除了不显著的变量,并且克服了变量间的多重共线性,得出了一个较合理的财政回归模型。2初始模型的建立及数据分析2.1 自变量与因变量的提出 本模型是研究1997年至2011年国家财政收入与主要影响因素之间的定量关系。 本文选取财政收入Y(亿元)为因变量,自变量选取如下

3、:第一产业国内生产总值X1(亿元),第二产业国内生产总值X2(亿元,第三产业国内生产总值X3(亿元),社会消费品零售总额X4(亿元),人口数X5(万人),受灾面积X6(万公顷)。根据中国统计年鉴获取1997-2011年共十五年的统计数据,见表1。表1 1997-2011年财政收入与部分项目的统计数据年份YX1X2X3X4X5X6财政收入(亿元)第一产业国内生产总值(亿元)第二产业国内生产总值(亿元)第三产业国内生产总值(亿元)社会商品零售总额(亿元)人口总数(万人)受灾面积(万公顷)1997 8651.14 14441.89 37543.00 26988.15 31252.90 123626.

4、00 5342.70 1998 9875.95 14817.63 39004.19 30580.47 33378.10 124761.00 5014.50 1999 11444.08 14770.03 41033.58 33873.44 35647.90 125786.00 4998.00 2000 13395.23 14944.72 45555.88 38713.95 39105.70 126743.00 5468.80 2001 16386.04 15781.27 49512.29 44361.61 43055.40 127627.00 5221.50 2002 18903.64 1653

5、7.02 53896.77 49898.90 48135.90 128453.00 4694.60 2003 21715.25 17381.72 62436.31 56004.73 52516.30 129227.00 5450.60 2004 26396.47 21412.73 73904.31 64561.29 59501.00 129988.00 3710.60 2005 31649.29 22420.00 87598.09 74919.28 67176.60 130756.00 3881.80 2006 38760.20 24040.00 103719.54 88554.88 7641

6、0.00 131448.00 4109.10 2007 51321.78 28627.00 125831.36 111351.95 89210.00 132129.00 4899.20 2008 61330.35 33702.00 149003.44 131339.99 114830.10 132802.00 3999.00 2009 68518.30 35226.00 157638.78 148038.04 132678.40 133450.00 4721.40 2010 83101.51 40533.60 187383.21 173595.98 156998.40 134091.00 37

7、42.60 2011 103874.43 47486.20 220412.80 204982.50 183918.60 134735.00 3247.10 2.2 做散点图,设定理论模型 作数据散点图,并进行线性拟合,观察因变量与自变量之间关系是否有线性特点。散点图和线性拟合结果如图1所示。图1因变量与各自变量的散点图从散点图1中可以初步看出,国家财政收入与第一、二、三产业国内生产总值、人口数、消费品零售总额这些因素都有较好的线性关系。而财政收入与受灾面积之间没有线性关系,可在逐步回归之前将其去除。建立线性回归分析模型如下:Y=a+b1X1+b2X2+b3X3+b4X4+b5X5;其中a为常数

8、项,b1、b2、b5为偏回归系数。3 逐步回归分析概述3.1 回归分析回归分析是一种非常实用的统计方法,研究变量与变量之间定量的相关关系,寻找变量之间的数学表达式,并且利用概率统计的知识,对此关系进行分析,来判别所建立关系表达式的有效性。回归分析应用很广,可利用建立的经验公式进行预测或控制等等。 3.2 线性回归分析线性回归分析是描述一个因变量与一个或多个自变量之间的线性依存关系。 3.3 多元回归分析方法比较与选择应用多元线性回归方法对社会经济现象的数据进行统计分析或者预测具有实际的研究价值。但是由于各个变量之间关系的复杂性,如何在为数众多的许多个影响因素中选择对所关心的因素具有显著影响的各

9、个因素,并且不包含对因变量的影响不显著的因素是一个很有实际意义的问题。具有这种优点的回归方程,被称为“最优”回归方程。 选择“最优”回归方程的方法有多种多样,具体包括: (1) 全部比较法:从所有可能的因子组合的回归方程中选择最优方程。这种方法固然可以找到一个最优者,然而当因子众多时,不仅计算繁冗,而且费用也大,在实际中是不宜采用的。 (2) 向后剔除变量法(Backward Elimination):从包含全部因子的回归方程中,逐次剔除不显著因子,也称为“只出不进法”。这种方法在因子不多而且不显著因子也不多的情况下可以采用,但是因子众多时,特别是当不显著因子比较多时,其计算量也很大。 (3)

10、 向前挑选变量法(Forward Selection):从一个因子开始,逐个引入回归方程,因子在引入后概不剔除,也称为“只进不出法”。这种方法对已经引进的因子在建立过程中变得不很重要的情况没有反映。 (4) 逐步回归法(Stepwise Regression):又称为“有进有出法”。这种方法在逐个将因子选入回归方程的过程中,如果发现先前被引入的因子在其后由于某些因子的引入而失去其重要性时,可以从回归方程中随时予以剔除,直到最后被选入的因子对因变量都有显著影响为止。 3.4 逐步回归分析法先对全部自变量按其对Y影响程度的大小排队,从大到小逐个依次引入回归方程,并随时检验,及时将由于引入新自变量而

11、变得作用不显著者剔除,剔除后再引入新变量,再检验,再剔除直至最后。4 线性回归的结果及分析以国家财政收入为因变量,以第一、二、三产业国内生产总值、人口数、消费品零售总额为自变量,运用SPSS软件进行逐步回归法(stepwise)线性回归分析。将数据导入SPSS软件的Data Editor表中,选择分析选项中的回归-线性命令,将国民总收入设置为因变量(Dependent),其余各影响因素设置为自变量(Independent(s),选择统计方法(Method)为逐步回归法(Stepwise)。4.1 自变量的输入与移除自变量的输入与移除的标准为:F值小于等于0.05进入模型,大于等于0.1移出模型

12、。从表2中可以看出第三产业国内生产总值(亿元),人口数(万人),这两个自变量经过逐步回归过程被选择进入了回归方程。选择的过程是:最先引入了变量X3,建立了模型1;接着引入变量X5,没有变量被剔除,建立了模型2(含有X3,X5);没有新变量被引入,故最终的模型中含有变量X3,X5。表2 输入移去的变量a模型输入的变量移去的变量方法1第三产业国内生产总值(亿元).步进(准则: F-to-enter 的概率 = .100)。2人口总数(万人).步进(准则: F-to-enter 的概率 = .100)。a. 因变量: 财政收入(亿元)4.2模型概要 表3 模型汇总c模型RR 方调整 R 方标准 估计

13、的误差更改统计量R 方更改F 更改df1df2Sig. F 更改1.999a.998.9981302.682.9987212.060113.00021.000b.999.999998.767.00110.115112.008a. 预测变量: (常量), 第三产业国内生产总值(亿元)。b. 预测变量: (常量), 第三产业国内生产总值(亿元), 人口总数(万人)。c. 因变量: 财政收入(亿元)表3给出了各模型的拟合情况。其中,复相关系数(R)代表自变量或自变量的线性组合能多大程度上解释因变量,复相关系数平方值(R方)说明回归模型自变量的变异在因变量中所占比率,接近1最好。修正的复相关系数平方值

14、(调整R方),是为了消除变量数量的影响,给出修正的复相关系数平方值。从表中看出两种模型的拟合度都很好,而模型2的复相关系数R=1.000,复相关系数平方值R2=0.999,调整R方为0.999,标准估计的误差为998.767。可见模型2的拟合度较高,变量X3,X5的作用显著。4.3 回归方程的显著性检验表4 Anovac模型平方和df均方FSig.1回归1.224E1011.224E107212.060.000a残差22060733.806131696979.524总计1.226E10142回归1.225E1026.124E96139.533.000b残差11970430.4551299753

15、5.871总计1.226E1014a. 预测变量: (常量), 第三产业国内生产总值(亿元)。b. 预测变量: (常量), 第三产业国内生产总值(亿元), 人口总数(万人)。c. 因变量: 财政收入(亿元)表4显示两种模型的方差分析结果。方差分析结果表明,当回归方程为模型1、2时,其显著性概率值均小于0.000,即拒绝总体回归系数均为0的原假设。因此,最终的回归方程应当包含X3、X5这2个自变量,且方程拟和效果很好。表5 已排除的变量c模型Beta IntSig.偏相关共线性统计量容差VIF最小容差1第一产业国内生产总值(亿元).281a2.125.055.523.006160.446.006

16、第二产业国内生产总值(亿元).083a.348.734.100.003382.969.003社会商品零售总额(亿元).178a1.191.257.325.006167.086.006人口总数(万人)-.073a-3.180.008-.676.1546.510.1542第一产业国内生产总值(亿元).128b.955.360.277.005218.259.004第二产业国内生产总值(亿元).105b.577.576.171.003383.541.003社会商品零售总额(亿元)-.101b-.650.529-.192.004283.927.003表5 已排除的变量c模型Beta IntSig.偏相关

17、共线性统计量容差VIF最小容差1第一产业国内生产总值(亿元).281a2.125.055.523.006160.446.006第二产业国内生产总值(亿元).083a.348.734.100.003382.969.003社会商品零售总额(亿元).178a1.191.257.325.006167.086.006人口总数(万人)-.073a-3.180.008-.676.1546.510.1542第一产业国内生产总值(亿元).128b.955.360.277.005218.259.004第二产业国内生产总值(亿元).105b.577.576.171.003383.541.003社会商品零售总额(亿元

18、)-.101b-.650.529-.192.004283.927.003a. 模型中的预测变量: (常量), 第三产业国内生产总值(亿元)。b. 模型中的预测变量: (常量), 第三产业国内生产总值(亿元), 人口总数(万人)。c. 因变量: 财政收入(亿元)表5显示方程外各模型变量的有关统计量,即标准化偏回归系数Beta、回归系数显著性检验的t值、P(Sig)值、偏相关系数Partial Correlation、共线性统计的容差Co linearity statistic Tolerance。可见,模型2方程外的各变量偏回归系数经检验,P值均大于0.05,故不能引入方程。4.4 回归系数的确

19、定 表6 系数a模型非标准化系数标准系数tSig.相关性共线性统计量B标准 误差试用版零阶偏部分容差VIF1(常量)-7035.493624.880-11.259.000第三产业国内生产总值(亿元).525.006.99984.924.000.999.999.9991.0001.0002(常量)70605.58724416.7212.892.014表6 系数a模型非标准化系数标准系数tSig.相关性共线性统计量B标准 误差试用版零阶偏部分容差VIF1(常量)-7035.493624.880-11.259.000第三产业国内生产总值(亿元).525.006.99984.924.000.999.9

20、99.9991.0001.0002(常量)70605.58724416.7212.892.014第三产业国内生产总值(亿元).560.0121.06646.337.000.999.997.418.1546.510人口总数(万人)-.622.196-.073-3.180.008.908-.676-.029.1546.510第三产业国内生产总值(亿元).560.0121.06646.337.000.999.997.418.1546.510人口总数(万人)-.622.196-.073-3.180.008.908-.676-.029.1546.510a. 因变量: 财政收入(亿元)表6显示各模型的偏回

21、归系数B、标准差Std.、常数Constant、标准化偏回归系数Beta、回归系数显著性检验的t值和P(Sig)值。按照线性回归模型建立的方程为:Y=70605.587+0.560X3-0.662X5 方程中的常数项a=70605.587,偏回归系数b3=0.560、b5=-0.662,经t检验a、b3、b5的P值分别为0.014、0.000、0.008,按=0.10水平,均有显著性意义。4.5 回归模型的残差分析对回归模型的残差进行分析,残差的积累概率图(P-P图)(图2)基本围绕在假设直线(正态分布)周围,说明残差分布基本符合正态分布,说明财政收入这个因变量基本上可以用线性回归方法建立模型

22、。且回归标准化残差的柱状图(图3)中,标准化残差基本都分布在(-3,3)之间,没有超过默认值3,说明模型对数据的拟合效果较好。图2 回归标准化残差的标准P-P图 图3 回归标准化残差柱状图5讨论5.1 模型检验按照线性回归模型建立的方程为: Y=70605.587+0.560X3-0.662X5 利用此最优回归方程对2010年国民总收入进行预测并和实际值做比较。表7 2010年财政收入预测 年份X3第三产业国内生产总值(亿元)X5人口总数(万人)Y财政收入实际值(亿元)Y 财政收入预测值(亿元)偏差2010173595.98134091.0083101.5179051.094.8%表7给出了运

23、用已经建立的逐步回归模型对2010年财政收入的预测结果以及实际财政收入值。通过对比我们可以发现,预测的结果与实际情况比较接近,但还是存在一定的偏差,这可能是我们对财政收入的影响因素考虑过少造成的,因此,这是我们以后对模型改进时所要考虑的方面。5.2 模型解释从回归模型中看出,第三产业对财政收入的影响较为显著。这正与国家积极调整产业结构,倡导服务业全面发展的经济政策相符合。第三产业发展迅速,增加了国家收入弹性,特别是金融、期货交易、房地产业、仓储物流业、软件等现代服务业和高薪产业的发展及近年来奥运会、亚运会、世博会对旅游业的带动,极大提高了服务业对财政收入的贡献。而人口数对财政收入的贡献为负线性

24、关系。这与近年来我国人口老龄化趋势,人口基数仍在上涨及社会福利提高有关。众所周知,人口基数不变或稍微增大时,人口老龄化,必然导致就业人口相对比例减少,再加上近年来医保、社保等社会保障及福利支出的相对提高,使国家政府给予大量财政补贴,因而人口数对财政收入的贡献为负相关。而第一产业和第二产业均被剔除回归模型,这可能与近几年我国的惠农政策及经济转型政策有关。在第一产业(农业)方面,近几年为了实现小康型社会主义和建设社会主义新农村,国家政府坚持把支持“三农”作为预算安排和财政工作的重点,巩固、完善和强化了各项强农惠农财税政策,突出加强农业基础,促进农业发展和农民增收,扎实推进社会主义新农村建设。实现传

25、统农业的全面升级,从而保证了农业经济的持续稳定发展。这样作为曾经的农业大国,惠农政策的财政补贴与其产业带来的财政贡献抵消,因而第一产业总产值X对财政收入y的影响不显著。再看第二产业(工业和建筑业),对财政收入也不显著。近几年奥运会、亚运会、世博会使国家投入不少成本,加上钢铁等传统行业的产能过剩使国家补贴外销,以及建设高新技术产业,投入大量研发生产成本而至今仍未盈利或盈利较少等等原因均使原本作为财政收入支撑的第二产业对财政收入的贡献很不显著。总之,我们应该看到我国产业结构的不合理及发展方向:第二产业的支撑地位不够,第三产业发展仍有余地。因此,要提高财政收入水平,必须首先调整经济结构。通过优化第一产业,提高第二产业,壮大第三产业,努力形成以高新技术产业为先导、基础产业和制造业为支撑、服务业全面发展的产业格局。6 参考文献1 孙海燕,周梦,李卫国,冯伟. 应用数理统计. 北京:北京航空航天大学出版社,2012 .2 中华人民共和国国家统计局. 中国统计年鉴2012M. 北京:中国统计出版社,2012.3 蒋昭侠.产业结构问题研究.中国经济出版社,2005. 4 阮桂海. SPSS实用教程. 北京:电子工业出版社,2000 .5 彭志刚等,财政收入的逐步回归分析J.乌鲁木齐职业大学学报,2004. (注:可编辑下载,若有不当之处,请指正,谢谢!)

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1